课题基金基金详情
基于N-gram的多语言共存文本复制取证研究
结题报告
批准号:
61173142
项目类别:
面上项目
资助金额:
60.0 万元
负责人:
杨林聪
依托单位:
学科分类:
F0206.信息安全
结题年份:
2015
批准年份:
2011
项目状态:
已结题
项目参与者:
陈志杰、孙德才、付章杰、张伟、向凌云、杨滨、许仁昌、周丹、张茜
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
文本复制取证是为判断一个文本的内容是否抄袭、剽窃或复制于另外一个或多个文本提供证据,是打击抄袭、剽窃、盗版等侵权行为的有效手段,是数字取证的一个重要分支,是近年才发展起来的一个新兴的重要研究领域。基于内容的文本复制取证是文本复制取证的发展方向。本课题拟对多语言共存文本的复制取证中涉及到的文本指纹提取、文本指纹索引与压缩、复制取证策略等关键内容进行深入研究,力图减少多语言共存文本复制取证的存储开销、加快取证的速度、提高取证的精度。课题的主要研究内容包括:基于N-gram的文本指纹提取方法、N-gram项的指纹权重计算方法、基于N-gram的指纹索引与压缩方法、文本复制取证优化策略和文本复制取证原型系统的建立等。通过课题的研究,将在基于N-gram的文本指纹提取、适用于多语言共存文本的文本复制取证等方面完善自然语言文本复制取证的基本理论和方法,为推动自然语言文本取证的发展提供技术支撑。
英文摘要
文本复制取证是为判断一个文本的内容是否抄袭、剽窃或复制于另外一个或多个文本提供证据,是打击抄袭、剽窃、盗版等侵权行为的有效手段,是数字取证的一个重要分支,是近年才发展起来的一个新兴的重要研究领域。基于内容的文本复制取证是文本复制取证的发展方向。本课题对多语言共存文本的复制取证中涉及到的文本指纹提取、文本指纹索引与压缩、复制取证策略等关键内容进行了深入的研究。通过课题的研究,课题组成员提出了多种文本复制取证的方法与关键技术,发表了学术论文17篇,其中被SCI收录7篇、EI收录15篇,培养博士生5名,硕士生3名。
专著列表
科研奖励列表
会议论文列表
专利列表
国内基金
海外基金