课题基金基金详情
中文文本自动分类关键技术研究
结题报告
批准号:
60573187
项目类别:
面上项目
资助金额:
26.0 万元
负责人:
孙茂松
依托单位:
学科分类:
F0211.信息检索与社会计算
结题年份:
2008
批准年份:
2005
项目状态:
已结题
项目参与者:
李景阳、乔维、司宪策、张正操、谢永芳、孙帆、徐枢
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
文本自动分类在文本信息检索、Web搜索引擎、数字图书馆、知识管理、文本信息安全、个性化服务等现实应用中占有重要位置,前景十分广阔,因而成为当前自然语言处理与信息检索的研究前沿与热点之一。本项目将进行以下几方面的研究:一、以半自动的方式,建立一个世界上规模最大的文本分类用中文文本集(训练集和测试集)。二、在所建立的文本集上,对现有主流方法在训练集扩大1-2个数量级条件下的性质进行深入的实验研究。三、基本解决汉语自动分词在文本分类中的地位这一中文文本分类的最大困惑问题。四、对特征基本单元这一文本分类的最大困惑问题进行深入研究,探讨基于"适度理解"策略,即基于半结构化语言信息的方法在提高文本分类精确率上的效用。五、设计并实现一个中文文本分类系统,在本项目所建立的大规模中文文本集上的开放测试中,其F1值应达到90%以上,或者比通行的方法性能有显著提高。
英文摘要
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:--
期刊:刘知远 郑亚斌 孙茂松. 汉语依存句法网络的复杂网络性质. 复杂系统与复杂性科学:5(2), 2008
影响因子:--
作者:
通讯作者:
DOI:--
发表时间:--
期刊:乔维,孙茂松. 汉语交集型歧义切分字段关于专业领域的统计特性. 中文信息学报: 4(22), 2008. 10-18
影响因子:--
作者:
通讯作者:
DOI:--
发表时间:--
期刊:郑亚斌, 刘知远, 孙茂松. 中文歌词的统计特征及其检索应用. 中文信息学报, 21卷, 第5期. 2007.61-67
影响因子:--
作者:
通讯作者:
DOI:--
发表时间:--
期刊:刘知远,孙茂松. 汉语词同现网络的小世界效应和无标度特性. 中文信息学报:21(6), 2007.
影响因子:--
作者:
通讯作者:
DOI:10.1016/s1007-0214(09)70016-1
发表时间:2009-02
期刊:Tsinghua Science & Technology
影响因子:6.6
作者:Jingyang Li;Maosong Sun
通讯作者:Jingyang Li;Maosong Sun
关键词抽取与社会标签推荐相结合的中文文本主题词自动标注方法研究
  • 批准号:
    61170196
  • 项目类别:
    面上项目
  • 资助金额:
    60.0万元
  • 批准年份:
    2011
  • 负责人:
    孙茂松
  • 依托单位:
信息科学十二五学科发展战略研究
  • 批准号:
    60940025
  • 项目类别:
    专项基金项目
  • 资助金额:
    20.0万元
  • 批准年份:
    2009
  • 负责人:
    孙茂松
  • 依托单位:
汉语复杂网络的性质、结构、演化及其典型应用研究
  • 批准号:
    60873174
  • 项目类别:
    面上项目
  • 资助金额:
    32.0万元
  • 批准年份:
    2008
  • 负责人:
    孙茂松
  • 依托单位:
词汇、句法和语义—基于认知实验的汉语加工过程研究
  • 批准号:
    60083005
  • 项目类别:
    专项基金项目
  • 资助金额:
    13.0万元
  • 批准年份:
    2000
  • 负责人:
    孙茂松
  • 依托单位:
汉语句法排歧知识的自动获取方法研究
  • 批准号:
    69705005
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    12.0万元
  • 批准年份:
    1997
  • 负责人:
    孙茂松
  • 依托单位:
国内基金
海外基金