课题基金基金详情
面向交互式问答的问题理解及问题推荐技术研究
结题报告
批准号:
61472105
项目类别:
面上项目
资助金额:
80.0 万元
负责人:
张宇
依托单位:
学科分类:
F0211.信息检索与社会计算
结题年份:
2018
批准年份:
2014
项目状态:
已结题
项目参与者:
赵妍妍、张伟男、李一鸣、郭茂盛、秦海龙、尹庆宇、康树鹏、李文强、刘雄
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
随着Siri及Waston的出现,交互式问答技术越来越引起人们的关注。问答机器人以自动的方式对问题进行理解和回答,在企业在线客服、教育、政务咨询等方面有着广泛的应用。本项目主要开展以下几个的方面的研究:1)问题理解技术。针对交互式问答中,问句中存在子问题、大量的省略现象以及基于匹配的检索模型无法很好解决的问句检索问题,本项目开展了问句拆分、对话中省略句判别及恢复及词项赋权等技术的研究。2)相似、相关问题推荐技术。当用户无法很好给出问题的描述时,相似、相关问题的推荐在交互式问答系统中就显得格外重要。本项目在机器学习和自然语言处理方法的基础上,开展了相似、相关问题推荐技术的研究。本项目的研究内容对于相关研究提供了重要的理论基础;词项赋权、对话中省略恢复等核心技术的研究,对于推动交互式问答技术有着重要的价值。
英文摘要
With the emerging of Siri and Waston, interactive question answering (iQA) technique becomes more and more attractive. Question answering (QA) robot based on automatic question understanding and answering is widely applied to online customers of corporations, consultations of education and government affairs, etc. This study mainly focuses on the following techniques: 1) Question understanding technique. For the existence of sub-questions, the amount of ellipsis and the intrinsic problems of the matching based retrieval models on question retrieval task, the techniques of question decomposition, ellipsis sentence identification and recovery on dialogue and question term weighting are proposed in this study. 2) Similar and relevant question recommendation. When question descriptions are absent, the similar and relevant question recommendation techniques are integrant in iQA systems. In this study, we will perform the similar and relevant question recommendation work based on the machine learning and natural language processing approaches. The substantial theories proposed by this study are basis for prevalent research. Furthermore, the development of iQA can be boosted by the key techniques of this study, such as term weighting, ellipsis recovery on dialogue, etc.
本课题对交互式问答技术中的两大关键问题—问题理解技术和问题推荐技术进行研究。交互式问答系统中,用户的问题都是通过自然语言的形式提出的,如何能够让问答系统正确有效地理解这些问题是关键的技术之一。对于问题理解技术,本课题展开研究了省略恢复现象、问句拆分、文本复述等几大关键研究点。深度学习方法在人工智能领域取得了空前的发展,尤其是在自然语言处理、图像处理和语音识别等方面取得了重大的突破,已经成为世界上研究者的热门话题。深度学习模型由于其多层次结构的特性,决定了他在抽象输入数据,高层次表示数据上的优势。随着层数的加深,其表达能力也有着相应的提高。本课题利用前沿的深度学习技术和机器学习技术取得了令人满意的研究成果。在省略恢复研究中,针对省略恢复的特点,设计了基于循环神经网络的模型,旨在提高模型利用不同候选先行语之间的关系的能力,建模彼此之间的信息,帮助更好的进行恢复。本课题还创新性的提出了对于问句关键词提取问题的深度学习解决方案,构建了基于LSTM模型的问句关键词提取方法,用LSTM网络结构对问句建模,从而能够有效获取词级别语义信息。针对复述问题,本课题提出了词汇级复述和短语级复述两种方法,通过词和短语的向量表示得到两个高质量复述词表,并利用这个词表进行问句复述。在另一方面,我们还针对问题推荐技术进行了研究。针对用户提出的新的查询,我们通过判断问题相似,在历史纪录中检索与之相似的已解决问题,并将这些问题的答案推荐给用户,从而避免用户的重复提问,也方便用户更快速地获取问题答案。本课题着重探究了如何计算问句之间的相似度并利用这个信息进行问句推荐。为了能更好的计算问题间的相似度,我们将问题关键词和问题主题视为关键信息,利用这些信息辅助神经网络模型进行计算。我们构建了基于文本间相似信息和相异信息的CNN模型,并在其基础上融合了问题主题间相似度作为特征和关键词提取技术。综上,本项目的研究内容对于相关研究提供了重要的理论支持,对于推动交互式问答系统技术有着重要的价值。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2017
期刊:中文信息学报
影响因子:--
作者:刘雄;张宇;张伟男;刘挺
通讯作者:刘挺
DOI:--
发表时间:2014
期刊:计算机学报
影响因子:--
作者:张伟男;张宇;刘挺
通讯作者:刘挺
Generating Textual Entailment Using Residual LSTMs, Lecture Notes in Computer Science
使用残差 LSTM 生成文本蕴涵,计算机科学讲义
DOI:--
发表时间:2017
期刊:Lecture Notes in Computer Science
影响因子:--
作者:Maosheng Guo;Yu Zhang;Dezhi Zhao;Ting Liu
通讯作者:Ting Liu
Gated recurrent unit model for a sequence tagging problem
序列标记问题的门控循环单元模型
DOI:--
发表时间:--
期刊:High Technology Letters journal
影响因子:--
作者:Rekia kadari;Yu Zhang;Weinan Zhang;Ting Liu
通讯作者:Ting Liu
CCG supertagging with bidirectional long short-term memory networks
具有双向长短期记忆网络的 CCG 超级标记
DOI:10.1017/s1351324917000250
发表时间:2018
期刊:Natural Language Engineering
影响因子:2.5
作者:Kadari Rekia;Zhang Yu;Zhang Weinan;Liu Ting;Kadari R
通讯作者:Kadari R
新型氨法捕碳产物选择性还原强化机制及调控策略
  • 批准号:
    --
  • 项目类别:
    --
  • 资助金额:
    50万元
  • 批准年份:
    2023
  • 负责人:
    张宇
  • 依托单位:
中小学校空间范式转换及建筑生成设计研究
  • 批准号:
    52378013
  • 项目类别:
    面上项目
  • 资助金额:
    50万元
  • 批准年份:
    2023
  • 负责人:
    张宇
  • 依托单位:
Ti/TiAl双金属电子束增材制造及其界面组织调控研究
  • 批准号:
    --
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    30万元
  • 批准年份:
    2022
  • 负责人:
    张宇
  • 依托单位:
生物炭“吸附-反应微元”增效新型氨法捕碳过程的功能化交联机制
  • 批准号:
    52006047
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    24.0万元
  • 批准年份:
    2020
  • 负责人:
    张宇
  • 依托单位:
面向智能客服的问题语义分析相关技术研究
  • 批准号:
    61976068
  • 项目类别:
    面上项目
  • 资助金额:
    57.0万元
  • 批准年份:
    2019
  • 负责人:
    张宇
  • 依托单位:
基于安全促进的中小学校园环境 "友好空间" 模式与设计研究
  • 批准号:
    51708148
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    20.0万元
  • 批准年份:
    2017
  • 负责人:
    张宇
  • 依托单位:
面向ICN的可扩展命名数据路由机理研究
  • 批准号:
    61202457
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    23.0万元
  • 批准年份:
    2012
  • 负责人:
    张宇
  • 依托单位:
Haken流形的判定及virtually Haken猜想
  • 批准号:
    11101103
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    22.0万元
  • 批准年份:
    2011
  • 负责人:
    张宇
  • 依托单位:
特定域个性化交互式问答技术研究
  • 批准号:
    61073129
  • 项目类别:
    面上项目
  • 资助金额:
    31.0万元
  • 批准年份:
    2010
  • 负责人:
    张宇
  • 依托单位:
中文短语及简单句的复述技术研究
  • 批准号:
    60503072
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    21.0万元
  • 批准年份:
    2005
  • 负责人:
    张宇
  • 依托单位:
国内基金
海外基金