構成性を考慮した自然言語理解テストセットの開発

考虑组合性的自然语言理解测试集的开发

基本信息

  • 批准号:
    22K12167
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2027-03-31
  • 项目状态:
    未结题

项目摘要

本研究は,質問応答タスクを含む自然言語処理タスクを題材として,以下の2つの目標を達成するためのタスク定義とデータセットを設計・構築する方法を研究する.第1の目標は,データセットから深層学習によって得られたモデルが,どのような範囲の質問に対して回答できるのか,を予測することである.既存の質問応答データセットの作成にあたっては,収録されている複数の質問q1,q2,...は,お互いに独立している.そのため,ある質問qに対してモデルが正しく推論できた場合に,別の質問q'に対しても正しく推論できるかどうかを予測する方法は,基本的には存在しない.本研究では逆に,ある質問qに対して人間が正しく推論できた場合,人間であれば正しく推論できるはずの別の質問q'を用意することによって,モデルが人間をどこまで模倣できているかを検証できるよう設計するという方針を検討する.第2の目標は,質問そのものに対する精度,信頼性を評価できる構成とすることである.従来の質問応答タスクにおいては,質問q1と文脈テキストC1の対を入力として学習を行い,異なる質問q2と文脈テキストC2の対を入力としてテストを行っている.このタスク定義は,学習によって得られたモデルMが質問q1と文脈テキストC1の対を理解しているか調べる問題設定になっているが,モデルMが質問q1を理解しているか調べる問題設定としては不十分である.同一の質問q1を異なる文脈テキストC1およびC2に対して適用した時,そして,両方の文脈テキストに対して正しく回答できた場合,そのモデルMが質問q1を理解しているとみなすことができるはずである.そこで,本研究では,1つの質問に対して複数の文脈テキストを用意したデータセットを構築する方法を研究する.
In this study, the question and answer question contains the subject matter of natural speech processing, and the following is 2 Goal Achievement するためのタスクDefinitionとデータセットをDesign and ConstructionするMethodをResearchする. The first goal is to learn deep learning and to learn deeply.どのような风囲のquestion に対してanswer できるのか, を expected することである. The existing のquestions and answers データセットの成にあたっては, including the されているplural のquestions q1, q2,...は, お mutual and independent している.そのため, あるquestion qに対してモデルが正しく inference できたoccasionに, 不のquestion q'に対しても正しく inference できるかどうかをforecast するmethod は, the basic には existence しない. This study is about the reverse of the world, and the questioning of the human world, the inference of the human world, and the inference of the human world.することによって,モデルが人间をどこまでimitateできているかを検证できるようDesign するというPolicy を検 Discussion する. The second goal is to question the precision of the question and the quality of the trust and evaluation of the composition of the question.従来のquestion応answerタスクにおいては,question q1と文典テキストC1の対を入力として学Xi を line い, different な る question q2 と cultural context テ キ ス ト C2 の対 を enter force と し て テ ス ト を line っ て い る.このタスクDefinition は, learn によって got られたモデルMがquestion q1と文典テキストC1の対をunderstand しているか tuneべるQuestion setting になっているが, モデルMがquestion q1をUnderstanding しているか Adjustment べるQuestion setting としてはNot very である. The same question q1をdifferent context テキストC1およびC2に対して is applicable to した时,そして,両方の Context テキストに対して正しくAnswer できた occasion, そのモデルMがquestion q1をUnderstand しているとみなすことができるはずである.そこで, this study では, 1つのquestion に対してplural の文 Context テキストをpurpose したデータセットをconstruct するmethodをresearchする.

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Quality Assist: A Technology-Assisted Peer Review Based on Citation Functions to Predict the Paper Quality
  • DOI:
    10.1109/access.2022.3225871
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Setio Basuki;Masatoshi Tsuchiya
  • 通讯作者:
    Setio Basuki;Masatoshi Tsuchiya
SDCF: semi-automatically structured dataset of citation functions
  • DOI:
    10.1007/s11192-022-04471-x
  • 发表时间:
    2022-07
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Basuki Setio;Masatoshi Tsuchiya
  • 通讯作者:
    Basuki Setio;Masatoshi Tsuchiya
日本語物語文を対象とする空所穴埋め問題データセット
日语叙事文本填空题数据集
Developing a Dataset of Overridden Information in Wikipedia
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masatoshi Tsuchiya;Yasutaka Yokoi
  • 通讯作者:
    Masatoshi Tsuchiya;Yasutaka Yokoi
Automatic Approach for Building Dataset of Citation Functions for COVID-19 Academic Papers
为 COVID-19 学术论文构建引文函数数据集的自动方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Setio Basuki;Masatoshi Tsuchiya
  • 通讯作者:
    Masatoshi Tsuchiya
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

土屋 雅稔其他文献

『現代日本語書き言葉均衡コーパス』における複合辞の検出と評価
《现代日语书面语平衡语料库》中复合词的检测与评价
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 敬文;阿部 佑亮;宇津呂 武仁;松吉 俊;土屋 雅稔
  • 通讯作者:
    土屋 雅稔
代表・派生関係を利用した日本語機能表現の解析方式の評価
使用代表/派生关系分析日语功能表达的方法的评估
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 敬文;阿部 佑亮;宇津呂 武仁;松吉 俊;土屋 雅稔
  • 通讯作者:
    土屋 雅稔
機械学習を用いた日本語機能表現のチャンキング
使用机器学习对日语功能表达进行分块
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    土屋 雅稔;注連 隆夫;高木 俊宏;他5名
  • 通讯作者:
    他5名

土屋 雅稔的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

階層型視覚的コモンセンスを考慮した動画質問応答
考虑分层视觉常识的视频问答
  • 批准号:
    22KJ2914
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
三次元空間情報を用いた実世界質問応答基盤の創出
使用 3D 空间信息创建现实世界问答平台
  • 批准号:
    22K12159
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
医療場面の質問―応答において構築される共感に関する認知語用論的研究
基于医疗情境中的问题和回答的同理心的认知实用研究
  • 批准号:
    21K00490
  • 财政年份:
    2021
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
言語横断専門情報質問応答システムの研究
跨语言专业信息问答系统研究
  • 批准号:
    26330366
  • 财政年份:
    2014
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
情報爆発時代に対応する質問応答基盤技術に関する研究
信息爆炸时代的基础问答技术研究
  • 批准号:
    19024033
  • 财政年份:
    2007
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
情報爆発時代に対応する質問応答基盤技術に関する研究
信息爆炸时代的基础问答技术研究
  • 批准号:
    18049031
  • 财政年份:
    2006
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
曖昧な質問に対応する対話型質問応答システム
针对歧义问题的互动问答系统
  • 批准号:
    17700143
  • 财政年份:
    2005
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
対話知識の共有・再利用化を考慮した日本語質問応答システムに関する研究
考虑对话知识共享与重用的日语问答系统研究
  • 批准号:
    11780281
  • 财政年份:
    1999
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
文書検索機能を持つ日本語質問応答システムの開発に関する研究
具有文档搜索功能的日语问答系统的开发研究
  • 批准号:
    09780347
  • 财政年份:
    1997
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
専門分野の知識ベースに対する質問応答システムの作成
为专业知识库创建问答系统
  • 批准号:
    07780319
  • 财政年份:
    1995
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了