構成性を考慮した自然言語理解テストセットの開発

考虑组合性的自然语言理解测试集的开发

基本信息

  • 批准号:
    22K12167
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2027-03-31
  • 项目状态:
    未结题

项目摘要

本研究は,質問応答タスクを含む自然言語処理タスクを題材として,以下の2つの目標を達成するためのタスク定義とデータセットを設計・構築する方法を研究する.第1の目標は,データセットから深層学習によって得られたモデルが,どのような範囲の質問に対して回答できるのか,を予測することである.既存の質問応答データセットの作成にあたっては,収録されている複数の質問q1,q2,...は,お互いに独立している.そのため,ある質問qに対してモデルが正しく推論できた場合に,別の質問q'に対しても正しく推論できるかどうかを予測する方法は,基本的には存在しない.本研究では逆に,ある質問qに対して人間が正しく推論できた場合,人間であれば正しく推論できるはずの別の質問q'を用意することによって,モデルが人間をどこまで模倣できているかを検証できるよう設計するという方針を検討する.第2の目標は,質問そのものに対する精度,信頼性を評価できる構成とすることである.従来の質問応答タスクにおいては,質問q1と文脈テキストC1の対を入力として学習を行い,異なる質問q2と文脈テキストC2の対を入力としてテストを行っている.このタスク定義は,学習によって得られたモデルMが質問q1と文脈テキストC1の対を理解しているか調べる問題設定になっているが,モデルMが質問q1を理解しているか調べる問題設定としては不十分である.同一の質問q1を異なる文脈テキストC1およびC2に対して適用した時,そして,両方の文脈テキストに対して正しく回答できた場合,そのモデルMが質問q1を理解しているとみなすことができるはずである.そこで,本研究では,1つの質問に対して複数の文脈テキストを用意したデータセットを構築する方法を研究する.
这项研究调查了设计和构建数据集的任务定义和方法,以实现以下两个目标,并使用自然语言处理任务在内,包括提问者任务。第一个目标是预测从数据集中深度学习获得的模型可以回答问题的程度。当创建一个现有的问题回答数据集时,随附的问题Q1,Q2,...彼此独立。因此,基本上无法预测一个问题Q是否可以正确推断模型,是否可以正确推断出另一个问题Q'的模型。相反,在这项研究中,如果人类可以正确理解问题Q,我们考虑了设计模型的政策,以便通过准备另一个问题q'可以验证模型可以模仿人的程度,该问题应该能够正确地为人类推理。第二个目标是使其成为一个结构,使您能够评估问题本身的准确性和可靠性。在传统的问题回答任务中,问题Q1和上下文文本C1的成对被研究为输入,并使用不同的问题Q2和上下文文本C2作为输入来执行测试。此任务定义是一个问题设置,它可以检查通过学习获得的模型M是否了解问题Q1和上下文文本C1之间的对,但是作为问题设置不足以检查Model M是否理解问题Q1。当将Q1应用于不同上下文文本C1和C2,并且两个上下文文本正确的答案时,则应考虑使用模型M来理解问题Q1。因此,在这项研究中,我们将研究如何构建一个为一个问题准备多个上下文文本的数据集。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Quality Assist: A Technology-Assisted Peer Review Based on Citation Functions to Predict the Paper Quality
  • DOI:
    10.1109/access.2022.3225871
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Setio Basuki;Masatoshi Tsuchiya
  • 通讯作者:
    Setio Basuki;Masatoshi Tsuchiya
SDCF: semi-automatically structured dataset of citation functions
  • DOI:
    10.1007/s11192-022-04471-x
  • 发表时间:
    2022-07
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Basuki Setio;Masatoshi Tsuchiya
  • 通讯作者:
    Basuki Setio;Masatoshi Tsuchiya
日本語物語文を対象とする空所穴埋め問題データセット
日语叙事文本填空题数据集
Developing a Dataset of Overridden Information in Wikipedia
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masatoshi Tsuchiya;Yasutaka Yokoi
  • 通讯作者:
    Masatoshi Tsuchiya;Yasutaka Yokoi
Automatic Approach for Building Dataset of Citation Functions for COVID-19 Academic Papers
为 COVID-19 学术论文构建引文函数数据集的自动方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Setio Basuki;Masatoshi Tsuchiya
  • 通讯作者:
    Masatoshi Tsuchiya
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

土屋 雅稔其他文献

『現代日本語書き言葉均衡コーパス』における複合辞の検出と評価
《现代日语书面语平衡语料库》中复合词的检测与评价
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 敬文;阿部 佑亮;宇津呂 武仁;松吉 俊;土屋 雅稔
  • 通讯作者:
    土屋 雅稔
代表・派生関係を利用した日本語機能表現の解析方式の評価
使用代表/派生关系分析日语功能表达的方法的评估
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 敬文;阿部 佑亮;宇津呂 武仁;松吉 俊;土屋 雅稔
  • 通讯作者:
    土屋 雅稔
機械学習を用いた日本語機能表現のチャンキング
使用机器学习对日语功能表达进行分块
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    土屋 雅稔;注連 隆夫;高木 俊宏;他5名
  • 通讯作者:
    他5名

土屋 雅稔的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

階層型視覚的コモンセンスを考慮した動画質問応答
考虑分层视觉常识的视频问答
  • 批准号:
    22KJ2914
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
異種メディア融合に基づく対話型マルチメディア検索技術の構築
基于异构媒体融合的交互式多媒体搜索技术构建
  • 批准号:
    22KJ0010
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
質問形式と回答形式の違いが幼児期の「わからない」反応に及ぼす影響
问答形式差异对婴儿“我不明白”反应的影响
  • 批准号:
    22K13812
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Creation of datasets that combine 3D environmental and textual information
创建结合 3D 环境和文本信息的数据集
  • 批准号:
    22K17983
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
三次元空間情報を用いた実世界質問応答基盤の創出
使用 3D 空间信息创建现实世界问答平台
  • 批准号:
    22K12159
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了