Building General Language Understanding Infrastructure by Fusing Computational and Human Intelligence

通过融合计算和人类智能构建通用语言理解基础设施

基本信息

  • 批准号:
    21H04901
  • 负责人:
  • 金额:
    $ 26.62万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-05 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

2022年度は以下の4つの研究項目について研究を行った。「人知のデザイン、構築」(研究項目1)および「計算知のデザイン、構築」(研究項目2)では、Transformerに基づく計算知に対して、人知の一つである辞書を融合する手法を考案し、形態素解析タスクに適用した。この手法は、入力文の各文字が辞書にマッチしたかどうかを埋め込みベクトルとして学習し、入力に足し合わせる。実験により、辞書の種類によっては精度が向上することを確認した。また、2021年度から継続的に構築していた日本語RoBERTaモデルのlargeサイズを公開した。「人に近い文章理解の実現に向けた計算知・人知融合モデルの構築」(研究項目3)では、事前学習済み言語モデルを、自然言語推論(NLI)データを用いてfine-tuningすることで得られた文ベクトルと、国語辞典の定義文を用いてfine-tuningすることで得られた文ベクトルを比較し、後者の方が表層的に類似していない文ペアの意味的関係性の認識に強いなど、両者の性質に違いがあることを明らかにした。また、両者を統合することで文ベクトルの性能向上が可能なことを示した。「計算知・人知融合モデルの処理過程の説明方式の確立」(研究項目4)では、巨大言語モデルに適切な例題を提示することで、思考連鎖(Chain-of-Thought)の能力で問題を解決できる可能性があることが先行研究にて示されていることに着目した。この思考連鎖の能力についてより深い検証を行い、特に否定的な意味合いを持つ単語を使うと、思考連鎖が機能しなくなるという現象をつきとめた。また、この過程で言語モデルの推論過程を適切に調査するための方法論を考案した。これ以外にもニューラルネットワークの説明性の評価基準である忠実性評価に関して現状を網羅的に調査し、言語処理タスクにおける忠実性評価の指針を示した。
In 2022, the following 4 research projects were carried out. "Human knowledge and structure"(research item 1) and "computational knowledge and structure"(research item 2) are the basic methods of Transformer, computational knowledge and dictionary fusion. This technique is used to study and enter the text. The accuracy of the dictionary is high. In 2021, the Japanese language RoBERTa "The construction of human knowledge fusion in the realization of human near text understanding"(Research Project 3). In advance, learning language, natural language inference (NLI), fine-tuning, and comparison of text, Chinese dictionary definition, and text. The latter is similar to the surface layer, and the relationship between the meaning of the text and the understanding of the nature of the text is strong. The performance of the company is expected to improve. "Establishment of a method for explaining the processing of computational knowledge and human knowledge fusion"(Research Item 4). The possibility of solving the problem of the ability to think chain-of-thought is discussed in this paper. The ability to think about chains is to think deeply about evidence, to think negatively about meaning, to think about chains, to think about functions, to think about phenomena. A methodological study of the process of speech inference is conducted. The descriptive evaluation criteria for speech processing and speech processing are shown in the survey on the status quo of speech processing.

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
言語モデルを用いた漢文の返り点付与と書き下し文生成
对中文句子进行返回点并使用语言模型生成写下来的句子
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    王昊;清水博文;河原大輔
  • 通讯作者:
    河原大輔
Comparison and Combination of Sentence Embeddings Derived from Different Supervision Signals
  • DOI:
    10.18653/v1/2022.starsem-1.12
  • 发表时间:
    2022-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hayato Tsukagoshi;Ryohei Sasano;Koichi Takeda
  • 通讯作者:
    Hayato Tsukagoshi;Ryohei Sasano;Koichi Takeda
Sentence Embeddings using Definition Sentences
使用定义句子的句子嵌入
思考連鎖指示における大規模言語モデルの否定表現理解
使用思维链指令中的大规模语言模型理解否定表达
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    葉夢宇;栗林樹生;舟山弘晃;鈴木潤
  • 通讯作者:
    鈴木潤
日本語GPT2 small
日文GPT2小号
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河原 大輔其他文献

月刊「細胞」: 溶液NMR法を用いた蛋白質立体構造計算の最近の動向
月刊《Cell》:利用溶液NMR方法计算蛋白质3D结构的最新趋势
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山本 泰久;好村 尚記;高橋 治子;河原 大輔;菊池 裕;池谷鉄兵 & 伊藤隆
  • 通讯作者:
    池谷鉄兵 & 伊藤隆
「メディア流言」の時代―第6回 焼け跡ジャーナリズムの「真相」
“媒体谣言”时代——第六部分:新闻业倦怠的“真相”
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    粟村 誉;荒牧 英治;河原 大輔;柴田知秀;黒橋 禎夫;Sato Takumi;Daisuke Kawahara and Martha Palmer;佐藤卓己
  • 通讯作者:
    佐藤卓己
KWJA: 汎用言語モデルに基づく日本語解析器
KWJA:基于通用语言模型的日语语言分析器
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    植田 暢大;大村 和正;児玉 貴志;清丸 寛一;村脇 有吾;河原 大輔;黒橋 禎夫
  • 通讯作者:
    黒橋 禎夫
医療画像および遺伝子発現データの統合解析によるがん診断基盤の構築
通过医学图像和基因表达数据综合分析构建癌症诊断平台
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山本 泰久;好村 尚記;高橋 治子;河原 大輔;菊池 裕
  • 通讯作者:
    菊池 裕
Consumption of Nazi Culture Images in Postwar Japan
战后日本纳粹文化图像的消费
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    粟村 誉;荒牧 英治;河原 大輔;柴田知秀;黒橋 禎夫;Sato Takumi
  • 通讯作者:
    Sato Takumi

河原 大輔的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('河原 大輔', 18)}}的其他基金

医療AIの予後予測における"見える化"と最適な放射線治療シミュレーションの構築
医疗AI预后预测的“可视化”及最优放疗模拟的构建
  • 批准号:
    24K10811
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
人知との融合による大規模言語モデルの大規模知識モデルへの進化
通过与人类智能融合,将大规模语言模型进化为大规模知识模型
  • 批准号:
    24H00727
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
現代アメリカ映画産業における製作のグローバル化と産業労働の変容に関する研究
当代美国电影产业生产全球化与产业劳动力转型研究
  • 批准号:
    24K03594
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
造影下低エネルギーX線照射による被ばく線量定量化及び新規放射線治療法実現性の検討
对比增强低能X射线照射剂量的量化及新放疗方法的可行性研究
  • 批准号:
    20K16727
  • 财政年份:
    2020
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
グローバル状況下における米国映画製作の政治経済分析:製作工程の海外委託を中心に
全球背景下美国电影制作的政治经济分析:聚焦海外制作流程外包
  • 批准号:
    19K13041
  • 财政年份:
    2019
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
ダイナミックインシュレーション技術を適用した開口部の実用化に関する研究
动态隔热技术洞口实际应用研究
  • 批准号:
    14J10194
  • 财政年份:
    2014
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ポスト古典的ハリウッド映画研究:様式の変遷に関する実証的調査と歴史的考察
后古典好莱坞电影研究:风格变化的实证研究和历史考量
  • 批准号:
    07J02100
  • 财政年份:
    2007
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

深層転移学習と継続学習を組み合わせた筋電ベースヒューマンインタフェースの開発
结合深度迁移学习和持续学习的基于肌电的人机界面的开发
  • 批准号:
    23K28135
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
情報幾何学に基づく転移学習の解析と深化
基于信息几何的迁移学习分析与深化
  • 批准号:
    23K24909
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
実験科学研究の効率化のための能動学習と転移学習手法の開発
发展主动学习和迁移学习方法,提高实验科学研究效率
  • 批准号:
    24K20836
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
体育授業における転移学習実現につながる走・泳運動の技能獲得を目指した牽引法の開発
开发旨在获得跑步和游泳技能的牵引方法,从而在体育课上进行迁移学习
  • 批准号:
    24K14576
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
転移学習を用いた外挿的予測の実現と材料研究への応用
利用迁移学习实现外推预测及其在材料研究中的应用
  • 批准号:
    23K19980
  • 财政年份:
    2023
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
転移学習と知識グラフを用いたナレッジ活用型AIによる離農予測モデルの開発
使用基于知识的人工智能(利用迁移学习和知识图)开发农场废弃预测模型
  • 批准号:
    22K14959
  • 财政年份:
    2022
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
転移学習を用いた唾液腺癌の組織学的悪性度の再分類の試み
尝试使用迁移学习对唾液腺癌的组织学分级进行重新分类
  • 批准号:
    22K10210
  • 财政年份:
    2022
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Wi-Fiチャンネル状態情報に基づくコンテキスト認識のための転移学習技術
基于Wi-Fi信道状态信息的上下文识别的迁移学习技术
  • 批准号:
    21H03428
  • 财政年份:
    2021
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
オミクスの転移学習に基づく難治胃がんの精密医療の確立
基于组学迁移学习的难治性胃癌精准医疗建立
  • 批准号:
    19K22892
  • 财政年份:
    2019
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
転移学習付き遺伝的ネットワークプログラミングとその応用に関する研究
迁移学习遗传网络编程及其应用研究
  • 批准号:
    26730132
  • 财政年份:
    2014
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了