ニューラル言語モデルからの文法の抽出に関する研究
神经语言模型语法提取研究
基本信息
- 批准号:20K19877
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2022-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
自然言語処理に対するニューラルネットワークに基づくモデルとして、LSTMやTransformerなどの言語を系列として扱うモデルの有用性が高く示されているものの、言語のもつ階層構造を陽にモデル化していないことから、言語モデルとしての限界も指摘されている。本研究の目的はもともと、言語のもつ統語構造の教師なし学習を可能とするモデルを構築することで、より正確な統語構造の認識を可能にする言語モデルを実現することであった。その結果、研究期間中には、最終的な教師なし学習までは実現することができなかったものの、統語構造を扱う言語モデルに対する新しい学習法、及び推論法の確立を行うことができ、本目的に対して非常に重要かつ大きな貢献を行うことができた。具体的に、本研究の一番の成果は、リカレントニューラルネットワークグラマー(RNNG)と呼ばれる、統語構造のニューラルネットワークに基づく生成モデルに対して、新しく非常に効率的な学習法を提案し、論文発表を行い、ソフトウェアの公開を行なった点である。既存の実装と比較して、学習時に6倍程度以上の高速化を実現することができた。この成果はRNNGモデルを様々な応用に適用する可能性を押し広げるものである。またより広く、構造を陽に扱うモデルに対してミニバッチの新しい構成法に基づく効率的な学習を行う指針を示したとも言える。このような点が評価され、本成果は第27回言語処理学会年次大会で最優秀賞を受賞した他、最難関国際会議のACLに論文が採択された。2年度は、RNNGに関する研究をさらに推し進め、RNNGが統語構造を正しく認識するために必要なモデルに与えるアノテーションの量について検討を行なった。その結果、既存の教師データの全ての統語構造を与えるのは、最適ではなく、長い依存構造を正確に捉えるために一部の構造のみを与えた方が逆に性能が向上する、という点を明らかにした。
Natural speech processing is highly useful for speech processing, speech processing and speech processing. The purpose of this study is to explore the possibility of language construction for teachers to learn, and the possibility of understanding the correct language construction for teachers to learn. The results, the research period, the final teacher, the learning process, the language structure, the language structure, the new learning method, and the inference method are very important to the purpose. The specific results of this study include: the establishment of a system of language structures, and the establishment of a system of language structures. Compared with the existing equipment, the speed of learning is more than 6 times. The results of this study are based on the possibility of using the RNNG as a tool. A new method of constructing a structure is proposed. This work was reviewed at the 27th Annual Conference of the Speech Processing Society and was presented at the ACL Conference. In 2002, RNNG related research was promoted, RNNG related language structure was recognized, and necessary research was conducted. The result is that the existing teacher's whole language structure is opposite to the original one, and the long dependent structure is opposite to the original one.
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Effective Batching for Recurrent Neural Network Grammars
循环神经网络语法的有效批处理
- DOI:10.18653/v1/2021.findings-acl.380
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Noji Hiroshi;Oseki Yohei
- 通讯作者:Oseki Yohei
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
能地 宏其他文献
時系列データの動向説明文生成における参照時刻の不整合解消の精度向上にむけた取り組み
努力提高生成时序数据趋势描述时解决参考时间不一致的准确性
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
濵園 侑美;上原 由衣;能地 宏;宮尾 祐介;高村 大也;小林 一郎 - 通讯作者:
小林 一郎
杉本良男・インド文化事典編集委員会編『インド文化事典』(「留保制度」、「家族法」、「ナショナリズムと宗教」、「ヒンドゥーナショナリズムの発展」)
杉本良夫和印度文化百科全书编辑委员会主编的《印度文化百科全书》(《预约制度》、《家庭法》、《民族主义与宗教》、《印度教民族主义的发展》)
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
濵園 侑美;上原 由衣;能地 宏;宮尾 祐介;高村 大也;小林 一郎;Satoshi OGURA et. al;三輪 眞嗣;志賀美和子 - 通讯作者:
志賀美和子
Bangladeshi Ready-Made Garment Industry: Female Workers’ Skill, Wage and Household/ Householding -The case of a Japanese multinational company’s international transfe
孟加拉国成衣业:女工技能、工资与家庭/家庭——以日本跨国公司国际转移为例
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
濵園 侑美;上原 由衣;能地 宏;宮尾 祐介;高村 大也;小林 一郎;Satoshi OGURA et. al;三輪 眞嗣;志賀美和子;田口紘子・杉原薫・佐藤宏之・新名隆志;小関悠一郎;Hanako Nagata - 通讯作者:
Hanako Nagata
西洋近世のメディアにおける魔女と社会的周縁者
早期现代西方媒体中的女巫和社会边缘主义者
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
濵園 侑美;上原 由衣;能地 宏;宮尾 祐介;高村 大也;小林 一郎;Satoshi OGURA et. al;三輪 眞嗣;志賀美和子;田口紘子・杉原薫・佐藤宏之・新名隆志;小関悠一郎;Hanako Nagata;黒川正剛 - 通讯作者:
黒川正剛
能地 宏的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('能地 宏', 18)}}的其他基金
遷移型の解析器に基づく教師なし係り受け解析に関する研究
基于过渡型分析器的无监督依赖分析研究
- 批准号:
15J07986 - 财政年份:2015
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
病理画像診断の言語モデルをもった口腔がんの新たな診断法の基盤構築
使用病理图像诊断语言模型为新型口腔癌诊断方法奠定基础
- 批准号:
24K13114 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
大規模言語モデルと統語的言語モデルの融合
大规模语言模型与句法语言模型的融合
- 批准号:
24KJ0800 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows
大規模言語モデルを使用した生成系AIによるAI搭載型治療方針決定支援ツールの開発
使用大规模语言模型的生成人工智能开发配备人工智能的治疗政策决策支持工具
- 批准号:
24K18785 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
From corpus to target data as steps for automatic assessment of L2 speech: L2 French phonological lexicon of Japanese learners
从语料库到目标数据作为 L2 语音自动评估的步骤:日语学习者的 L2 法语语音词典
- 批准号:
23K20100 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
言語の壁を超える低資源多言語Machine Speech Chain技術の構築
构建克服语言障碍的低资源多语言机器语音链技术
- 批准号:
23K21681 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
大規模言語モデルのための品質保証技術に関する研究
大规模语言模型质量保证技术研究
- 批准号:
24K02920 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
プログラミング教育支援のための大規模言語モデルへの入力情報に関する研究
支持编程教育的大规模语言模型输入信息研究
- 批准号:
24K15218 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
マルチモーダル情報を活用するタンパク質言語モデル
利用多模态信息的蛋白质语言模型
- 批准号:
24K20851 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
大規模言語モデルを用いた生物試料情報の標準化
使用大规模语言模型对生物样本信息进行标准化
- 批准号:
24K20889 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
大規模言語モデル(LLM)を用いた企業価値形成にかかる網羅的研究
使用大规模语言模型(LLM)对企业价值形成进行综合研究
- 批准号:
24K00298 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)