Structuring Templates and Acquiring Lexical Knowledge for Language Generation
构建模板并获取语言生成的词汇知识
基本信息
- 批准号:21J13602
- 负责人:
- 金额:$ 0.96万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-28 至 2023-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は、任意のドメインにおいて生成される文の構造と意味内容を制御することである。これに向け、今年度は、ソフトテンプレートに基づく文生成手法の開発および分析を進めた。ソフトテンプレートは、明示的なスロットを持つ単語系列であるハードテンプレートとは異なり、スロットを持たない完全文のことである。このソフトテンプレートの単語の並び、つまり文の構造や意味内容を参考にしながら文を生成させることで生成結果を弱く制御できるようになる。本研究では、機械翻訳やData-to-Textなどの系列変換タスクにおいて、大量の文を含むデータストアから正解文に最も近いと考えられる文をソフトテンプレートとして検索する。そしてそのソフトテンプレートに対して単語を削除・挿入することで、ソフトテンプレートに含まれる単語系列をもとに文を生成する手法を提案した。これにより、ハードテンプレートにはない文も柔軟に生成可能となり、さらに従来のソフトテンプレートをベクトルに圧縮する手法と比較して結果の解釈性も損なわれないという副次的な効果もある。法文書コーパス等を用いた機械翻訳タスクなどで表層的な評価や埋め込みに基づく評価を行い、提案手法によって生成文の単語の並びを弱く制御しながらその品質を向上させられることを確認した。さらに提案手法が有効な条件について分析・調査を行い、ソフトテンプレートに基づく文生成に関する知見を得た。本研究の成果は、英文論文誌Journal of Information Processingにて発表した。
The purpose of this study is to create and control the structure and content of the text in any way.これに向け、this yearは、ソフトテンプレートに based on the text generation technique の开発およびANALYSIS を进めた.ソフトテンプレートは, explicit なスロットをhold つ単语 series であるハードテンプレートとはdifferent なり, スロットを志たない全文のことである. referenceにしながら文をGenerationさせることでGeneration resultをWeakくControlできるようになる. This research is based on the mechanical translation of the Data-to-Text series, and a large number of textsむデータストアから正解文にmostもNearlyいと卡えられる文をソフトテンプレートとして検SOする.そしてそのソフトテンプレートに対して単语をremoval・insertionすることで、ソフトテンプレートに contain the まれる単语 series をもとに文をGeneration する Technique をProposal した.これにより、ハードテンプレートにはない文もsoft にGeneration possibilityとなり、さらに従来のソフトテンプレThe ートをベクトルに姧する technique and the comparison of the result and the result of the solution are the damage and the effect of the secondary time. French book コーパス, etc. are mechanically translated by いた 訳タスクなどで. The method of the case is to generate the text of the text and to control the quality of the text and to confirm the quality.さらにProposal techniqueがeffectiveなconditionsについてanalysis・investigationを行い、ソフトテンプレートにbaseづく文 generatesに关する知见を得た. The results of this research are listed in the English thesis Journal of Information Processing.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Nearest Neighbor Non-autoregressive Text Generation
- DOI:10.48550/arxiv.2208.12496
- 发表时间:2022-08
- 期刊:
- 影响因子:0
- 作者:Ayana Niwa;Sho Takase;Naoaki Okazaki
- 通讯作者:Ayana Niwa;Sho Takase;Naoaki Okazaki
近傍の事例を用いた非自己回帰生成
使用邻近示例的非自回归生成
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:鈴木康之,十亀敬伍,中村晃大,野村泰伸;Ayana Niwa and Sho Takase and Naoaki Okazaki;中村晃大;丹羽彩奈 高瀬翔 岡崎直観
- 通讯作者:丹羽彩奈 高瀬翔 岡崎直観
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
丹羽 彩奈其他文献
コロナとインフォデミック:ソーシャル・メディアが豊かにする社会とその危険性
电晕和信息流行病:社交媒体及其危险丰富了社会
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
石川 遼伍;丹羽 彩奈;水木 栄;岡崎 直観;岡崎 直観;荒牧英治;荒牧英治 - 通讯作者:
荒牧英治
疑似訓練データによる格助詞の省略に頑健な係り受け解析
使用伪训练数据对案例粒子遗漏进行稳健的依赖性分析
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
石川 遼伍;丹羽 彩奈;水木 栄;岡崎 直観 - 通讯作者:
岡崎 直観
ソーシャルメディア:ニューノーマルがもたらした新しいRWD
社交媒体:新常态带来的新RWD
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
石川 遼伍;丹羽 彩奈;水木 栄;岡崎 直観;岡崎 直観;荒牧英治;荒牧英治;荒牧英治 - 通讯作者:
荒牧英治
丹羽 彩奈的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
創薬応用を指向した抗原テンプレート反応の開発
用于药物发现应用的抗原模板反应的开发
- 批准号:
24KJ1428 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for JSPS Fellows
精神障害者の介護者のエンパワメント・ケアシークエンスのテンプレート開発
为精神障碍患者的护理人员开发赋权护理序列模板
- 批准号:
23K16451 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
注意の抑制的制御と特性・状態不安のクロストーク
注意力抑制控制与特质/状态焦虑之间的串扰
- 批准号:
22KJ0012 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for JSPS Fellows
リチウム金属負極の性能向上ために織物テンプレート法で特異構造な銅集電体の開発
采用纺织模板法开发结构独特的铜集流体,提高锂金属负极性能
- 批准号:
22KJ0030 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Template synthesis and characterization of single-walled inorganic nanotubes
单壁无机纳米管的模板合成与表征
- 批准号:
23H01807 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of multistep DNA-templated synthesis using strand break
使用链断裂开发多步 DNA 模板合成
- 批准号:
23K06063 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Analysis, reaction, and functionalization of isolated molecules using molecular pits organized on substrates
使用基质上组织的分子凹坑对孤立分子进行分析、反应和功能化
- 批准号:
23K17929 - 财政年份:2023
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
既承認器具の課題を克服した子宮頸がん組織内照射テンプレートの新規開発
新开发的宫颈癌组织照射模板克服了已批准设备的问题
- 批准号:
22K09573 - 财政年份:2022
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
可逆的な結合を利用した新規不斉テンプレート重合法の開発
利用可逆键合开发新的不对称模板聚合方法
- 批准号:
22K20540 - 财政年份:2022
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
高専生の英語学術プレゼンテーションのためのテンプレート開発:論理展開に注目して
技工大学生英语学术演讲模板开发:注重逻辑发展
- 批准号:
22K00705 - 财政年份:2022
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)