Computational Modeling of Stylistic Aspects of Dialogue Utterances
对话话语文体方面的计算建模
基本信息
- 批准号:19J21913
- 负责人:
- 金额:$ 1.79万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2019
- 资助国家:日本
- 起止时间:2019-04-25 至 2022-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本年度は、前年度に引き続き、対話データ中のノイズを自動で除去するための効果的な方法論の確立に取り組んだ。本年度の大きな研究成果として、対話データ中に含まれる低品質な発話-応答ペアを自動で検出するための方法論を確立したことが挙げられる。自然言語処理だけでなく社会言語学等の周辺分野も対象とした広域的な文献調査、および実データに基づくデータ科学的な観察と分析に基づき、発話系列において、発話間の表層的な接続の度合いと意味内容の関連の度合いが大きいものほど対話として成立する可能性が高い、すなわち、品質の良い発話-応答ペアである可能性が高いということを明らかにした。その上で、表層的な接続性については統計的機械翻訳の句アライメント抽出技術を、意味内容の関連性については単語埋め込み技術を利用してそれぞれスコア関数としてモデル化し、これらを組み合わせることで発話-応答ペアの自動品質評価を可能にした。提案した方法論の有用性については、クラウドソーシングを用いた人手評価により、提案法を用いて算出したスコアが発話-応答ペアの品質評価の観点で人間の主観と概ね相関することを実証した。本研究成果は、言語処理分野の権威ある最難関国際会議のひとつである Conference on Empirical Methods in Natural Language Processing (EMNLP 2020) に採択され、口頭発表をおこなった。また、関連する内容を人工知能学会全国大会でも発表し、全国大会学生奨励賞を受賞した。本年度の研究成果は、研究課題の実現に向けて研究を確実に前進させたと同時に、当該分野においては国内外でその学術的貢献が高く評価されている。
This year, compared with the previous year, the method of automatic elimination of the results of the introduction of information, information and communication is established. This year's major research results include the establishment of a methodology for automatic detection of low-quality voice messages Natural speech processing is divided into four parts: sociolinguistics, etc., literature research, basic science, observation and analysis, speech series, speech surface, connection, meaning, content, relationship, and probability of establishment. Good quality information-high probability of failure In addition to the above, the surface of the connection between the mechanical translation of the sentence extraction technology, meaning of the content of the relevance of the single language buried in the technology to use, but also to reduce the number of connection, the combination of the two groups of words-answer loss of automatic quality evaluation possible The usefulness of the proposed methodology is demonstrated by the human evaluation of the proposed methodology, the evaluation of the quality of the proposed methodology, and the correlation between the proposed methodology and the proposed methodology. The results of this research were collected and presented orally at the Conference on Empirical Methods in Natural Language Processing (EMNLP 2020), the most difficult international conference on the division of speech processing. The National Conference of the Artificial Intelligence Society was held in Beijing. This year's research results are highly appraised for their academic contributions both at home and abroad.
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Filtering Noisy Dialogue Corpora by Connectivity and Content Relatedness
- DOI:10.18653/v1/2020.emnlp-main.68
- 发表时间:2020-04
- 期刊:
- 影响因子:0
- 作者:Reina Akama;Sho Yokoi;Jun Suzuki;Kentaro Inui
- 通讯作者:Reina Akama;Sho Yokoi;Jun Suzuki;Kentaro Inui
句の呼応と話題の一貫性に着目した低品質対話データの教師なしフィルタリング
对低质量对话数据进行无监督过滤,重点关注短语对应性和主题一致性
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:赤間怜奈;鈴木潤;横井祥;乾健太郎
- 通讯作者:乾健太郎
ニューラル対話応答生成のための言語非依存な低品質対話データフィルタリング法の提案と分析
用于神经对话响应生成的与语言无关的低质量对话数据过滤方法的提出和分析
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:赤間 怜奈;横井 祥;鈴木 潤;乾 健太郎
- 通讯作者:乾 健太郎
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
赤間 怜奈其他文献
全国遺跡報告総覧における学術情報流通と活用の取り組み
国家考古遗址报告名录学术信息的分发和利用工作
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
東中 竜一郎;船越 孝太郎;稲葉 通将;角森 唯子;高橋 哲朗;赤間 怜奈;宇佐美 まゆみ;水上 雅博;高田祐一 - 通讯作者:
高田祐一
人間同士の雑談における話題遷移モデリング
人类聊天中的主题转换建模
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
岸波 洋介;赤間 怜奈;佐藤 志貴;徳久 良子;鈴木 潤;乾 健太郎 - 通讯作者:
乾 健太郎
雑談対話システムをどう評価すべきか -TripiaBotのライブコンペ予選通過から考える-
我们应该如何评价闲聊对话系统? - 考虑TripiaBot的现场比赛资格赛 -
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
東中 竜一郎;船越 孝太郎;稲葉 通将;角森 唯子;高橋 哲朗;赤間 怜奈;宇佐美 まゆみ;水上 雅博;高田祐一;稲葉 通将 - 通讯作者:
稲葉 通将
赤間 怜奈的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('赤間 怜奈', 18)}}的其他基金
自然言語文生成における内容的多様性の改善
提高自然语言句子生成的内容多样性
- 批准号:
22K17943 - 财政年份:2022
- 资助金额:
$ 1.79万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
相似海外基金
MFB: Better Homologous Folding using Computational Linguistics and Deep Learning
MFB:使用计算语言学和深度学习更好的同源折叠
- 批准号:
2330737 - 财政年份:2024
- 资助金额:
$ 1.79万 - 项目类别:
Standard Grant
Conference: Doctoral Consortium at Student Research Workshop at the Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL)
会议:计算语言学协会 (NAACL) 北美分会年会学生研究研讨会上的博士联盟
- 批准号:
2415059 - 财政年份:2024
- 资助金额:
$ 1.79万 - 项目类别:
Standard Grant
Conference: Doctoral Consortium at Student Research Workshop at the Annual Meeting of the Association for Computational Linguistics
会议:计算语言学协会年会学生研究研讨会上的博士联盟
- 批准号:
2307288 - 财政年份:2023
- 资助金额:
$ 1.79万 - 项目类别:
Standard Grant
Conference: Training the US Computational Linguistics Team
会议:培训美国计算语言学团队
- 批准号:
2329963 - 财政年份:2023
- 资助金额:
$ 1.79万 - 项目类别:
Standard Grant
WORKSHOP: Doctoral consortium at Student Research Workshop at the North American Chapter of the Association for Computational Linguistics
研讨会:计算语言学协会北美分会学生研究研讨会上的博士联盟
- 批准号:
2225202 - 财政年份:2022
- 资助金额:
$ 1.79万 - 项目类别:
Standard Grant
発声運動学習が音声認識学習に与える影響に関する計算言語学的研究
发声运动学习对语音识别学习影响的计算语言学研究
- 批准号:
21K17805 - 财政年份:2021
- 资助金额:
$ 1.79万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Natural Language Processing and Computational Linguistics - Discourse Parsing and Summarization
自然语言处理和计算语言学 - 语篇解析和摘要
- 批准号:
566113-2021 - 财政年份:2021
- 资助金额:
$ 1.79万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
微分幾何学と計算言語学に基づくデザイン言語学の構築
基于微分几何和计算语言学的建筑设计语言学
- 批准号:
21H03765 - 财政年份:2021
- 资助金额:
$ 1.79万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Quantum Computing for Computational Linguistics
计算语言学的量子计算
- 批准号:
2407119 - 财政年份:2020
- 资助金额:
$ 1.79万 - 项目类别:
Studentship
Characterizing Episodes of Lucidity in Dementia Using Observational and Applied Computational Linguistics Approaches
使用观察和应用计算语言学方法表征痴呆症的清醒发作
- 批准号:
10266124 - 财政年份:2020
- 资助金额:
$ 1.79万 - 项目类别: