確率・統計的手法による対話のモデル化とコーパスからの自動生成に関する研究
概率统计方法建模对话及语料库自动生成研究
基本信息
- 批准号:07221209
- 负责人:
- 金额:$ 0.51万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、確率・統計的手法に基づいた対話のモデル化について研究し、このような対話モデルを大規模言語データベースであるコーパスから自動的に生成するための研究を行なった。まず第一に、学習データを幾つかのクラスタに分割し、各クラスタから確率文脈自由文法のパラメータを推定することにより、対話状況依存性を持つ確率文脈自由文法を構築する研究を行なった。IFT(Illocutionary Force Type;発話行為タイプ)付きの対話コーパスを用いた評価実験を行ない通常の確率文脈自由文法よりも優れていることを示した。次に、IFT付きのコーパスから、話者の交替や質問・応答・確認といった会話の基本的な構造を確率・統計的にモデル化するための研究として、Ergodic HMMおよびALERIGIAアルゴリズムを用いた対話構造のモデル化について研究を行なった。Ergodic HMMによるモデル化では、質問・応答等の対話の基本構造を抽出することができ、話者ラベルとIFTを併用した場合には、状態遷移が事務局側の発話と質問者側の発話で比較的きれいに分かれたモデルが得られた。また、ALERGIAアルゴリズムにより得られるモデルは、決定性オートマトンであるため、エントロピーの小さなモデルを作成するためには、状態数を非常に大きくする必要があると分かった。
This study is based on statistical methods to analyze speech quality and speech quality on a large scale. The first is to study the segmentation of the class, the accuracy of the class, the estimation of the context-free grammar, and the construction of the context-free grammar according to the dependency of the class. IFT(Illicit Force Type; Voice Behavior) is used to evaluate the behavior of voice communication. It is usually used to determine the context of free syntax. Second, IFT and communication, speaker's alternate query, response, confirmation, basic structure of conversation, accuracy, statistical analysis, research, Ergodic HMM and ALERIGIA, application, structure of conversation, research Ergodic HMM is the basic structure of the communication, such as the query, the answer, etc., and the state transition is the case where the communication on the office side and the communication on the questioner side are compared.また、ALERGIAアルゴリズムにより得られるモデルは、决定性オートマトンであるため、エントロピーの小さなモデルを作成するためには、状态数を非常に大きくする必要があると分かった。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Kenji Kita: "Probabilistic Language Modeling Based on Mixture Probabilistic Context-Free Grammar" Proceedings of ROCLING VIII. 127-136 (1995)
Kenji Kita:《基于混合概率上下文无关语法的概率语言建模》ROCLING 论文集 VIII。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
福井 義和: "確率・統計的手法による対話構造のモデル化" 情報処理学会研究会. (発表予定). (1996)
Yoshikazu Fukui:“使用概率和统计方法建模对话结构”日本信息处理学会研究小组(演示文稿预定)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
北 研二: "発話タイプ付きコーパスを用いた確率的対話モデルの自動生成" 人工知能学会研究会. 47-54 (1996)
Kenji Kita:“使用具有话语类型的语料库自动生成概率对话模型”日本人工智能学会研究小组 47-54 (1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
北 研二其他文献
自己中心トライアド変化曲線によるユーザ分析
使用自我中心三元组变化曲线进行用户分析
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
三宅 剛史;松本 和幸;吉田 稔;北 研二;西 可南子,斉藤 和巳,池田 哲夫,大久保 誠也 - 通讯作者:
西 可南子,斉藤 和巳,池田 哲夫,大久保 誠也
楽曲に特徴的なコメントに基づく作業用BGMからのインデックス作成
根据歌曲的评论特征,从工作 BGM 中创建索引
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
福田 寛公;松本 和幸;吉田 稔;北 研二 - 通讯作者:
北 研二
演劇台本における登場人物間の親密度推定手法
一种估计戏剧剧本中人物之间亲密度的方法
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
松本 和幸;秋田 恭佑;任 福継;吉田 稔;北 研二 - 通讯作者:
北 研二
北 研二的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('北 研二', 18)}}的其他基金
拡張サフィックス・アレイを用いた語学学習用作文支援システムに関する研究
基于扩展后缀数组的语言学习写作支持系统研究
- 批准号:
20650143 - 财政年份:2008
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
統計的言語情報を用いた音声認識の精度向上に関する研究
利用统计语言信息提高语音识别准确率的研究
- 批准号:
05780292 - 财政年份:1993
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
発話行為機能タグ付きコーパスおよびコーパス連動型オンライン学習サイトの構築
构建具有言语行为功能标签的语料库和语料库链接的在线学习网站
- 批准号:
24K03956 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
日本語学習者コーパスの拡充およびコーパスを活用した習得研究
日语学习者语料库的扩展以及利用该语料库的习得研究
- 批准号:
24K03976 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
看護留学生等に必要な言語知識ー教科書コーパスと語彙テストに基づく研究・教材開発
留学生所需的语言知识等 - 基于教科书语料库和词汇测试的研究和教材开发
- 批准号:
24K03990 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ICNALE-WE22:アジア圏22か国を網羅する新しい英語学習者作文コーパスの構築と分析
ICNALE-WE22:覆盖22个亚洲国家的新型英语学习者作文语料库的构建与分析
- 批准号:
23K25338 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
大規模進化コーパスの構築・利活用によるソフトウェア自動進化の促進
通过构建和利用大规模进化语料库促进软件自动进化
- 批准号:
23K24823 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
合成メディアの大規模比較評価の最適化と主観比較評価コーパスの構築
合成媒体大规模对比评价优化及主观对比评价语料库构建
- 批准号:
24K20792 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
聴解コーパスの構築による日本語学習者の聴解困難点と推測技術の実証的研究
基于听力语料库的日语学习者听力理解困难及估计技术的实证研究
- 批准号:
23K21941 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
「話題から始まる日本語教育」を支援する情報サイトの構築と話題別会話コーパスの拡充
构建支持“从主题开始的日语教育”的信息网站,扩大主题对话语料库
- 批准号:
23K21940 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ジェスチャー情報付きコーパスの構築と統語構造に対応するジェスチャーの解明
构建包含手势信息的语料库并阐明与句法结构相对应的手势
- 批准号:
24K16050 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
マルチモーダルな視点による日本語講義動画およびコーパスの開発
多模态视角下的日语讲座视频和语料库开发
- 批准号:
24K03981 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)