音声・言語現象の個人性モデルに基づく対話音声理解システムの開発

基于语音和语言现象的个性模型的对话语音理解系统的开发

基本信息

  • 批准号:
    14780272
  • 负责人:
  • 金额:
    $ 1.92万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2004
  • 项目状态:
    已结题

项目摘要

本年度は、対話音声において音響韻律的な現象に注目した対話音声処理に関する研究を行い、下記の研究成果を得た。1.対話音声の個人性の扱い前年度に引き続いて、発話様式の変動や個人性の違いによる対話音声認識性能の低下の問題に対して、繰り返しの訂正発話の検出法に焦点を当てた。本年度は新たに、音響・韻律的特徴の併用やモデル化に注目して、訂正発話の同定精度の改善を検討した。一つのアプローチとして、従来は2発話間の音響的特徴の類似性のみに注目していた繰り返し発話検出において、対数化基本周波数とその時間変化特徴を併用したパターンマッチングに基づくスポッティング法の適用を試み、従来法と比較して検出性能を4%ほど改善した。結果として80%程度の検出性能が得られた。2.発話様式と個人性の違いの定量化音声・言語現象のモデル化において、一般的な音響的な特徴表現での音声の個人性及び発話様式の違いの影響を明らかにするため、複数回の訂正入力を想定して発話様式の異なる発話を複数名の被験者で収録した。キーワード入力タスクを設定して、普通に発話してもらう場合と、訂正のために誇張して発話する場合とで複数の発話様式で発声してもらい、同一キーワードの発話様式の違いや個人差の影響の大きさと音響特徴空間での統計的な距離尺度との関係を分析した。分析において、母音間のBhattacharyya距離に基づく音韻構造間の距離との関係を分析した結果、個人間の差異や発話様式間での差異および、標準音響モデルと各個人・各発話様式との差異において、音韻構造間の距離に基づいて定量化された指標が発話様式や認識精度の違いに対してより相関が高い指標となることが示された。
This year, we conducted research on sound processing that focuses on the phenomenon of sound prosody in sound, and the following research results were obtained. 1. For the individual voice of the previous year, the introduction of the voice, the movement of the voice, the violation of the voice, the problem of low voice recognition, the correction of the voice, the focus of the voice. This year, we will discuss the combination of new, acoustic and prosodic features, attention, and improvement of the accuracy of correction. The similarity of the acoustic characteristics between the two transmission channels was noted, and the detection performance was improved by 4% by using the digitized basic frequency and the time-varying characteristics. As a result, 80% of the detection performance was achieved. 2. Quantification of voice and speech phenomena in speech patterns and individual violations, general acoustic characteristic performance, voice and speech patterns in speech patterns and individual violations, multiple loop correction input force, multiple loop correction input force, and speech patterns in speech patterns. Analysis of the relationship between the influence of two individual differences on the transmission pattern of the same square and the statistical distance scale of the acoustic feature space. Analysis of the relationship between the distance between vowels and phonological structures results in differences between individuals and speech patterns, standard speech responses, differences between individuals and speech patterns, distance between phonological structures, quantification of indicators of speech patterns, cognitive accuracy, and correlation.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Atsuhiko Kai: "Influence of different dialogue situation on user's behavior in spoken corrections"Proceedings of International Conference on Spoken Language Processing. 1189-1192 (2002)
Atsuhiko Kai:“不同对话情境对口语纠正中用户行为的影响”国际口语处理会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

甲斐 充彦其他文献

甲斐 充彦的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('甲斐 充彦', 18)}}的其他基金

方言音声データの分析と検索を可能にする諸方言に普遍な音声言語処理基盤モデルの構築
构建多种方言的通用语音语言处理平台模型,实现方言语音数据的分析和检索
  • 批准号:
    24K00450
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Feature Representation Learning and Imagined Speech Recognition by Simultaneous Recording of Spoken Language Stimuli and EEG
通过同时记录口语刺激和脑电图进行特征表示学习和想象语音识别
  • 批准号:
    22K19828
  • 财政年份:
    2022
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発
开发对话语音理解系统,可实现包括上下文在内的多方面话语验证
  • 批准号:
    17700181
  • 财政年份:
    2005
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
WWW情報検索サービスのための音声言語インタフェースシステムの開発
WWW信息搜索服务口语接口系统的开发
  • 批准号:
    11780267
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Aquatic Pollution from Light and Anthropogenic Noise: management of impacts on biodiversity
光和人为噪声造成的水生污染:生物多样性影响管理
  • 批准号:
    10098417
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    EU-Funded
Noise-reduction mechanisms in jet engines: chevrons are the answer
喷气发动机的降噪机制:人字形就是答案
  • 批准号:
    DE240100933
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Discovery Early Career Researcher Award
Silencing the noise in quantum circuits by a Quantum fluid Bath - SQuBa
通过量子流体浴消除量子电路中的噪声 - SQuBa
  • 批准号:
    EP/Y022289/1
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Research Grant
Understanding the mechanisms underlying noise-induced damage of hair cell ribbon synapses
了解噪声引起的毛细胞带突触损伤的机制
  • 批准号:
    BB/Z514743/1
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Fellowship
RII Track-4:@NASA: Wind-induced noise in the prospective seismic data measured in the Venusian surface environment
RII Track-4:@NASA:金星表面环境中测量的预期地震数据中的风致噪声
  • 批准号:
    2327422
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Standard Grant
CRII: CSR: From Bloom Filters to Noise Reduction Streaming Algorithms
CRII:CSR:从布隆过滤器到降噪流算法
  • 批准号:
    2348457
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Standard Grant
CAREER: Ultralow phase noise signal generation using Kerr-microresonator optical frequency combs
职业:使用克尔微谐振器光学频率梳生成超低相位噪声信号
  • 批准号:
    2340973
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Continuing Grant
Ultra-low noise magnetic environments
超低噪声磁场环境
  • 批准号:
    ST/Y509978/1
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Research Grant
Neural noise in human cognitive ageing and reserve
人类认知衰老和储备中的神经噪声
  • 批准号:
    FT230100658
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    ARC Future Fellowships
Aquatic Pollution from Light and Anthropogenic Noise: management of impacts on biodiversity
光和人为噪声造成的水生污染:生物多样性影响管理
  • 批准号:
    10107549
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    EU-Funded
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了