多言語に対応する音声入力インタフェースのための言語適応に関する基礎的研究
多语言语音输入界面的语言适配基础研究
基本信息
- 批准号:13780302
- 负责人:
- 金额:$ 1.34万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 2002
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は,世界の様々な自然言語(日本語や英語など)に共通して対応できる音声入力インタフェースを実現するために,対象とする言語とは別の音声データにより設計・構築された音声認識用モデルを当該の言語に「適応」する方法を検討し,その基礎的な知見を得ることを目指すものである.研究2年目の今年度は,まず,言語適応化学習の検討および音声入力インタフェースの設計を行った.具体的には,日本語および英語の音声データベース(数百名以上の話者による大規模なもの)を基準モデルとして,多言語(中国語,フランス語,インドネシア語など)の少量の音声に対する言語適応化学習を行う音声入力インタフェースを作成した.この際,音韻体系の記述以外の言語モデル(文法等)は特に設定しなかったが,将来何らかの方法で多言語の文法記述およびその変換が行えるようになった場合にそのまま適用できるような音響モデルの設計を試みた.次に,言語識別学習の検討として,上述のインタフェース設計から派生して,11の異なる言語の識別を行うシステムを設計し,1言語あたり100単語のデータベースを用いた簡単な言語識別実験を行った.この際,各言語の音響的特徴と言語的特徴とを効果的に抽出する方法を検討し,言語適応化における基礎モデルの設計に役立てることができた.研究成果の一部は,日本音響学会2003年春季研究発表会(2003年3月18日〜20日,早稲田大学)にて「多言語識別における音韻性パターンの利用に関する検討」なる題目で発表した.また,フランスのコンピエーニュ工科大学との共同研究テーマと合わせて「Analysis of rhythm-based methods for language identification」なる報告書にまとめることができた.
This study aims to explore the ways in which the world's natural speech (Japanese and English) can be understood in terms of sound penetration, design and construction of sound recognition systems for speech, and basic knowledge. This year's 2-year study aims to explore, explore, and design speech adaptation learning. Specifically, Japanese and English voice data sets (hundreds of or more speakers) are benchmarks, and multilingual (China, English, Chinese) voice data sets are created for speech adaptation learning and voice entry. At this time, the description of phonological system other than speech language (grammar, etc.) is not specially set, how to use it in the future, multi-language grammar description, and how to use it in the future. Second, speech recognition learning is discussed in detail, and the design of the above speech recognition system is derived from the design of the speech recognition system in 11 different languages. At the same time, the acoustic characteristics of each speech and the extraction method of speech characteristics and effects are discussed, and the basic design of speech adaptation is established. One part of the research results was presented at the 2003 Spring Research Conference of the Society of Acoustics of Japan (Waseda University, March 18 - 20, 2003) on the topic of "Discussion on the utilization of phonemes in multi-speech recognition." "Analysis of rhythm-based methods for language identification" report.
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山下利樹, 川野涼子, 大川茂樹, Stephane Aubry: "多言語識別における音韻性パターンの利用に関する検討"日本音響学会講演論文集. 3-Q-8. 167-168 (2003)
Toshiki Yamashita、Ryoko Kawano、Shigeki Okawa、Stephane Aubry:“多语言识别中语音模式的使用研究”日本声学学会论文集 167-168(2003 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
大川 茂樹其他文献
様々な雑音環境下におけるマルチバンド型音声認識の性能評価
各种噪声环境下多频段语音识别的性能评估
- DOI:
- 发表时间:
2002 - 期刊:
- 影响因子:0
- 作者:
塩田 大輔;王 大可;大川 茂樹;白井 克彦 - 通讯作者:
白井 克彦
頭部モーションセンサと音声を用いた対話インタフェースの検討
使用头部运动传感器和语音的对话界面研究
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
會田 卓也;西本 卓也;大川 茂樹;嵯峨山 茂樹 - 通讯作者:
嵯峨山 茂樹
変調特徴量の独立性基準による分解を用いたマルチストリーム音声認識
基于调制特征独立性准则的多流语音识别
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
久保 陽太郎;大川 茂樹;樽松 明;白井 克彦 - 通讯作者:
白井 克彦
大川 茂樹的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('大川 茂樹', 18)}}的其他基金
音響計測・音響制御におけるロボティクス技術の利用に関する基礎的研究
机器人技术在声学测量与控制中的应用基础研究
- 批准号:
20K11895 - 财政年份:2020
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声・音楽識別技術に関する基礎的研究
语音/音乐识别技术基础研究
- 批准号:
16700189 - 财政年份:2004
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
音声入出力を含むヒューマンインタフェースに関する基礎的研究
包括语音输入/输出在内的人机界面基础研究
- 批准号:
11780314 - 财政年份:1999
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
インターネット上における多言語情報処理に関する研究
互联网多语言信息处理研究
- 批准号:
99J08235 - 财政年份:1999
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for JSPS Fellows