構造不変の定理に基づく音声アフォーダンスの提案とそれに立脚した音声認識系の構築
提出基于结构不变性定理的语音可供性并构建基于其的语音识别系统
基本信息
- 批准号:18049018
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2006
- 资助国家:日本
- 起止时间:2006 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
音声から言語情報・パラ言語情報を抽出する場合,年齢/性別/収録聞きの違いによって付与される音響歪みは純粋なノイズとなる。従来これらのノイズに対処するために,多量の音声でイータを収集し,それらから統計的な音響モデルを構築していた。本研究では,集めることで解決を図るのではなく,これらのノイズを表現する次元を消失した音声モデリング(音声アフォーダンスを数学的に定式化することで解決を図った。音声ストリームを分布系列に変換し,時間的に離れた分布対を含め、全ての二分布距離をバタチャリヤ距離と呼ばれる距離尺度を用いて計算する。全ての2事象間距離を求める(即ち距離行列を算出する)ことは,幾何学的な構造を規定することに等しいが,距離尺度としてバタチャリヤ距離を用いることで,空間を歪ませて構造不変性を保証している。先行研究では,孤立母音の系列を対象として上記音声表象の妥当性を検討したが,本年度はこれを連続音声へと拡張して検討を行なった。この場合,状態数の増加に伴う問題が発生するが,構造不変性を部分空間においても仮定することで認識率の大幅な向上を実現した。具体的には,日本語5母音を並び替えて構成される120単語認識をタスクとして実験を行ったところ,単語単位では93%,母音単位では97%という率が得られた。これは,音声の絶対的な物理量を一切用いずに,単語が認識でき,かつ,母音を同定することが可能であることを示す。従来,音の同定には音の絶対的な特徴量を用いて来たが(故に,音響歪みが混入する),これとは全く異なる枠組みにおいて,音声の認識が可能であることを示している。この場合,モデル学習に必要な話者数は極めて少数でよい。なお,本手法は孤立音の同定は原理上できなくなる。つまり,音の同定を行なうことなく,単語の同定を行なうアルゴリズムとなる訳だが,似た症状を呈する障害として発達性dyslexiaがある文字の読み書きにのみ困難を示す症状である。本研究は,この症状を物理的に説明するモデルを提供する可能性があり,言語障害関係の学会において様々な議論を重ねることができた。
In the case of extracting speech information, the age/gender/recording information is assigned to the audio information. In the past, the number of sound waves was increased, and the number of sound waves was increased. This study sets up a set of mathematical formulas for solving the problem. The distance between the sound and the sound is calculated by the distance between the sound and the sound The distance between two objects is calculated, and the geometric structure is specified. The distance scale is used to ensure the structural invariance of space. The first study is to discuss the appropriateness of the sound image of the isolated vowel series. This year, the sound image of the continuous vowel is discussed. In this case, the number of states increases with the occurrence of problems, and the structural invariance increases with the occurrence of problems. Specifically, the Japanese 5 vowels All physical quantities of sound and sound are used in the same way. The sound of the same sound is mixed with the sound of the opposite sound. In this case, the number of people who need to talk about learning is extremely small. This technique is based on the principle of isolated sound and fixed sound. The symptoms are presented as obstacles to the development of dyslexia, and the symptoms are presented as difficulties in writing. This study focuses on the physical explanation of the symptoms and the possibility of speech impairment.
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Speech recognition only with supra-segmental features--hearing speech as music--
仅具有超分段特征的语音识别——将语音听成音乐——
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:N. Minematsu;T. Nishimura;T. Murakami;and K. Hirose
- 通讯作者:and K. Hirose
音声の構造的表象を通して考察する失読症・自閉症の音声認知
通过言语的结构表征来考虑阅读障碍和自闭症的言语认知
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:峯松信明;櫻庭京子;西村多寿子
- 通讯作者:西村多寿子
音声の構造的表象を通して再考する幼児の音声模倣と言語獲得
通过言语的结构表征重新考虑婴儿的声音模仿和语言习得
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:峯松信明;西村多寿子;櫻庭京子
- 通讯作者:櫻庭京子
Theorem of the invariant structure and its derivation of speech Gestalt
不变结构定理及其语音格式塔推导
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:N. Minematsu;T. Nishimura;K. Nishinara;K. Sakuraba
- 通讯作者:K. Sakuraba
Para-linguistic information represented as distortion of the acoustic universal structure in speech
副语言信息表示为语音中声学通用结构的失真
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:N.Minematsu;S.Asakawa;K.Hirose
- 通讯作者:K.Hirose
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
峯松 信明其他文献
日本語上級中国人学習者と日本語母語話者教師の真偽疑問文と疑問詞疑問文の産出
日语高级汉语学习者及日语母语教师真/假疑问句及疑问疑问句的制作
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
伊達 宏子;中村 則子;峯松 信明;伊達宏子・花薗悟・郭田夫 - 通讯作者:
伊達宏子・花薗悟・郭田夫
生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明 - 通讯作者:
峯松 信明
Effects of English Shadowing Training Using Unlearned Passages on Listening and Speaking Skills
使用未学过的段落进行英语影子训练对听力和口语技能的影响
- DOI:
10.24539/let.59.0_77 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
中西 のりこ;峯松 信明;椢原 卓弥 - 通讯作者:
椢原 卓弥
Evaluation of the Prosodic Naturalness of Japanese Learners’ Utterances after Practicing with OJAD Suzuki-kun
与 OJAD Suzuki-kun 一起练习后日语学习者言语韵律自然度的评估
- DOI:
10.24467/onseikenkyu.23.0_6 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
伊達 宏子;中村 則子;峯松 信明 - 通讯作者:
峯松 信明
A viewpoint shift from technical aid for speaking to that for listening: From output to input
从口语技术援助到听力技术援助的观点转变:从输出到输入
- DOI:
10.20697/jasj.79.3_154 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
峯松 信明 - 通讯作者:
峯松 信明
峯松 信明的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('峯松 信明', 18)}}的其他基金
Measurement of L2 pronunciation deviation and L2 listening disfluency and its application to prosody training for smooth international communication
二语发音偏差和二语听力不流利度测量及其在国际交流顺畅韵律训练中的应用
- 批准号:
23K17459 - 财政年份:2023
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Challenging Research (Pioneering)
Measurement and modeling of cognitive breakdown and their use to enhance cognitive robustness for international oral communication
认知崩溃的测量和建模及其用于增强国际口头交流认知稳健性的用途
- 批准号:
22H00527 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Technically-enhanced high variability phonetic training and its effective application to English listening training for Japanese learners
技术强化的高变异性语音训练及其在日语学习者英语听力训练中的有效应用
- 批准号:
18F18724 - 财政年份:2018
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
構造不変の定理に基づく聴覚・視覚・身体メディアの普遍的表象に関する基礎研究
基于结构不变性定理的听觉、视觉和物理媒体普遍表征的基础研究
- 批准号:
07F07078 - 财政年份:2007
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
構造不変の定理に基づく音声アフォーダンスの提案とそれに立脚した音声認識系の構築
提出基于结构不变性定理的语音可供性并构建基于其的语音识别系统
- 批准号:
19024023 - 财政年份:2007
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
言語情報とパラ言語情報を統合した音声の構造的表象の提案とその音声合成への応用
整合语言和副语言信息的语音结构表示的提出及其在语音合成中的应用
- 批准号:
19650036 - 财政年份:2007
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Exploratory Research
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
- 批准号:
16016219 - 财政年份:2004
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
発音の明瞭性に着眼した発音構造の包括的記述とその語学学習への応用に関する研究
以发音清晰度为核心的发音结构综合描述及其在语言学习中的应用研究
- 批准号:
15652033 - 财政年份:2003
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Exploratory Research
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
- 批准号:
15017225 - 财政年份:2003
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人間による音声言語処理過程の分析とそれに立脚した音声対話システムの構築
人类口语处理过程分析及基于其的口语对话系统构建
- 批准号:
14019021 - 财政年份:2002
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
構造不変の定理に基づく音声アフォーダンスの提案とそれに立脚した音声認識系の構築
提出基于结构不变性定理的语音可供性并构建基于其的语音识别系统
- 批准号:
19024023 - 财政年份:2007
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas