权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

話者正規化による高精度多数話者単語音声認識システムとそのLSI化に関する研究

基于说话人归一化的高精度多说话人语音识别系统及其LSI实现研究

基本信息

批准号：
03555070
负责人：
広瀬啓吉
金额：
$ 2.69万
依托单位：
The University of Tokyo
依托单位国家：
日本
项目类别：
Grant-in-Aid for Developmental Scientific Research (B)
财政年份：
1991
资助国家：
日本
起止时间：
1991 至无数据
项目状态：
已结题

项目摘要

本研究は、経路限定DP照合法と母音音声を用いた特徴パラメ-タの話者正規化法とを従来のマルチテンプレ-ト方式に組合せ、高精度の多数話者単語音声認識システムを計算機上に構築し、その性能評価を行うこと、さらにLSI化を検討し、小型装置として実現するための方策を示すことを目的とするもので、以下の実績をあげた。(1)従来の話者正規化法は孤立発声した母音音声のみを用いていたが、無声摩擦音を利用するアルゴリズムを開発し、その有効性を確認した。さらに、単語中で発声された母音音声を正規化に用いることの検討を加えた。(2)経路限定DP照合法、話者正規化法、フレ-ム数正規化法のアルゴリズムをワ-クステ-ション上に実装するとともに、modified K-means法によって男女各10名ずつの音声デ-タから1単語当り4個の標準パタ-ンを選定して、ハ-ドディスク装置に格納した。このようにして単語音声認識システムをワ-クステ-ション上に構築して認識実験を行ない、方式の有効性を確認するとともに、方式のパラメ-タ値の最適化をはかった。(3)パラメ-タの抽出、話者正規化のパラメ-タ変換、経路限定点候補の検出、フレ-ム数正規化をDSPで、標準パタ-ンと入力パタ-ンとのDP照合をシストリックアレイで行なう単語音声認識ボ-ドの処理の流れを明らかにし、ボ-ドの基本的な構成を示した。(4)距離計算と経路計算の機能を有するシストリックアレイの処理素子の論理設計を行なった。さらに、このような素子38個からなるDP照合プロセッサのデ-タの流れの制御について検討した上で、論理設計を行ない、計算機シミュレ-ションにより動作の確認を行なった。以上、交付申請書に記載された研究計画はほぼ予定通りに達成した。

は経 road limited DP, as this study legal と vowel sounds を with いた, 徴パラメ - タの regularization method is the speaker's words とを従 to のマルチテンプレト way に combination せ, high-precision の most words 単 voice sound understanding システムを computer に constructing し, その performance evaluation 価を line うこと, さらに LSI change を beg し検, small device として be す now The るため <s:1> strategy を indicates the すとをとを objective とするをででで the following <s:1> achievements をあげた. (1) 従 to の regularization は sound isolation 発した vowel sounds のみを with いていたが, silent fricatives を using するアルゴリズムを open 発し, その have sharper sex を confirm した. さらに, 単で in sound 発された vowel sounds を regularized に with いることのを検 please add えた. (2) the qualified DP 経 road, according to legal, regularization method, the speaker's words フレ number - ム regularization のアルゴリズムをワ - クステ - ション on に be loaded するとともに, modified K - means method によって males and 10 ずつの sounds デ - タから 1 単 language when り four の standard パタ - ンを selected して, ハドディスク device に Wagner した. このようにして単 voice sound understanding システムをワ - クステ - ションに on constructing して know be 験を line ないの have sharper, way availability をするとともに way, のパラメ - タ numerical optimal のをはかった. (3) パラメ - タの extraction, the callee regularization のパラメ - タ variations in, 経 limit point alternate の検, フレ - ム regularized を DSP で, standard パタ - ンとパ into force タ - ンとの DP as close をシストリックアレイで line なう単 voice sound understanding ボ - ドの処 Richard の flow れを Ming らかにし, ボドの basic な constitute を shown した . (4) Distance calculation と path calculation <e:1> function を has するシストリッ <s:1> アレ <s:1> <s:1> processing element <s:1> theoretical design を line なった. さらに, このような element child 38 からなる DP as close プロセッサのデ - タの flow れの suppression について beg し検たで on line, the logical design をない, computer シミュレ - ションにより action line の confirm をなった. The above submission of the application form に records the された research plan ほぼほぼ for approval, and the <s:1> に has been achieved.

项目成果

期刊论文数量（2）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

広瀬啓吉: "音声認識における音響的特徴表現の時間単位に関する検討" 日本音響学会秋季研究発表会講演論文集. I. 153-154 (1991)

Keikichi Hirose：“语音识别中声学特征表示的时间单位的研究”日本声学学会秋季研究会议论文集 I. 153-154 (1991)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

峯松信明: "複数の時間単位・精度の音響的特徴表現を用いた音声認識" 日本音響学会春季研究発表会講演論文集. I. 31-32 (1992)

Nobuaki Minematsu：“使用具有多个时间单位和精度的声学特征表示的语音识别”日本声学学会春季会议记录 I. 31-32 (1992)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

広瀬啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン

基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式

DOI：
发表时间：
2007
期刊：
影响因子：
0
作者：
平野宏子;広瀬啓吉;河合剛;顧文涛;峯松信明
通讯作者：
峯松信明

音調核モデルに基づく中国語F_0パターンの2段階生成

基于声调核模型的汉语F_0模式的两步生成

DOI：
发表时间：
2006
期刊：
電子情報通信学会技術研究報告(音声研究会) SP2005-159
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史;河村美由紀;孫慶華
通讯作者：
孫慶華

基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価

基于语料库的基频模式生成过程模型自动参数提取评价

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史;河村美由紀
通讯作者：
河村美由紀

種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)

各种声调语音合成的韵律控制——从情感语音合成的角度——（特邀报告）

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉
通讯作者：
広瀬啓吉

文節単位での感情の程度を考慮した統計的韻律制御

考虑每个短语的情感程度的统计韵律控制

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史
通讯作者：
浅野泰史