話者正規化による高精度多数話者単語音声認識システムとそのLSI化に関する研究

基于说话人归一化的高精度多说话人语音识别系统及其LSI实现研究

基本信息

  • 批准号:
    03555070
  • 负责人:
  • 金额:
    $ 2.69万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B)
  • 财政年份:
    1991
  • 资助国家:
    日本
  • 起止时间:
    1991 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究は、経路限定DP照合法と母音音声を用いた特徴パラメ-タの話者正規化法とを従来のマルチテンプレ-ト方式に組合せ、高精度の多数話者単語音声認識システムを計算機上に構築し、その性能評価を行うこと、さらにLSI化を検討し、小型装置として実現するための方策を示すことを目的とするもので、以下の実績をあげた。(1)従来の話者正規化法は孤立発声した母音音声のみを用いていたが、無声摩擦音を利用するアルゴリズムを開発し、その有効性を確認した。さらに、単語中で発声された母音音声を正規化に用いることの検討を加えた。(2)経路限定DP照合法、話者正規化法、フレ-ム数正規化法のアルゴリズムをワ-クステ-ション上に実装するとともに、modified K-means法によって男女各10名ずつの音声デ-タから1単語当り4個の標準パタ-ンを選定して、ハ-ドディスク装置に格納した。このようにして単語音声認識システムをワ-クステ-ション上に構築して認識実験を行ない、方式の有効性を確認するとともに、方式のパラメ-タ値の最適化をはかった。(3)パラメ-タの抽出、話者正規化のパラメ-タ変換、経路限定点候補の検出、フレ-ム数正規化をDSPで、標準パタ-ンと入力パタ-ンとのDP照合をシストリックアレイで行なう単語音声認識ボ-ドの処理の流れを明らかにし、ボ-ドの基本的な構成を示した。(4)距離計算と経路計算の機能を有するシストリックアレイの処理素子の論理設計を行なった。さらに、このような素子38個からなるDP照合プロセッサのデ-タの流れの制御について検討した上で、論理設計を行ない、計算機シミュレ-ションにより動作の確認を行なった。以上、交付申請書に記載された研究計画はほぼ予定通りに達成した。
は 経 road limited DP, as this study legal と vowel sounds を with い た, 徴 パ ラ メ - タ の regularization method is the speaker's words と を 従 to の マ ル チ テ ン プ レ ト way に combination せ, high-precision の most words 単 voice sound understanding シ ス テ ム を computer に constructing し, そ の performance evaluation 価 を line う こ と, さ ら に LSI change を beg し 検, small device と し て be す now The るため <s:1> strategy を indicates the す とを とを objective とする を で で で the following <s:1> achievements をあげた. (1) 従 to の regularization は sound isolation 発 し た vowel sounds の み を with い て い た が, silent fricatives を using す る ア ル ゴ リ ズ ム を open 発 し, そ の have sharper sex を confirm し た. さ ら に, 単 で in sound 発 さ れ た vowel sounds を regularized に with い る こ と の を 検 please add え た. (2) the qualified DP 経 road, according to legal, regularization method, the speaker's words フ レ number - ム regularization の ア ル ゴ リ ズ ム を ワ - ク ス テ - シ ョ ン on に be loaded す る と と も に, modified K - means method に よ っ て males and 10 ず つ の sounds デ - タ か ら 1 単 language when り four の standard パ タ - ン を selected し て, ハ ド デ ィ ス ク device に Wagner し た. こ の よ う に し て 単 voice sound understanding シ ス テ ム を ワ - ク ス テ - シ ョ ン に on constructing し て know be 験 を line な い の have sharper, way availability を す る と と も に way, の パ ラ メ - タ numerical optimal の を は か っ た. (3) パ ラ メ - タ の extraction, the callee regularization の パ ラ メ - タ variations in, 経 limit point alternate の 検, フ レ - ム regularized を DSP で, standard パ タ - ン と パ into force タ - ン と の DP as close を シ ス ト リ ッ ク ア レ イ で line な う 単 voice sound understanding ボ - ド の 処 Richard の flow れ を Ming ら か に し, ボ ド の basic な constitute を shown し た . (4) Distance calculation と path calculation <e:1> function を has するシストリッ <s:1> アレ <s:1> <s:1> processing element <s:1> theoretical design を line なった. さ ら に, こ の よ う な element child 38 か ら な る DP as close プ ロ セ ッ サ の デ - タ の flow れ の suppression に つ い て beg し 検 た で on line, the logical design を な い, computer シ ミ ュ レ - シ ョ ン に よ り action line の confirm を な っ た. The above submission of the application form に records the された research plan ほぼ ほぼ for approval, and the <s:1> に has been achieved.

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
広瀬 啓吉: "音声認識における音響的特徴表現の時間単位に関する検討" 日本音響学会秋季研究発表会講演論文集. I. 153-154 (1991)
Keikichi Hirose:“语音识别中声学特征表示的时间单位的研究”日本声学学会秋季研究会议论文集 I. 153-154 (1991)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
峯松 信明: "複数の時間単位・精度の音響的特徴表現を用いた音声認識" 日本音響学会春季研究発表会講演論文集. I. 31-32 (1992)
Nobuaki Minematsu:“使用具有多个时间单位和精度的声学特征表示的语音识别”日本声学学会春季会议记录 I. 31-32 (1992)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

広瀬 啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明
  • 通讯作者:
    峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華
  • 通讯作者:
    孫慶華
基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価
基于语料库的基频模式生成过程模型自动参数提取评价
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀
  • 通讯作者:
    河村 美由紀
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉
  • 通讯作者:
    広瀬 啓吉
文節単位での感情の程度を考慮した統計的韻律制御
考虑每个短语的情感程度的统计韵律控制
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史
  • 通讯作者:
    浅野 泰史

広瀬 啓吉的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('広瀬 啓吉', 18)}}的其他基金

認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
  • 批准号:
    08F08049
  • 财政年份:
    2008
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
  • 批准号:
    06F06099
  • 财政年份:
    2006
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    06F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    05F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
  • 批准号:
    04F04035
  • 财政年份:
    2004
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高品質音声合成のための韻律制御
高质量语音合成的韵律控制
  • 批准号:
    12132202
  • 财政年份:
    2000
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
  • 批准号:
    12132101
  • 财政年份:
    2000
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
  • 批准号:
    11878058
  • 财政年份:
    1999
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
  • 批准号:
    10898014
  • 财政年份:
    1998
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

RI: Medium: Collaborative Research: The Effect of Subglottal Resonances on Machine and Human Speaker Normalization
RI:媒介:合作研究:声门下共振对机器和人类说话者标准化的影响
  • 批准号:
    0905381
  • 财政年份:
    2009
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: The Effect of Subglottal Resonances on Machine and Human Speaker Normalization
RI:媒介:合作研究:声门下共振对机器和人类说话者标准化的影响
  • 批准号:
    0905250
  • 财政年份:
    2009
  • 资助金额:
    $ 2.69万
  • 项目类别:
    Standard Grant
PROCESSES OF SPEAKER NORMALIZATION IN SPEECH PERCEPTION
言语感知中说话人标准化的过程
  • 批准号:
    2126635
  • 财政年份:
    1992
  • 资助金额:
    $ 2.69万
  • 项目类别:
PROCESSES OF SPEAKER NORMALIZATION IN SPEECH PERCEPTION
言语感知中说话人标准化的过程
  • 批准号:
    3461881
  • 财政年份:
    1992
  • 资助金额:
    $ 2.69万
  • 项目类别:
PROCESSES OF SPEAKER NORMALIZATION IN SPEECH PERCEPTION
言语感知中说话人标准化的过程
  • 批准号:
    2126637
  • 财政年份:
    1992
  • 资助金额:
    $ 2.69万
  • 项目类别:
PROCESSES OF SPEAKER NORMALIZATION IN SPEECH PERCEPTION
言语感知中说话人标准化的过程
  • 批准号:
    3461879
  • 财政年份:
    1992
  • 资助金额:
    $ 2.69万
  • 项目类别:
PROCESSES OF SPEAKER NORMALIZATION IN SPEECH PERCEPTION
言语感知中说话人标准化的过程
  • 批准号:
    3461880
  • 财政年份:
    1992
  • 资助金额:
    $ 2.69万
  • 项目类别:
PROCESSES OF SPEAKER NORMALIZATION IN SPEECH PERCEPTION
言语感知中说话人标准化的过程
  • 批准号:
    2126636
  • 财政年份:
    1992
  • 资助金额:
    $ 2.69万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了