高次元特徴量と低自由度識別器を用いた高精度音声認識器の開発と研究

利用高维特征和低自由度分类器的高精度语音识别器的开发与研究

基本信息

  • 批准号:
    09J04190
  • 负责人:
  • 金额:
    $ 0.9万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2009
  • 资助国家:
    日本
  • 起止时间:
    2009 至 2010
  • 项目状态:
    已结题

项目摘要

本年度は,高次元特徴量と低自由度識別器を用いた音声認識器の大規模音声データへの適用を目的とした研究を行なった.特に,昨年度提案した高次元特徴量の利用法であるカーネル法に基づく音声処理法をデータ数に対してスケーラブルに動作するよう,拡張を行なった.提案手法はカーネル部分空間法に基づく音響モデルの近似と,近似を精密に保つための部分空間追跡法から成る.従来のカーネル法に基づくデータ解析は,一般的にトレーニングデータ数の二乗に比例して計算量が必要となる.音声の諸問題では大量のデータサンプルを用いて処理を行なう必要があり,従来法ような二乗に比例して計算時間を要するアルゴリズムでは適用することが非常に困難である.提案法によって導出されたアルゴリズムでは,トレーニングデータ数に比例する時間で計算が完了することが示されており,音声処理に適した拡張となっている.さらに,提案法は並列化可能なアルゴリズムとなっており,近年のマルチコア/メニーコア環境や,クラウドコンピューティングによる音響モデル学習が容易になっている.提案法はTIMIT音素認識タスクで評価した.TIMIT音素認識タスクで用いられているデータセットは近年の音声認識タスクとしては非常に小さいが,カーネル法をベースとした音声認識タスクでは従来の実験と比べ6倍のサイズにスケールアップすることができた.提案法は従来のさまざまな部分空間法(線形識別分析,Relief特徴選択法)を上回る精度を得られることを確認した.
This year, high-dimensional features, low-degree-of-freedom discriminators, large-scale sound devices, large-scale sound devices, high-dimensional features, low-degree-of-freedom discriminators, high-dimensional features, low-degree-of-freedom discriminators, large-scale mode sounds, high-dimensional features, low-degree-of-freedom discriminators, high-dimensional features, low-degree-of-freedom discriminators, high-dimensional features, low-degree-of-freedom discriminators, large-scale mode sounds, high-dimensional features, low-degree-of-freedom discriminators, high-dimensional features, low-degree-of-freedom discriminators, high-dimensional features, low-degree-of-freedom discriminators, large-scale sound devices, high-dimensional features, low-degree-of-freedom discriminators, high-dimensional features, low-degree-of-freedom discriminators, high- In particular, last year's proposal was made in terms of the number of sound, sound and sound. The modus operandi of the proposal is similar to that of partial space tracking, which is similar to that of precision protection and partial space tracking. In general, it is necessary to calculate the amount of money you need to calculate the quantity. There are a lot of problems with sound and sound. It is very difficult to calculate the time required for the calculation of a large number of sound and sound problems. In the proposed law, it is necessary to calculate the proportion of the number of cars, the proportion of the number of cars, the number of cars, the number of dollars, and the sound of sound. It is possible that the proposed law should be paralleled. In recent years, there has been an increase in the number of people in the environment. In recent years, it is easy to improve the quality of the environment. The proposed method is that TIMIT phonemes and phonemes are very small in recent years, and that they are six times better than those in recent years. The proposed method is used to verify the accuracy of the partial space method (shape analysis, Relief special method).

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Temporal AM-FM combination for robust speech recognition
时域 AM-FM 组合可实现稳健的语音识别
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    3.2
  • 作者:
    Masahiro Yokoyama;Watalu Yamamoto and Kazuyuki Suzuki;鈴木治和;喜多隆;許晋碩;Shigeki Okawa et al. (2/4)
  • 通讯作者:
    Shigeki Okawa et al. (2/4)
隠れマルコフカーネルマシンを用いた系列データの識別とその音素認識タスクへの適用
使用隐马尔可夫核机识别序列数据及其在音素识别任务中的应用
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    久保;渡部;中村;エリック;小林
  • 通讯作者:
    小林
研究成果の一部をオープンソースソフトウェアとして公開した
部分研究成果作为开源软件发布。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
A Sequential Pattern Classifier Based on Hidden Markov Kernel Machines and Its Application to Phoneme Classification
基于隐马尔可夫核机的序列模式分类器及其在音素分类中的应用
音声認識用音響モデル作成装置
用于语音识别的声学模型创建装置
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

久保 陽太郎其他文献

Studies on the variability of sea ice and its effects on ocean circulation
海冰变化及其对海洋环流影响的研究
  • DOI:
    10.5928/kaiyou.27.2_75
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    麻生 英樹;安田 宗樹;前田 新一;岡野原 大輔 岡谷 貴之;久保 陽太郎;ボレガラ ダヌシカ;板場智史;大島 慶一郎
  • 通讯作者:
    大島 慶一郎
韻律条件付言語モデルを用いた音声認識のリスコアリング
使用韵律条件语言模型重新评分语音识别
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    草野 俊一;久保 陽太郎;榑松 明;白井 克彦
  • 通讯作者:
    白井 克彦
静的歪変化を用いた地震規模即時推定
使用静态应变变化进行即时地震规模估计
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    麻生 英樹;安田 宗樹;前田 新一;岡野原 大輔 岡谷 貴之;久保 陽太郎;ボレガラ ダヌシカ;板場智史
  • 通讯作者:
    板場智史
変調特徴量の独立性基準による分解を用いたマルチストリーム音声認識
基于调制特征独立性准则的多流语音识别
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    久保 陽太郎;大川 茂樹;樽松 明;白井 克彦
  • 通讯作者:
    白井 克彦
AMとFMの長時間分析に基づく音声認識
基于AM和FM长期分析的语音识别
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    久保 陽太郎;大川 茂樹;榑松 明;白井 克彦
  • 通讯作者:
    白井 克彦

久保 陽太郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

"Mimicking Human Head Sound Responses": Towards an Anatomically Accurate Head Prototype for Bone Conduction Crosstalk Cancellation Analysis with Humans
“模仿人类头部声音反应”:构建解剖学上准确的头部原型,用于人类骨传导串扰消除分析
  • 批准号:
    24K20786
  • 财政年份:
    2024
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Capturing Oceanic Submesoscales, Stirring and Mixing with Sound and Simulations
通过声音和模拟捕捉海洋亚尺度、搅拌和混合
  • 批准号:
    EP/Y014693/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Research Grant
SBIR Phase II: A Manufacturing Monitoring System Using Sound Spectrograms and Artificial Intelligence
SBIR 第二阶段:使用声谱图和人工智能的制造监控系统
  • 批准号:
    2335395
  • 财政年份:
    2024
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Cooperative Agreement
Capturing Oceanic Submesoscales, Stirring, and Mixing with Sound and Simulations
通过声音和模拟捕捉海洋亚尺度、搅拌和混合
  • 批准号:
    MR/X035611/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Fellowship
Sonorous Landscapes: Using sound and creative design methods to capture and communicate biodiversity in an urban forest
响亮的景观:使用声音和创造性的设计方法来捕捉和传达城市森林中的生物多样性
  • 批准号:
    AH/Z50547X/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Research Grant
CAREER: Statistically-Sound Knowledge Discovery from Data
职业:从数据中发现统计上合理的知识
  • 批准号:
    2238693
  • 财政年份:
    2023
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Continuing Grant
Collaborative Research: A longitudinal approach to examining perception-production links in second language speech sound learning.
协作研究:检查第二语言语音学习中感知-产生联系的纵向方法。
  • 批准号:
    2309561
  • 财政年份:
    2023
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Standard Grant
Development of data-driven multiple sound spot synthesis technology based on deep generative neural network models
基于深度生成神经网络模型的数据驱动多声点合成技术开发
  • 批准号:
    23K11177
  • 财政年份:
    2023
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Measurement of physiological load in online learning and verification of the effect of creating a background sound environment
在线学习生理负荷测量及背景音环境营造效果验证
  • 批准号:
    23K11370
  • 财政年份:
    2023
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
The Role of Speech Perception and Production in Sound Change: A Case Study of Kagoshima Japanese
言语感知和产生在声音变化中的作用:鹿儿岛日本人的案例研究
  • 批准号:
    22KJ3070
  • 财政年份:
    2023
  • 资助金额:
    $ 0.9万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了