時変な特徴の高精度推定と認識に関する研究

时变特征的高精度估计与识别研究

基本信息

  • 批准号:
    06808032
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

1.最初に適応的な時変音声スペクトルの推定アルゴリズムを開発するため、その第1段階として、新しい時変確率モデルを設計した。このモデルは、音声の生成モデルにかなり忠実なモデルとして定義し、音声の有声音と無声音を区別して分析できるように構築されている。また推定モデルの設計と同時に推定手法も同時に開発し、両者を合わせる事で、無理のない時変性の特徴表現ができ、その推定も可能である事も示した。2.次に音声の認識のために、時間変動も考慮する自己組織化ニューラルネットワークを設計した。自己組織化を行なう認識システムは、最初の段階で入力された特徴量をある距離に従って、自動的にクラスタリングする。ここでの特徴データは時間的に変動するスペクトルや波形のエネルギーを考えた。そこである程度の時間幅を持たせたデータセットを処理対象として、これを時間領域のマルコフ性を表現できる多層のクラスタリングネットワークによって自己組織化し、クラスタリングを行った。このクラスタリングは時間の変動に追従でき、さらに学習データに対して誤認識を生じさせない程度にクラスタの生成・融合・消滅を行なえるような評価基準をもたせている。その結果として未知データに対する汎化能力を向上させた。実験の結果、学習に要する時間をかなり短くしても、従来の認識方法と同程度の認識結果を得た。3.導入された設備を利用して連続音声認識の実験を行なった。ここでは、特に学習のデータの正当性を厳しくチェックするために、2次元の時間とスペクトル空間の図形表示が必要になった。そのため、MATLABと関連のソフトウエアツールにより効率よく表示が可能となり、またその評価を最終的には人手によりチェックし、良好な学習データを作成できた。これにより、一般的に使われているATRの音声データを使っての、不特定話者認識は、少ないデータセットに関わらず/b,g,d/に関して、およそ87%となり、従来の手法でもっとも認識率の高い方法として考えられている方法と同程度の認識率を得ている。さらに、従来法に比べ学習の速度が数百倍以上速くなる事を確認した。
1. When the first に optimum 応 な - sounds ス ペ ク ト ル の presumption ア ル ゴ リ ズ ム を open 発 す る た め, そ の paragraph 1 order と し て, new し い - when probabilistic モ デ ル を design し た. こ の モ デ ル は, sounds の generated モ デ ル に か な り loyalty be な モ デ ル と し て definition し, sounds の a voice no sound を と difference し て analysis で き る よ う に build さ れ て い る. Presumption ま た モ デ ル の designed と presumption に gimmick も に open 発 し, who struck を わ せ で る, unreasonable の な い - sex の 徴 performance especially when が で き, そ の presumption も may で あ る matter も shown し た. 2. For the に sound, recognize the ために, consider the time variation <e:1>, organize the する by yourself, ニュ ラ ラ, ネットワ ネットワ, を を, を, and design the た. Their organizational line を な う know シ ス テ ム は, initially の Duan Jie で さ into force れ た, 徴 quantity を あ る distance に 従 っ て, automatic に ク ラ ス タ リ ン グ す る. こ こ で の, 徴 デ ー タ は time に - move す る ス ペ ク ト ル や waveform の エ ネ ル ギ ー を exam え た. そ こ で あ る の time picture を hold た せ た デ ー タ セ ッ ト を 処 reason like と seaborne し て, こ れ を time domain の マ ル コ フ sex を performance で き る multilayer の ク ラ ス タ リ ン グ ネ ッ ト ワ ー ク に よ っ て yourself organized し, ク ラ ス タ リ ン グ を line っ た. こ の ク ラ ス タ リ ン グ は time の - move に chase 従 で き, さ ら に learning デ ー タ に し seaborne て mistake understanding born を じ さ せ な い degree に ク ラ ス タ の line generated, fusion, eliminate を な え る よ う な evaluation benchmark 価 を も た せ て い る. Youdaoplaceholder0 そ the result is と て て unknown デ そ タに タに the generalization ability of する is を upward させた. Be 験 の results, learning に す る time を か な り short く し て も, 従 の knoweth method with degree の と results を た. 3. Import the された device を and use the <s:1> て to connect the 続 sound to recognize the <s:1> experiment を line なった. こ こ で は, に learning の デ ー タ の legitimacy を 厳 し く チ ェ ッ ク す る た め に, 2 yuan の time と ス ペ ク ト ル space の 図 form said が necessary に な っ た. そ の た め, MATLAB と masato even の ソ フ ト ウ エ ア ツ ー ル に よ り sharper rate よ く says が may と な り, ま た そ の review 価 を final に は manpower に よ り チ ェ ッ ク し, good study な デ ー タ を made で き た. こ れ に よ り, general に わ れ て い る ATR の sounds デ ー タ を make っ て の, no specific words know は, less な い デ ー タ セ ッ ト に masato わ ら ず / b, g, d / に masato し て, お よ そ 87% と な り, 従 to の で も っ と も know rate high い の way と し て exam え ら れ て い る method と を の know rate to the same extent て い る. Youdaoplaceholder0 and 従 come to France に to learn が at a speed が hundreds of times faster than べ くなる events を confirm た た.

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Yisheng Li,Yoshikazu Miyanaga and Koji Tochinai: "Dynamics learning network with structured recurrent modules" Proceedings of ISPACS'94. 1. 93-97 (1994)
Li Yisheng Li、Yoshikazu Miyanaga 和 Koji Tochinai:“具有结构化循环模块的动态学习网络”ISPACS94 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Jun'ya Shimizu,Yoshikazu Miyanaga, and Koji Tochinai: "Consideration on decimation factors in multirate adaptive filtering for a time-varying AR model" Proceedings of APCCAS'94. 1. 358-362 (1994)
Junya Shimizu、Yoshikazu Miyanaga 和 Koji Tochinai:“时变 AR 模型的多速率自适应滤波中的抽取因子的考虑”APCCAS94 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Yisheng Li,Yoshikazu Miyanaga,andKoji Tochinai: "A module structured recurrent neural network capable of memorizing and regenerating dynamics" Proceedings of APCCAS'94. 1. 8-12 (1994)
Li Yisheng Li、Yoshikazu Miyanaga 和 Koji Tochinai:“能够记忆和再生动力学的模块结构循环神经网络”APCCAS94 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Y.Miyanaga and K.Tochinai: "Design of time-varying ARMA models and its adaptive identification" Trans.IEICE Fundamentals. E77-A. 760-770 (1994)
Y.Miyanaga 和 K.Tochinai:“时变 ARMA 模型的设计及其自适应识别”Trans.IEICE 基础知识。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Eisuke Horita,Yoshikazu Miyanaga,Koji Tochinai: "A time-varying analysis based on analytic speech sugnals" Proceedings of ICSLP'94. S27-13. 1631-1634 (1994)
Eisuke Horita、Yoshikazu Miyanaga、Koji Tochinai:“基于分析语音信号的时变分析”ICSLP94 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

宮永 喜一其他文献

MIMO-OFDM無線通信における信号分離のためのパイプライン型逆行列演算回路のアーキテクチャ検討
MIMO-OFDM无线通信中信号分离的流水线逆矩阵计算电路的体系结构研究
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    今川 隆司;池下 貴大;筒井 弘;宮永 喜一
  • 通讯作者:
    宮永 喜一
複数解像度・複数フレームレート動画像によるグローバルモーションを用いたフレーム補間手法の性能評価
使用多分辨率和多帧率视频图像的全局运动帧插值方法的性能评估
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上坂 浩貴;今川 隆司;筒井 弘;宮永 喜一
  • 通讯作者:
    宮永 喜一
並列度可変なMin-Sum LDPC復号器とそのメモリバンクアクセススケジューリング手法
可变并行最小和LDPC译码器及其存储体访问调度方法
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    渡辺 大詩;筒井 弘;今川 隆司;宮永 喜一
  • 通讯作者:
    宮永 喜一
高解像度動画像及び高フレームレート動画像を用いたフレーム補間手法の精度評価
使用高分辨率视频和高帧率视频的帧插值方法的精度评估
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上坂 浩貴;今川 隆司;筒井 弘;宮永 喜一
  • 通讯作者:
    宮永 喜一
KLT法に基づくグローバルモーション推定と背景差分法による動領域検出における縮小画像を用いた計算量削減
在基于KLT方法的全局运动估计和使用背景减法的动态区域检测中使用缩小图像来减少计算量
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鴻上 慎吾;今川 隆司;筒井 弘;宮永 喜一
  • 通讯作者:
    宮永 喜一

宮永 喜一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('宮永 喜一', 18)}}的其他基金

ガボール変換を用いた時変信号処理に関する研究
Gabor变换时变信号处理研究
  • 批准号:
    08878040
  • 财政年份:
    1996
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
自己組織化ネットワークによる時変な特徴の認識に関する研究
自组织网络时变特征识别研究
  • 批准号:
    07808037
  • 财政年份:
    1995
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
自己組織化システムを用いた連続音声の適応的分析・認識に関する研究
自组织系统连续语音自适应分析与识别研究
  • 批准号:
    05808031
  • 财政年份:
    1993
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
実時間学習・推論を可能とする並列適応クラスタリングに関する研究
实现实时学习和推理的并行自适应聚类研究
  • 批准号:
    02650252
  • 财政年份:
    1990
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
時変モデルの特徴認識に関する研究
时变模型特征识别研究
  • 批准号:
    01750309
  • 财政年份:
    1989
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
信号処理用エキスパートシステムに関する研究
信号处理专家系统研究
  • 批准号:
    63750340
  • 财政年份:
    1988
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
高精度スペクトル推定の並列処理に関する研究
高精度谱估计并行处理研究
  • 批准号:
    62750307
  • 财政年份:
    1987
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
適応的手法を用いた音声信号の特徴抽出に関する研究
自适应方法的语音信号特征提取研究
  • 批准号:
    61750312
  • 财政年份:
    1986
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

ニューラルネットワークの内容可視化に基づく革新的なA I教育支援ツールの開発
基于神经网络内容可视化的创新AI教育支持工具开发
  • 批准号:
    24K06368
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
畳み込みニューラルネットワークによる静電インクジェット印刷特性予測
使用卷积神经网络预测静电喷墨打印特性
  • 批准号:
    24K17547
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
解釈可能な非線形積分ニューラルネットワークの理論と実装
可解释非线性积分神经网络的理论与实现
  • 批准号:
    24K06868
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
積型ニューラルネットワーク深層学習による数値解析的アルゴリズムの解析と創出
使用产品神经网络深度学习分析和创建数值分析算法
  • 批准号:
    24K00540
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ホログラフィック光学素子を利用した光回折ニューラルネットワークの波長多重化
使用全息光学元件的光学衍射神经网络的波长复用
  • 批准号:
    24K20865
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自己増殖型ニューラルネットワークに基づく自律ロボットのための適応型知覚システム
基于自传播神经​​网络的自主机器人自适应感知系统
  • 批准号:
    24K20870
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
時間領域論理の導入による超高速かつ超効率動作が可能な超伝導ニューラルネットワーク
引入时域逻辑实现超高速、超高效运行的超导神经网络
  • 批准号:
    24KJ1148
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
医用画像診断深層ニューラルネットワークの信頼性・安全性確保のための計算手法開発
开发计算方法以确保深度神经网络用于医学图像诊断的可靠性和安全性
  • 批准号:
    23K21719
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
空間構造の導入とタンパク質変異体創出を介した細胞ニューラルネットワークの高度化
通过引入空间结构和创建蛋白质变体来复杂化细胞神经网络
  • 批准号:
    24K03036
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
錐計画に基づく再帰型ニューラルネットワークの安定性解析と最適設計
基于锥规划的循环神经网络稳定性分析与优化设计
  • 批准号:
    23K20949
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了