自己組織化システムを用いた連続音声の適応的分析・認識に関する研究
自组织系统连续语音自适应分析与识别研究
基本信息
- 批准号:05808031
- 负责人:
- 金额:$ 1.09万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for General Scientific Research (C)
- 财政年份:1993
- 资助国家:日本
- 起止时间:1993 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は、連続音声の適応的分析・認識を目的とした自己組織化情報処理システムの基本アルゴリズム設計と音声入出力を持つUnixシステム上での実現を目指し、基本アルゴリズムでは、新しい時変スペクトル推定の手法の開発を行ない、従来の方法との比較によりその有効性を確認した。また認識部分ではニューラルネットワークで知られている、自己組織化ネットワークを用い、各ノードに高効率のアルゴリズムを導入し、クラスタリング性能や認識性能の向上を考えた。さらに当該年度で、それらの手法を統合し、高度なヒューマンインターフェースをもつソフトウエアシステムとして開発を行なった。本システムの特徴は、従来の方法では難しいとされていた認識の適応性と汎化性を合わせ持つ情報処理システムとして、自己組織化能力を有する適応メディア処理システムを実現していることである。適応性は、音声信号の特徴を獲得するアルゴリズム中に実現し、時変な特徴が精度良く求められることを示した。ここでは、特に時変な特徴とは何か、その表現はどのようにするのが良いか等の、基本的な考え方についても考察し、その成果を幾つかの論文にまとめ発表した。音声の時変分析を行なった後処理として、認識手法の開発も行なった。これは時変な特徴にもっとも適した規範テンプレートを自己組織的に実現する認識システムであり、クラスタリング部では、各規範テンプレート間に適切な位相(距離)を持たせ、汎化能力を向上させた。但し、実験では複数の男性話者に対する母音の認識にとどまっており、子音の認識については現在実験遂行中である。認識システムでの特徴は、時間変動を伴う特徴もクラスタリング可能にするため多層の自己組織化モデルを考えているため、音声が徐々に変化する部分における特徴の認識が効率良く行なわれることが分かったが、そのシステムの特徴をよりよく応用できる認識即ち破裂子音等の分析・認識については現在実験中である。
这项研究旨在设计用于自组织信息处理系统的基本算法,以自适应分析和识别连续语音,并在具有语音输入和输出的Unix系统上实现它们。基本算法开发了一种新的方法来进行时变光谱估计,并通过将其与常规方法进行比较来确认其有效性。此外,在“识别”部分中,使用了一个自组织的网络,以神经网络而闻名,并向每个节点介绍了高效的算法,以改善聚类和识别性能。此外,在这个财政年度,这些方法是由具有先进人界面的软件系统集成和开发的。该系统的一个特征是,它实现了一种自适应媒体处理系统,具有自组织能力作为信息处理系统,该系统结合了适应性和识别的概括,这在常规方法中被认为很困难。在获取语音信号功能的算法中,可以实现适应性,表明需要准确的特征。在这里,我们还研究了基本思想,例如什么是时间变化的功能以及如何表达它们,并在几篇论文中总结了结果。执行时间变化的语音分析后,也开发了一种识别方法作为后处理。这是一个自我组织的识别系统,最适合时变特征的规范模板,并且聚类部分在每个规范模板之间具有适当的阶段(距离),从而提高了概括功能。但是,该实验仅着眼于多个男性扬声器的元音的识别,目前正在进行该实验以识别辅音。识别系统的特征是考虑一个多层的自组织模型,以使功能与时间变化进行聚类,并且发现在语音变化逐渐变化的领域中可以有效地识别功能,但是我们目前正在尝试分析和识别识别识别的识别,即更好地应用该系统的功能。
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Y.Miyanaga,K.Tochinai: "Parallel VLSI architecture for multi-layer self-organizing cellular network" IEICE Trans.Electron.E76-C. 1174-1181 (1993)
Y.Miyanaga,K.Tochinai:“多层自组织蜂窝网络的并行 VLSI 架构”IEICE Trans.Electron.E76-C。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Y.Miyanaga,K.Tochinai: "Multi-layer self-organizing network for clustering and recognition" IEEE Proc.Int.Conf.Neural Network App.to Signal Processing 1993. 1. 376-381 (1993)
Y.Miyanaga,K.Tochinai:“用于聚类和识别的多层自组织网络”IEEE Proc.Int.Conf.Neural Network App.to Signal Processing 1993. 1. 376-381 (1993)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M.Hiroshige,K.Shibata,J.Shimizu,Y.Miyanaga,K.Tochinai: "A recognition system for explosive consonants with self-organized clustering units and neural network" IEEE Proc.Int.Conf.Neural Network App.to Signal Processing 1993. 1. 245-250 (1993)
M.Hiroshige,K.Shibata,J.Shimizu,Y.Miyanaga,K.Tochinai:“具有自组织聚类单元和神经网络的爆炸辅音识别系统”IEEE Proc.Int.Conf.Neural Network App.to Signal
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
T.Sato,H.Ando,Y.Miyanaga: "An efficient highly adaptive two-dimwnsional color sensor system" IEEE Proc.Int.Conf.Neural Network App.to Signal Processing 1993. 1. 144-149 (1993)
T.Sato,H.Ando,Y.Miyanaga:“一种高效的高度自适应二维颜色传感器系统”IEEE Proc.Int.Conf.Neural Network App.to Signal Processing 1993.1.144-149 (1993)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Y.Miyanaga and K.Tochinai: "Design of time-varying ARMA models and its adaptive identification" Trans.IEICE Fundamentals. (印刷中).
Y. Miyanaga 和 K. Tochinai:“时变 ARMA 模型的设计及其自适应识别”Trans.IEICE Fundamentals(正在出版)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
宮永 喜一其他文献
MIMO-OFDM無線通信における信号分離のためのパイプライン型逆行列演算回路のアーキテクチャ検討
MIMO-OFDM无线通信中信号分离的流水线逆矩阵计算电路的体系结构研究
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
今川 隆司;池下 貴大;筒井 弘;宮永 喜一 - 通讯作者:
宮永 喜一
複数解像度・複数フレームレート動画像によるグローバルモーションを用いたフレーム補間手法の性能評価
使用多分辨率和多帧率视频图像的全局运动帧插值方法的性能评估
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
上坂 浩貴;今川 隆司;筒井 弘;宮永 喜一 - 通讯作者:
宮永 喜一
高解像度動画像及び高フレームレート動画像を用いたフレーム補間手法の精度評価
使用高分辨率视频和高帧率视频的帧插值方法的精度评估
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
上坂 浩貴;今川 隆司;筒井 弘;宮永 喜一 - 通讯作者:
宮永 喜一
並列度可変なMin-Sum LDPC復号器とそのメモリバンクアクセススケジューリング手法
可变并行最小和LDPC译码器及其存储体访问调度方法
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
渡辺 大詩;筒井 弘;今川 隆司;宮永 喜一 - 通讯作者:
宮永 喜一
グローバルモーション推定と背景差分法による動領域検出における縮小画像を用いた計算量削減
在使用背景减法的全局运动估计和动态区域检测中使用缩小图像来减少计算量
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
鴻上 慎吾;今川 隆司;筒井 弘;宮永 喜一 - 通讯作者:
宮永 喜一
宮永 喜一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('宮永 喜一', 18)}}的其他基金
ガボール変換を用いた時変信号処理に関する研究
Gabor变换时变信号处理研究
- 批准号:
08878040 - 财政年份:1996
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Exploratory Research
自己組織化ネットワークによる時変な特徴の認識に関する研究
自组织网络时变特征识别研究
- 批准号:
07808037 - 财政年份:1995
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
時変な特徴の高精度推定と認識に関する研究
时变特征的高精度估计与识别研究
- 批准号:
06808032 - 财政年份:1994
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
実時間学習・推論を可能とする並列適応クラスタリングに関する研究
实现实时学习和推理的并行自适应聚类研究
- 批准号:
02650252 - 财政年份:1990
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
時変モデルの特徴認識に関する研究
时变模型特征识别研究
- 批准号:
01750309 - 财政年份:1989
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
信号処理用エキスパートシステムに関する研究
信号处理专家系统研究
- 批准号:
63750340 - 财政年份:1988
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
高精度スペクトル推定の並列処理に関する研究
高精度谱估计并行处理研究
- 批准号:
62750307 - 财政年份:1987
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
適応的手法を用いた音声信号の特徴抽出に関する研究
自适应方法的语音信号特征提取研究
- 批准号:
61750312 - 财政年份:1986
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
調音の構造的分析による東北方言音声の通時的変化の解明-30年前の全域調査との比較-
通过发音结构分析阐明东北方言语音的历时变化 - 与 30 年前全国调查的比较 -
- 批准号:
24K03909 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a Piezoelectric Intramedullary Nail for Enhanced Fracture Healing
开发用于增强骨折愈合的压电髓内钉
- 批准号:
10759862 - 财政年份:2023
- 资助金额:
$ 1.09万 - 项目类别:
Neurocognitive Foundations of Morphological Processing in Children with Dyslexia
阅读障碍儿童形态处理的神经认知基础
- 批准号:
10538156 - 财政年份:2023
- 资助金额:
$ 1.09万 - 项目类别:
Sensing Technologies for maternal depression treatment in low resource settings (StandStrong)
资源匮乏地区孕产妇抑郁症治疗的传感技术 (StandStrong)
- 批准号:
10857727 - 财政年份:2023
- 资助金额:
$ 1.09万 - 项目类别:
Multimodal dMRI, MRS and MEG studies of language impairment in low-verbal ASD
低语言 ASD 语言障碍的多模态 dMRI、MRS 和 MEG 研究
- 批准号:
10636420 - 财政年份:2023
- 资助金额:
$ 1.09万 - 项目类别: