統計的手法を用いた知識情報モデルに基づく知的信号処理手法に関する研究
利用统计方法研究基于知识信息模型的智能信号处理方法
基本信息
- 批准号:17656128
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2007
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
(1)繰り返し発声の統合手法の研究 通信路においてパケットロスが生じた場合でも,同一話者が「く_いわ,くろ_わ,_ろいわ」(_がパケットロスし失われた音節と仮定)と繰り返し発声した音声を用い音声を復元,認識する手法の研究開発を行った。日常会話中から繰り返し発声を高精度で検出する手法としては,HMMよりもDPマッチングが有効であることを明らかとした。また,複数の発声を統合する際に生じる不連続性を低減するために,音声スペクトルを包絡情報と音源情報に分離した上で包絡情報を中心に統合を行う手法を開発した。擬似日常会話音声データによる実験により開発手法の有効性を確認した。(2)音声の広帯域化手法の研究 帯域制限された音声を音声認識することで,音素状態を推定し,さらに推定された音素状態から高域のスペクトルを推定し,元の音声と統合することで広帯域音声を作成する手法を開発・改良した。改良点のうち特に音質改善に有効だったのは,音源情報と包絡情報の分離を行うこと,及び,音源情報の広帯域化を行うことであった。新聞読み上げ発声により開発手法の有効性を確認した。(3)音声の話者内変動の調査と話者性抽出法の研究 音声欠落部に合成音声を補間した場合の違和感を低減させる研究の一環として,同一話者の音声がどの程度ばらつくかを音声認識率の変動という観点から調査した。さらに,本人の気分や周囲の環境により音声がどのように変動するかを調査した。また,話者認識実験(気道音と骨導音の両方を利用)を通じ話者性がどのような特徴空間に現れるかを検討した。
(1)关于重复语音的综合方法的研究,即使在通信渠道中发生数据包丢失,我们已经研究并开发了一种使用相同的扬声器恢复和识别声音的方法,反复说出“ ku_iwa,kuro_iwa,roiwa,roiwa”(假设_是数据包丢失,并且丢失了);据透露,DP匹配比HMM更有效,这是一种以高精度在日常对话中反复演讲的方法。此外,为了减少整合多个语音时发生的不连续性,已经开发了一种方法将语音频谱分离为信封信息和声音源信息,然后集成了以此为中心的信封信息。通过使用伪每日语音音频数据实验证实了开发方法的有效性。 (2)对宽带语音方法的研究,我们通过识别带有限制的语音来开发并改善了一种产生宽带语音的方法,该语音估计了音素状态,并进一步估算了估计的音素状态的高频频谱,并将其与原始语音集成在一起,以创建宽带语音。在改进中,改善声音质量的最有效点是将声源信息和信封信息分开,并扩大声音源信息。大声报纸证实了开发方法的有效性。 (3)研究语音内扬声器的变化和说话者提取的研究作为研究的一部分,以减少综合语音插值到缺失部分时,我们研究了同一说话者的语音因语音识别率的变化的角度而变化的程度。此外,我们研究了声音如何根据人的心情和周围环境而变化。此外,使用说话者识别实验(使用气道声音和骨传导声音)来检查说话者的性质出现的特征空间。
项目成果
期刊论文数量(21)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Effects of Phoneme Type and Frequency on Distributed Speaker Identification and Verification
音素类型和频率对分布式说话人识别和验证的影响
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:Mohamed Abdel Fattah;Fuji Ren;Shingo Kuroiwa
- 通讯作者:Shingo Kuroiwa
IEEE NLP-KE2007
IEEE NLP-KE2007
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Shinsuke Hara;Hiroyuki Yomo;Petar Popovski;Kazunori Hayashi;Takanori Hirai
- 通讯作者:Takanori Hirai
Phoneme Based Speaker Modeling to Improve Speaker Recognition.
基于音素的说话人建模可提高说话人识别能力。
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:亀井美里;村越昭彦;塚本勝俊;小牧省三;原一 眞;Shingo Kuroiwa;黒岩 眞吾;柘植 覚;Mohamed Abdel Fattah;Shunji Mitsuyoshi;黒岩 眞吾;Mohamed Abdel Fattah;黒岩 眞吾;Mohamed Abdel Fattah
- 通讯作者:Mohamed Abdel Fattah
Non-Verbal Voice Emotion Analysis System
非语言语音情感分析系统
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:黒岩眞吾;小林邦嘉;柘植覚;任福継;Andrei Doncescu;Hidetomo Nabeshima;Mohamed Abdel Fattah;Katsumi Inoue;Katsumi Inoue;Katsumi Inoue(Hidetomo Nabeshima);Hua Xiang;Haiqing Hu;Koji Iwanuma;Shunji Mitsuyoshi
- 通讯作者:Shunji Mitsuyoshi
骨導音と気導音を併用した話者識別手法
骨导声和气导声的说话人识别方法
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:S. Nakagawa;S. Togashi;M. Yamaguchi;Y. Fujii N. Kitaoka;柘植 覚
- 通讯作者:柘植 覚
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
黒岩 眞吾其他文献
簡易 AAC アプリ『 スイッチボイス 』の開発
开发简单的AAC应用程序“Switch Voice”
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
古川 大輔;村西 幸代;石畑 恭平;森本 暁彦;黒岩 眞吾 - 通讯作者:
黒岩 眞吾
Rapid Synthesis of Domain-specific Web Search Engines based on Semi-automatic Training-example Generation
基于半自动训练实例生成的特定领域网络搜索引擎的快速合成
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
柘植覚;黒岩眞吾;獅々堀正幹;任福継;北研二;Oliver Ray;松本 和幸;Koji Iwanuma;Hua Xiang;原一 眞;Shingo Kuroiwa;Oliver Ray;Andrei Doncescu;Mohamed Abdel Fattah;Hidetomo Nabeshima;黒岩 眞吾;Katsumi Inoue;柘植 覚;Andrei Doncescu;Hua Xiang;Hidetomo Nabeshima - 通讯作者:
Hidetomo Nabeshima
Improved Semantic Similarity Computation in Question-Answering System
问答系统中改进的语义相似度计算
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Xin Zhao;Fuji Ren;Shingo Kuroiwa;Mohamed Abdel Fattah;黒岩 眞吾;Qiong Liu;Mohamed Abdel Fattah;Shunji Mitsuyoshi;Peilin Jiang - 通讯作者:
Peilin Jiang
ICTを活用した失語症者支援:タブレットとロボットを用いたコミュニケーション支援・訓練システム
使用ICT支持失语症患者:使用平板电脑和机器人的通信支持和培训系统
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
I. Suga;R. Yasuhara;M. Inoue and T. Kosaka;丹野遼平,藤原克哉,水戸部一孝;黒岩 眞吾 - 通讯作者:
黒岩 眞吾
ICT 機器による言語訓練の可能性を考える ― ICT ロボットによる言語訓練の試み ―
考虑使用ICT设备进行语言训练的可能性 - 使用ICT机器人进行语言训练的尝试 -
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
村西 幸代;古川 大輔;石畑 恭平;森本 暁彦;黒岩 眞吾 - 通讯作者:
黒岩 眞吾
黒岩 眞吾的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('黒岩 眞吾', 18)}}的其他基金
局所的な差異も説明可能な法科学向け深層話者照合モデルの構築
为法医科学构建可以解释局部差异的深度说话人匹配模型
- 批准号:
24K14988 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Deep neural network model for anomic aphasia and the recovery process
失语症的深度神经网络模型及其恢复过程
- 批准号:
20K11860 - 财政年份:2020
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
- 批准号:
23K16944 - 财政年份:2023
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Spoken Language Acquisition Agent with Fluent Intonation
语调流利的口语习得代理
- 批准号:
22K12069 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
発声運動学習が音声認識学習に与える影響に関する計算言語学的研究
发声运动学习对语音识别学习影响的计算语言学研究
- 批准号:
21K17805 - 财政年份:2021
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Optimizing the Difficulty Level of Shadowing Materials by Utilizing Speech Recognition and Speech Synthesis
利用语音识别和语音合成优化阴影材料的难度级别
- 批准号:
19K00788 - 财政年份:2019
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Detection of synthetic voice and character identification for estimation of products.
检测合成语音和字符识别以评估产品。
- 批准号:
18H01671 - 财政年份:2018
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)