残響・雑音環境下における多人数会話の話者ダイアライゼーションの研究
混响噪声环境下多人对话说话人分类研究
基本信息
- 批准号:16J07584
- 负责人:
- 金额:$ 0.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2016
- 资助国家:日本
- 起止时间:2016-04-22 至 2018-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
平成29年度では、位相復元による話者ダイアライゼーションへの応用を目指し、前年度において確立した音声の位相復元アルゴリズムを複数チャネル処理に拡張した。これと並行して、前年度の成果を改善するために単一チャネル音声強調のアルゴリズム改善にも取り組んだ。複数チャネル拡張では、単一チャネルアルゴリズムを残響・雑音下において収録された複数チャネル音声に適用し、強調された音声を用いて音源定位することで、音空間情報の性能を評価した。複数チャネル拡張により話者ダイアライゼーションの手がかりとなる音空間情報の耐雑音性能が改善することを確認した。特に、雑音による音空間情報の歪みを抑圧することができた。一方、改善性能は環境に依存することも明らかになった。この研究は音響学会や電子情報通信学会で発表し、信号処理や音響処理の分野の研究者からの多大な御意見やアドバイスをいただいた。拡張手法の改善が今後の課題である。単一チャネル音声強調のアルゴリズム改善では、今まで独立に行われてきた音声の振幅と位相の両復元を関連付け、新しい音声強調アルゴリズムの構築を行った。具体的には、従来研究でよく知られた振幅に関する評価関数に、位相に関する条件を付与した新たな評価関数の最適化を行うことで実現した。前述の取り組みと同様、音響学会や電子情報通信学会で発表し、今後の方針についての議論を進めることができた。また、前年度の成果である単一チャネル位相復元に関する論文が世界的に著名な学会論文誌であるIEEEジャーナルに受理され、前年度の研究の正当性が認められた。
In 2009, the number of people who were born in China was increased by 10%, and the number of people who were born in China was increased by 10%. The results of the previous year were improved, and the results of the previous year were improved. Multiple sound generation, single sound generation. It is confirmed that the sound resistance of the sound spatial information is improved by the user's hand. Special, sound, spatial information and the right to choose between them. One side, improve performance depends on the environment. This research is conducted by the Institute of Acoustics and the Institute of Electronic Information and Communication, and by researchers in the field of signal processing and audio processing. How to improve the method of opening and closing? The amplitude and phase of sound are correlated with each other, and the structure of sound is improved independently. The specific conditions for the study of amplitude, phase and optimization of new evaluation parameters are presented. The aforementioned group discussion, the sound society and the electronic information communication society, and the future policy discussion The results of the previous year's research were accepted by the IEEE and the legitimacy of the previous year's research was recognized.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Application of Phase Reconstruction to Speech Enhancement and Source Localization for Hearable Devices
相位重建在可听设备语音增强和源定位中的应用
- DOI:
- 发表时间:2017
- 期刊:
- 影响因子:0
- 作者:Yukoh Wakabayashi;Takahiro Fukumori;Masato Nakayama;Takanobu Nishiura;and Yoichi Yamashita
- 通讯作者:and Yoichi Yamashita
位相スペクトルを利用した振幅スペクトル推定による音声強調の検討
利用相位谱估计幅度谱的语音增强研究
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Yukoh Wakabayashi;Takahiro Fuumori;Masato Nakayama;Takanobu Nishiura and Yoich Yamashita;若林 佑幸,中山 雅人,西浦 敬信;若林 佑幸,中山 雅人,西浦 敬信
- 通讯作者:若林 佑幸,中山 雅人,西浦 敬信
Single-Channel Speech Enhancement with Phase Reconstruction Based on Phase Distortion Averaging
基于相位失真平均的相位重建单通道语音增强
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Yukoh Wakabayashi;Takahiro Fukumori;Masato Nakayama;Takanobu Nishiura and Yoichi Yamashita
- 通讯作者:Takanobu Nishiura and Yoichi Yamashita
位相復元が音源定位手法に与える影響の基礎的調査
相位恢复对声源定位方法影响的基础研究
- DOI:
- 发表时间:2017
- 期刊:
- 影响因子:0
- 作者:若林佑幸;福森隆寛;中山雅人;西浦敬信;山下洋一;若林佑幸,福森隆寛,中山雅人,西浦敬信,山下洋一
- 通讯作者:若林佑幸,福森隆寛,中山雅人,西浦敬信,山下洋一
位相歪み特徴量を用いた音声強調のための位相復元
使用相位失真特征进行语音增强的相位恢复
- DOI:
- 发表时间:2016
- 期刊:
- 影响因子:0
- 作者:若林佑幸;福森隆寛;中山雅人;西浦敬信;山下洋一
- 通讯作者:山下洋一
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
若林 佑幸其他文献
自動生成型音響モデルに基づく室内環境音識別のための未知音源クラスタリングの性能評価
基于自动生成声学模型的室内环境声识别未知声源聚类性能评估
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
美島 咲子;若林 佑幸;福森 隆寛;井本 桂右;中山 雅人;西浦 敬信 - 通讯作者:
西浦 敬信
分散マイクロホンアレイにおけるDOAパーミュテーションの反復更新による複数音源定位
通过迭代更新分布式麦克风阵列中的 DOA 排列来实现多声源定位
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
田中 一希;若林 佑幸;小野 順貴;宮崎 亮一 - 通讯作者:
宮崎 亮一
音光変換デバイス「ブリンキー」による音高のリアルタイム可視化
使用声光转换装置“Blinky”实时可视化音高
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
石井 奏人;堀池 大樹;シャイブラー ロビン;若林 佑幸;小野 順貴 - 通讯作者:
小野 順貴
若林 佑幸的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('若林 佑幸', 18)}}的其他基金
複素スペクトル領域での振幅位相関係に基づく新たな音響信号処理の創出
基于复谱域中的幅相关系创建新的声学信号处理
- 批准号:
24K20838 - 财政年份:2024
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
音響信号の振幅位相関係を考慮した複素スペクトル領域音声強調と応用
考虑声信号幅相关系的复谱域语音增强及其应用
- 批准号:
20K19827 - 财政年份:2020
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
相似海外基金
ミリ波偏光観測ための焦点面検出器を備えた広視野望遠鏡の開口位相復元法の開発
毫米波偏振观测焦平面探测器孔径相位恢复方法研制
- 批准号:
23K25889 - 财政年份:2024
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (B)