音響信号の振幅位相関係を考慮した複素スペクトル領域音声強調と応用
考虑声信号幅相关系的复谱域语音增强及其应用
基本信息
- 批准号:20K19827
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は,音響信号の周波数解析によって得られる振幅スペクトルと位相スペクトルの関連性を考慮した音響信号強調手法の基礎理論構築とその他の音響信号処理への応用である.従来の研究では,音響信号の時間周波数解析に基づき,振幅・位相という二つのスペクトルの挙動を利用して各種信号処理の理論・アルゴリズムの構築がなされる.本研究ではこれら二つのスペクトルに深い関連があることに着目した信号処理の理論構築と実験を行うものである.第三年度では,第二年度で行った時間・周波数領域における振幅と位相の統計的挙動の関係性を深層学習に応用させた取り組みを発展させた.本取り組みでは,深層学習と典型的な最適化手法とを組み合わせることで,最新の従来研究よりも振幅スペクトを利用した位相スペクトルの推定性能が改善することを客観指標と被験者を募って行った聴取実験の両結果から確認し,国内会議(日本音響学会秋季研究発表会)にて発表した.さらに,この結果をまとめ,音響信号処理のトップジャーナルであるIEEE Trans. ASLPに投稿し,査読中である.また,深層学習への応用という点において,別の観点からの研究を展開させた.具体的には,位相スペクトルの符号不確定性という問題に新たに着目し,定式化を行うことで,深層学習に適用し解決を行った.不確定性問題を深層学習の学習に取り込むことで,位相スペクトルの推定性能に改善が見られ,この問題提起が有用であることを示した.この結果は国際学会APSIPAへ投稿し,採択された.
The purpose of this study is to construct the basic theory of acoustic signal emphasis method and its application in the analysis of frequency of acoustic signal. In recent years, the study of acoustic signal time cycle number analysis is based on the analysis of amplitude, phase and motion, and the use of various signal processing theory, classification and construction. In this paper, we focus on the theoretical construction and implementation of signal processing. The third year, the second year, the time, the number of cycles, the amplitude, the phase, the statistical relationship, the deep learning, the selection, the development. This paper presents the results of deep learning and typical optimization techniques, and the latest research on the improvement of estimation performance of amplitude selection by using phase selection. The results are presented at a domestic conference (Autumn Research Conference of Japan Sound Society). The results of this study are presented in IEEE Trans. ASLP. Deep learning is the key to success, and research is the key to success. Specific, phase, symbol uncertainty, new, formalized, deep learning, applicable. Uncertain problem: deep learning, phase selection, estimation performance improvement, problem raising, usefulness, etc. The results were submitted to the APSIPA International Society, and the results were collected.
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Maximum likelihood estimation for phase reconstruction from its derivatives
根据其导数进行相位重建的最大似然估计
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:NGUYEN Binh Thien;Yukoh Wakabayashi;Kenta Iwai;Takanobu Nishiura
- 通讯作者:Takanobu Nishiura
Von Mises Mixture Model-Based DNN for Sign Indetermination Problem in Phase Reconstruction
基于 Von Mises 混合模型的 DNN 解决相位重建中的符号不确定问题
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Binh Thien Nguyen;Yukoh Wakabayashi;Yuting Geng;Kenta Iwai and Takanobu Nishiura
- 通讯作者:Kenta Iwai and Takanobu Nishiura
Two-stage phase reconstruction using inter-frequency phase difference
利用频间相位差的两级相位重构
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Binh Thien NGUYEN;Yukoh Wakabayashi;Yuting GENG;Kenta Iwai;Takanobu Nishiura
- 通讯作者:Takanobu Nishiura
Analysis of derivative of instantaneous frequency and its application to voice activity detection
瞬时频率导数分析及其在语音活动检测中的应用
- DOI:10.1016/j.apacoust.2021.108116
- 发表时间:2021
- 期刊:
- 影响因子:3.4
- 作者:Binh Thien NGUYEN;Yukoh WAKABAYASHI;Kenta IWAI;and Takanobu NISHIURA
- 通讯作者:and Takanobu NISHIURA
円周上の音場補間を利用した移動音源のステアリングベクトル推定
使用圆周声场插值估计运动声源的转向矢量
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Akira Sakuraba;Yoshia Saito;Jun Hakura;Yoshikazu Arai;Yoshitaka Shibata;若林佑幸,山岡洸瑛,小野順貴
- 通讯作者:若林佑幸,山岡洸瑛,小野順貴
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
若林 佑幸其他文献
自動生成型音響モデルに基づく室内環境音識別のための未知音源クラスタリングの性能評価
基于自动生成声学模型的室内环境声识别未知声源聚类性能评估
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
美島 咲子;若林 佑幸;福森 隆寛;井本 桂右;中山 雅人;西浦 敬信 - 通讯作者:
西浦 敬信
分散マイクロホンアレイにおけるDOAパーミュテーションの反復更新による複数音源定位
通过迭代更新分布式麦克风阵列中的 DOA 排列来实现多声源定位
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
田中 一希;若林 佑幸;小野 順貴;宮崎 亮一 - 通讯作者:
宮崎 亮一
音光変換デバイス「ブリンキー」による音高のリアルタイム可視化
使用声光转换装置“Blinky”实时可视化音高
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
石井 奏人;堀池 大樹;シャイブラー ロビン;若林 佑幸;小野 順貴 - 通讯作者:
小野 順貴
若林 佑幸的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('若林 佑幸', 18)}}的其他基金
複素スペクトル領域での振幅位相関係に基づく新たな音響信号処理の創出
基于复谱域中的幅相关系创建新的声学信号处理
- 批准号:
24K20838 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
残響・雑音環境下における多人数会話の話者ダイアライゼーションの研究
混响噪声环境下多人对话说话人分类研究
- 批准号:
16J07584 - 财政年份:2016
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
UK involvement in LSST: Phase C (Imperial component)
英国参与 LSST:C 阶段(帝国部分)
- 批准号:
ST/X001326/1 - 财政年份:2025
- 资助金额:
$ 2.66万 - 项目类别:
Research Grant
Phase 2 - Effective and Integrated Chemical Free Robotic Milking
第 2 阶段 - 有效且集成的无化学品机器人挤奶
- 批准号:
10093094 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Collaborative R&D
Net Zero Pathfinder - Phase 2 Manchester
净零探路者 - 第二阶段曼彻斯特
- 批准号:
10095254 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Demonstrator
Phase Averaged Deferred Correction for Multi-Timescale Systems
多时间尺度系统的相位平均延迟校正
- 批准号:
EP/Y032624/1 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Research Grant
Model order reduction for fast phase-field fracture simulations
快速相场断裂模拟的模型降阶
- 批准号:
EP/Y002474/1 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Research Grant
IUCRC Phase I University of Wisconsin-Milwaukee: Center for Concrete Advancement Network (CAN), Lead Site
IUCRC 第一阶段威斯康星大学密尔沃基分校:混凝土进步网络中心 (CAN),主要站点
- 批准号:
2310861 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Continuing Grant
IUCRC Phase III University of Colorado Boulder: Center for Membrane Applications, Science and Technology (MAST)
IUCRC 第三阶段科罗拉多大学博尔德分校:膜应用、科学与技术中心 (MAST)
- 批准号:
2310937 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Continuing Grant
SBIR Phase II: Innovative Two-Phase Cooling with Micro Closed Loop Pulsating Heat Pipes for High Power Density Electronics
SBIR 第二阶段:用于高功率密度电子产品的创新两相冷却微闭环脉动热管
- 批准号:
2321862 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Cooperative Agreement
SBIR Phase I: Industrial-Scale Technology for Drug Development in Mature Human Fat Cells
SBIR 第一阶段:成熟人类脂肪细胞药物开发的工业规模技术
- 批准号:
2322443 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Standard Grant
STTR Phase II: Fabrication and Structural Testing of a 3D Concrete Printed Anchor for Floating Offshore Wind
STTR 第二阶段:用于浮动海上风电的 3D 混凝土打印锚的制造和结构测试
- 批准号:
2333306 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Cooperative Agreement