聴覚末梢系数理モデルを用いた嗄声の音響学的特徴の解明
使用听觉外围系统的数学模型阐明声音嘶哑的声学特征
基本信息
- 批准号:20K20222
- 负责人:
- 金额:$ 2.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
嗄声や不快音の「質感」をヒトは直感的に評価できるが、従来の調波構造やその包絡を用いた信号処理法ではその特徴を十分に説明できない。本研究の目的は、1)聴覚末梢系の数理モデルを用いて時間領域の情報を高解像度で表現可能な新しい解析手法を開発し、2)嗄声や不快音の「質感」を特徴づける音響学的構造を解明することにある。将来的には本手法を機械学習と組み合わせることで音声認識、感情認識、雑音抑圧や音源分離など他の音響信号処理領域における応用も目指す。まず解析に有用な情報表現を得るために、聴覚末梢系を蝸牛基底膜および内有毛細胞を減衰自由振動系とし、調和変位を入力とする独自モデルとしてフィルタアレイを設計した。Nvidia社のGPUを搭載するワークステーション上で、CUDA、C#、C++を利用してこのモデルの並列処理を実装し、周波数軸、時間軸とも高密度にシミュレーションすることにより、高い周波数/時間解像度を両立した表現を得る手法を確立した。さらに視覚的表現によるフィードバックを行いながらモデルパラメーターを調節することができるプログラムを作成した。これらの手法、プログラムにさらに改良を加え、現在遂行中の研究「人工知能(AI)を用いた音声情報に基づく疾患診断支援技術の開発」にて収集した音声データを用いてモデルの基本性能(時間・周波数領域での解像度)の計測を進め、STFTや既存の聴覚フィルタバンクとの特性の比較を行った。現在同様のデータを利用し、音声障害の重症度や病態を推定する深層学習モデルの開発研究途中であり、本聴覚モデルを入力層に組み合わせる手法について実験継続中である。
The "texture" of the sound and the sound is directly related to the evaluation of the sound and the sound modulation structure. The envelope is used in the signal processing method. The characteristics are described in detail. The objectives of this study are: (1) to develop new analytical techniques for the application of mathematical models of acoustic end-systems to information in the temporal domain with high resolution;(2) to understand the acoustic structure of acoustic end-systems with high resolution. In the future, this method will be used for mechanical learning, combination, sound recognition, emotion recognition, sound suppression, sound source separation, and other sound signal processing fields. The analysis of useful information is based on the design of the basal membrane and the free vibration system of the inner hair cell. Nvidia's GPU is equipped with a high resolution system, CUDA, C#, C++, and a parallel processing system. The system is equipped with a cycle number axis, a Timeline, and a high density system. The system has a high cycle number/time resolution. The performance of the video game is very important. This is an ongoing study on "Development of Basic Diagnostic Support Technology for Artificial Intelligence (AI) and Acoustic Information", which includes the measurement of basic performance (resolution in time and frequency domain) of acoustic information and the comparison of characteristics of STFT and existing acoustic information. Now the same pattern is used, the severity of acoustic impairment and the estimation of pathologies. Deep learning is on the way to the development of acoustic impairment. The method of combining acoustic impairment and pathologies is in the middle of the process.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Classification of Voice Disorders Using a One-Dimensional Convolutional Neural Network
- DOI:10.1016/j.jvoice.2020.02.009
- 发表时间:2022-01-04
- 期刊:
- 影响因子:2.2
- 作者:Fujimura, Shintaro;Kojima, Tsuyoshi;Hori, Ryusuke
- 通讯作者:Hori, Ryusuke
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
藤村 真太郎其他文献
藤村 真太郎的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('藤村 真太郎', 18)}}的其他基金
Mixed Realityデバイスを用いた音声治療支援機器開発基礎技術の研究
利用混合现实设备开发语音治疗支持设备的基础技术研究
- 批准号:
23K08984 - 财政年份:2023
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)