A perceptual model of speech based on real-time speaker adaptation

基于实时说话人适应的语音感知模型

基本信息

项目摘要

Perceptual experiments indicated that speakers of different vowels could be correctly identified with accuracy of more than 80%. Analyzing speech signals uttered by 632 speakers, a new analysis method was proposed on the basis of the sinusoidal representation of speech signal. Further, cosine expansion of speech spectra and the quadratic combination of their coefficients were shown to be effective features for vowel perception. The result supports the hypothesis that perceptual features for vowel might be extracted by two-step synaptic combination in auditory periphery.
感知实验表明,不同元音的说话者可以被正确识别,准确率在80%以上。对632位说话人发出的语音信号进行分析,提出了一种基于语音信号正弦表示的分析方法。此外,语音频谱的余弦展开及其系数的二次组合被证明是元音感知的有效特征。结果支持了听觉外围区两步突触结合提取元音感知特征的假设。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A source-filter separation for non-stationary voiced speech based on sinusoidal representation
基于正弦表示的非平稳浊音源滤波器分离
局所変化率変換に基づく有声音声の正弦波モデル
基于局部速率变换的有声语音正弦模型
フォルマントとスペクトル全体形状を統合した母音知覚モデルの検討
检查集成共振峰和整体频谱形状的元音感知模型
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤仁;小原桂二;伊藤彰則;矢野雅文
  • 通讯作者:
    矢野雅文
Relative importance of formant and whole-spectral cues for vowel perception
共振峰和全谱线索对元音感知的相对重要性
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤仁;小原桂二;伊藤彰則;矢野雅文
  • 通讯作者:
    矢野雅文
ケプストラム係数を用いた母音のフォルマント分析
使用倒谱系数对元音进行共振峰分析
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Naoe;H. Sasaki;Y. Takefuji;伊藤仁
  • 通讯作者:
    伊藤仁
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ITO Masashi其他文献

Estimation of the optimal leaf area index (LAI) of an eggplant canopy based on the relationship between the nighttime respiration and daytime photosynthesis of the lowermost leaves
基于最下部叶片夜间呼吸和白天光合作用之间的关系估算茄子冠层的最佳叶面积指数(LAI)
  • DOI:
    10.1016/j.scienta.2022.111525
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    4.3
  • 作者:
    NOMURA Koichi;ITO Masashi;KUSABA Yusuke;SAITO Masahiko;MORI Makito;YAMANE Shinzo;IWAO Tadashige;TADA Ikunao;YAMAZAKI Tomihiro;KITANO Masaharu
  • 通讯作者:
    KITANO Masaharu

ITO Masashi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ITO Masashi', 18)}}的其他基金

A speaker identity perception for formant-suppressed vowels
共振峰抑制元音的说话人身份感知
  • 批准号:
    24650137
  • 财政年份:
    2012
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
A speech perception model integrating formant theory and whole-spectrum model.
一种融合共振峰理论和全谱模型的语音感知模型。
  • 批准号:
    19700242
  • 财政年份:
    2007
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Research on free radical on acute mesenteric ischemia and intestinal viability.
自由基对急性肠系膜缺血及肠道活力的研究。
  • 批准号:
    06671252
  • 财政年份:
    1994
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

単語音声認識における話者適応化方式に関する研究
单词语音识别中的说话人适应方法研究
  • 批准号:
    60580025
  • 财政年份:
    1985
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
音声認識システムのための自動話者適応化機能の開発
语音识别系统自动说话人适应功能的开发
  • 批准号:
    59780028
  • 财政年份:
    1984
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了