Visual speech recognition using ultrasound tongue and video lip/face images

使用超声波舌头和视频唇/脸图像进行视觉语音识别

基本信息

  • 批准号:
    23520467
  • 负责人:
  • 金额:
    $ 3.08万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 2013
  • 项目状态:
    已结题

项目摘要

There are three main results of our research: (1) Related to video data collection of jaw movement, when measuring the amount of skin stretching over the mandible for the vowel in a CVC syllable, the onset consonant (but not the coda consonant) has a significant effect. (2) Related to ultrasound data collection of tongue position when speaking English, native (L1) speakers rest their tongue in a more efficient location (closer to the median position for English speech sounds) than Japanese (L2) speakers do. (3) Related to our focus on how best to construct and interpret a feature space we call MUTIS (midsagittal ultrasound tongue image space), results indicated that higher dimensions of MUTIS are most effective for identifying people, and that primarily the lower dimensions of VSS (vocal sound space) data are most effective for identifying phonemes. Trajectories within the VSS data indicate clear differences between L1 and L2 speakers, but not within the MUTIS data alone.
我们的研究主要有三个结果:(1)对于下颌运动的视频数据采集,当测量CVC音节中元音在下颌骨上的皮肤伸展程度时,声母(而不是尾辅音)有显著的影响。(2)与舌位超声数据采集有关,母语为英语的人比日语为母语的人在更有效的位置(更接近英语语音的中位位置)休息舌头。(3)关于如何更好地构建和解释我们称为MUTIS(正中矢状超声舌象空间)的特征空间,结果表明,MUTIS的高维对于人的识别是最有效的,而首先VSS(声音空间)数据的低维对于音素识别是最有效的。VSS数据中的轨迹表明L1和L2说话者之间存在明显的差异,但不仅仅是MUTIS数据中的差异。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Effect of syllable onset, coda, and nucleus on degree of skin stretching over the mandible.
音节开始、尾声和核心对下颌骨皮肤伸展程度的影响。
発音習得のための超音波舌画像に対する音素片マッピング [Mapping phonemes to midsagittal tongue images for pronunciation learning]
将音素映射到正中矢状舌头图像以进行发音学习
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yaguchi;Y.;N.Horiguchi;& I.Wilson
  • 通讯作者:
    & I.Wilson
Pitch and intensity in the speech of Japanese speakers of English: Comparison with L1 speakers
日本人说英语时的音调和强度:与母语人士的比较
Articulatory and laryngeal contributions to rhythm in English
发音和喉部对英语节奏的贡献
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Erickson;D. & I.Wilson
  • 通讯作者:
    D. & I.Wilson
Video recordings of L1 and L2 jaw movement: Effect of syllable onset on jaw opening during syllable nucleus
L1 和 L2 下颌运动的视频记录:音节开始对音节核期间下颌张开的影响
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

WILSON Ian其他文献

WILSON Ian的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('WILSON Ian', 18)}}的其他基金

Japanese articulatory setting : Instrumental measurements and effectiveness in pedagogy
日本发音设置:仪器测量和教学有效性
  • 批准号:
    19520355
  • 财政年份:
    2007
  • 资助金额:
    $ 3.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

A taxonomic articulation-focused approach to dysarthria classification
以分类学发音为重点的构音障碍分类方法
  • 批准号:
    10522517
  • 财政年份:
    2022
  • 资助金额:
    $ 3.08万
  • 项目类别:
A taxonomic articulation-focused approach to dysarthria classification
以分类学发音为重点的构音障碍分类方法
  • 批准号:
    10685349
  • 财政年份:
    2022
  • 资助金额:
    $ 3.08万
  • 项目类别:
Characterization of 3D feeding kinematics and EMG of rats and laminar specific single cell encoding properties in the motor cortex
大鼠 3D 进食运动学和肌电图的表征以及运动皮层层状特定单细胞编码特性
  • 批准号:
    10006877
  • 财政年份:
    2019
  • 资助金额:
    $ 3.08万
  • 项目类别:
Adapting an Evidence-Based Program that Improves Oral Hygiene and Health for Assisted Living Residents with Dementia
采用循证计划,改善患有痴呆症的辅助生活居民的口腔卫生和健康
  • 批准号:
    10176330
  • 财政年份:
    2018
  • 资助金额:
    $ 3.08万
  • 项目类别:
Adapting an Evidence-Based Program that Improves Oral Hygiene and Health for Assisted Living Residents with Dementia
采用循证计划,改善患有痴呆症的辅助生活居民的口腔卫生和健康
  • 批准号:
    9974464
  • 财政年份:
    2018
  • 资助金额:
    $ 3.08万
  • 项目类别:
Adapting an Evidence-Based Program that Improves Oral Hygiene and Health for Assisted Living Residents with Dementia
采用循证计划,改善患有痴呆症的辅助生活居民的口腔卫生和健康
  • 批准号:
    10470713
  • 财政年份:
    2018
  • 资助金额:
    $ 3.08万
  • 项目类别:
Adapting an Evidence-Based Program that Improves Oral Hygiene and Health for Assisted Living Residents with Dementia
采用循证计划,改善患有痴呆症的辅助生活居民的口腔卫生和健康
  • 批准号:
    9789809
  • 财政年份:
    2018
  • 资助金额:
    $ 3.08万
  • 项目类别:
Remote Monitoring and Detecting of Tardive Dyskinesia for Improving Patient Outcomes
远程监测和检测迟发性运动障碍以改善患者预后
  • 批准号:
    10603982
  • 财政年份:
    2017
  • 资助金额:
    $ 3.08万
  • 项目类别:
Pontine motor circuits
脑桥运动电路
  • 批准号:
    8033094
  • 财政年份:
    2009
  • 资助金额:
    $ 3.08万
  • 项目类别:
Pontine motor circuits
脑桥运动电路
  • 批准号:
    7656466
  • 财政年份:
    2009
  • 资助金额:
    $ 3.08万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了