Study on Speech Recognition by Uniting Image Sequence and Acoustic Signal

图像序列与声音信号相结合的语音识别研究

基本信息

  • 批准号:
    11680397
  • 负责人:
  • 金额:
    $ 2.43万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    1999
  • 资助国家:
    日本
  • 起止时间:
    1999 至 2000
  • 项目状态:
    已结题

项目摘要

(1) Development of method for recovering 3-D lips shape from image sequence(2) We developed a method for extracting the absolute depth information from the depth information having an indefinite scale, which is obtained by a moire imaging, with a simple reflection model for an object surface. It was confirmed through simulations and real image experiments that by considering not only a diffuse reflectance but also a specular one, an unbiased depth can be computed.(3) Development of vision-based speech recognition method using 3-D lips shapeWe proposed a method of a vowel recognition and a word recognition using 3-D lips shape information. The advantage of the proposed method is that an invariant recognition against a relative angle between a face and a camera can be done and a recognition rate purely improves by applying the proposed method. The above advantage was confirmed by real image experiments.Development of lips image generation method based on multiple light sourceBy extending the method developed in (1) to a multiple light source system, we proposed a method for computing the reflectances of both a lips region and a skin region. As a result, it was shown that lips images from an arbitral vewpoint can be generated.
(1)从图像序列中恢复三维唇形的方法研究(2)提出了一种从云纹成像获得的具有不定尺度的深度信息中提取绝对深度信息的方法,该方法具有简单的物体表面反射模型。通过仿真和实像实验证实,既考虑漫反射,又考虑镜面反射,可以计算出无偏深度。(3)基于三维唇形的视觉语音识别方法的发展我们提出了一种基于三维唇形信息的元音识别和单词识别方法。该方法的优点是可以对人脸与相机之间的相对角度进行不变识别,并且可以提高识别率。通过实像实验验证了上述优点。基于多光源的嘴唇图像生成方法的发展通过将(1)中开发的方法扩展到多光源系统,我们提出了一种计算嘴唇区域和皮肤区域反射率的方法。结果表明,可以从任意点生成嘴唇图像。

项目成果

期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
K.UDA, N.TAGAWA, A.MINAGAWA, T.MORIYA: "Efectiveness evaluation of speech feature including 3-D information for lipreading (in Japanese)"Proc. Of the 2000 Society Conference of IEICE. No.D-12-54. 241 (2000)
K.UDA、N.TAGAWA、A.MINAGAWA、T.MORIYA:“包括唇读 3D 信息在内的语音特征的有效性评估(日语)”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.NIIKURA, A.MINAGAWA, N.TAGAWA, T.MORITA: "Determination of the absolute number of moirefringes using shading in formation"Proc.of Advances in Pattern Recoguition and Digital Techniques. 154-159 (1999)
K.NIIKURA、A.MINAGAWA、N.TAGAWA、T.MORITA:“使用形成中的阴影确定莫尔条纹的绝对数量”Proc.of Advances in Pattern Recoguition and Digital Techniques。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
浅倉, 皆川, 田川, 守屋: "陰影情報を用いたモアレ縞の絶対縞次数決定法"電子情報通信学会技術研究報告. IE-99-36. 81-88 (1999)
Asakura、Minakawa、Takawa、Moriya:“使用阴影信息的莫尔条纹的绝对条纹顺序确定方法”IEICE 技术报告。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.NAGANUMA, A.MINAGAWA, N.TAGAWA, T.MORIYA: "Computation of 3-D shape and reflectance with shading model and moire phase (in Japanese)"Proc. Of the 2001 IEICE General Conference. No.D-12-67. 234 (2001)
S.NAGANUMA、A.MINAGAWA、N.TAGAWA、T.MORIYA:“使用阴影模型和莫尔相位计算 3-D 形状和反射率(日语)”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
稲垣, 田川, 皆川, 守屋: "モアレ位相と光の反射モデルに基づく物体の3次元形状と反射率の計算"電子情報通信学会技術研究報告. PRMU2000-229. 51-56 (2001)
Inagaki、Takawa、Minakawa、Moriya:“基于莫尔相位和光反射模型的物体的 3D 形状和反射率计算”PRMU2000-229 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

TAGAWA Norio其他文献

TAGAWA Norio的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('TAGAWA Norio', 18)}}的其他基金

Study on thermal stubility of ultra-thin DLC thin films due to rapid laser heating
激光快速加热超薄DLC薄膜的热稳定性研究
  • 批准号:
    24360063
  • 财政年份:
    2012
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of Probe System with Super-small Diameter for Intravascular Ultrasound Performing Much Detailed Imaging
开发用于血管内超声执行更详细成像的超小直径探头系统
  • 批准号:
    21300191
  • 财政年份:
    2009
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of nano-meter head-disk interface for the Tb/in^2 class ultrahigh-recording-density information storage systems
Tb/in^2级超高记录密度信息存储系统纳米头盘接口开发
  • 批准号:
    15206019
  • 财政年份:
    2003
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
On-line Reconstruction of 3-D Structure from Image Sequences Based on Spatio-temporal Information Propagation
基于时空信息传播的图像序列3维结构在线重建
  • 批准号:
    15500117
  • 财政年份:
    2003
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of Nano-mechatronics for ultra-high density data storage devices
超高密度数据存储设备纳米机电一体化的发展
  • 批准号:
    12450105
  • 财政年份:
    2000
  • 资助金额:
    $ 2.43万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了