音声と顔画像の融合解析に基づく対話型人物認識システムに関する研究

基于语音与人脸图像融合分析的交互式人物识别系统研究

基本信息

  • 批准号:
    07780379
  • 负责人:
  • 金额:
    $ 0.7万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では、音声の個人的特徴と発話時の顔の特徴を高精度で抽出し、総合的あるいは選択的に活用し、端末を操作する人物を認識するシステムの開発を研究目的とする。具体的には、複数の視覚センサと音響センサを設置した視聴覚融合センシングシステムの開発,音声生成過程の解析に基づく個人性情報の抽出を研究目的とする。研究成果は以下の通りである。1.視聴覚融合センシングシステムの開発:端末に複数のビデオカメラとマイクロホンを設置した視聴覚融合センシングシステムを開発する。まず、4本のマイクロホンを用いて音源(口唇)位置の推定を行う手法を開発した。本手法は4本のマイクロホンと音源との距離の差に伴う信号の位相差をマイクロホン信号の相互相関関数より推定し、音源位置を同定する。端末から50cm離れた音源位置を誤差2.4cm以内で推定することに成功した。次に音源位置が既知である場合、周囲雑音を含むマイクロホン信号から音源信号を抽出するため、話者依存型整合フィルタを考案し、10名の成人男子により話者照合実験を行い、有効性を明らかにした。2.カラー顔画像による口唇位置の推定:カラー顔画像より口唇の位置を推定する手法を提案した。本手法では口唇が肌の色より赤みがかっている点に着目し、色空間より口唇部の位置を推定する。被験者10名の顔画像を用いて口唇位置推定実験を行い、100%の識別結果が得られた。連続音声中の口唇形状が、顔画像の正規化に有効であることが示された。3.音声生成過程の解析に基づく個人性情報の抽出:磁気共鳴映像法(MRI)により歯冠部を含む音道形状の精密測定に成功し、摩擦子音発声時の音道形状データを得ることができた。また、音声言語の明瞭度を決定する舌-口蓋接触応力の計測、鼻咽喉閉鎖強度の計測に成功した。さらに声道及び鼻腔の音響特性を推定し、実音声の分析結果と一致すること、このような音声生成過程の解析に基づく音声分析により個人識別に有効な特徴量が得られることを示した。
In this study, the characteristics of the individual voice and voice are extracted with high precision, and the characteristics of the combination are extracted with high precision when speaking. The purpose of the research is to use the selected characters, to understand the characters, and to understand the characters. Concrete には, plural の视覚センサとAudio センサを setting した视聴覚fusion センシングシステムの开発, the analysis of the sound generation process, the extraction of personal information, and the research purpose. The research results are as follows. 1. Visual fusion of the センシングシステムのkai発: the end of the end of the plural のビデオカメラとマイクロホンをSET した视聴覚fused センシングシステムを开発する.まず、4のマイクロホンを uses the いて sound source (lips) position to estimate the を line う technique を开発した. This technique is based on the 4-original sound source, the distance difference between the sound source, the signal phase difference, the mutual correlation of the signal, and the estimation of the sound source position. If the end of the sound is 50cm away from the sound source and the error is within 2.4cm, it is presumed that the sound is successful. The location of the sound source is already known, the sound source signal is the sound source signal, the sound source signal is extracted, and the speaker is the speaker. Dependent integration of the test case, 10 adult men, the speaker according to the relationship, the effectiveness of the test. 2. Estimation of the position of the lips in the facial image: Presumption of the position of the lips in the facial image and proposal of the technique. This technique is based on the color of the lips and lips, the point of the lips, and the estimation of the position of the lips in the color space. The faces of the 10 subjects were estimated based on their lip positions, and the recognition result was 100%. The regularization of the shape of the lips and the facial image in the sound is also effective. 3. Analysis of the sound generation process and extraction of personal information: Magnetic Resonance Imaging (MRI) method The precise measurement of the shape of the melody was successful, and the shape of the melody was determined when the consonants were rubbed together. The success of the measurement of the tongue-to-oral contact force and the strength of the nasopharyngeal atresia was determined by the degree of clarity of speech and sound. The acoustic characteristics of the vocal tract and nasal cavity are estimated, and the analysis results of the sound are consistent. The analysis of the sound generation process is based on the sound analysis and the personal identification is effective.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
M. Matsumura,: "Measurement and Analysis of 3D Shapes of Vocal tract, dental crown and nasal cavity using MRI" 15th International Congress on Acoustics. vol.3. 97-100 (1995)
M. Matsumura,:“使用 MRI 测量和分析声道、牙冠和鼻腔的 3D 形状”第 15 届国际声学大会。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

松村 雅史其他文献

笑い声の無拘束・長時間モニタリング
不受限制且长期监控笑声
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松村 雅史;辻 竜之介
  • 通讯作者:
    辻 竜之介
口腔咽喉音・SpO2センサ一体型ネックバンドデバイスによる無呼吸・低呼吸の検出
使用集成口咽音和 SpO2 传感器的颈带设备检测呼吸暂停和呼吸不足
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    櫃田 毅;西庵 良彦;宮本 孝;池田 志帆;石村 仁志;松村 雅史;山本卓矢,酒井徳昭,奥村英史,松村雅史
  • 通讯作者:
    山本卓矢,酒井徳昭,奥村英史,松村雅史
喉頭マイクロフォンを用いた嚥下回数測定デバイスの開発〜信頼性の検討
使用喉部麦克风的吞咽频率测量装置的开发 - 可靠性检查
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Makoto Enomoto;Jun Ohya;松村 雅史
  • 通讯作者:
    松村 雅史
ネックバンド型血圧急変モニタリングデバイスの基礎研究~透析治療中における新たな生体情報の無拘束モニタリング~
颈带式血压突变监测装置的基础研究-透析治疗过程中生物信息的新型无拘束监测-
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    櫃田 毅;西庵 良彦;宮本 孝;池田 志帆;石村 仁志;松村 雅史
  • 通讯作者:
    松村 雅史
廃用性委縮防止のための喉頭マイクロフォンを用いた嚥下回数計測システム
使用喉部麦克风的吞咽频率测量系统可防止废用性萎缩
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山下 光美;松村 雅史
  • 通讯作者:
    松村 雅史

松村 雅史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('松村 雅史', 18)}}的其他基金

ネックバンド型スマートセンサによる日常生活動作時の連続血圧計測と血管障害発症予防
使用颈带式智能传感器在日常活动中连续测量血压并预防血管疾病
  • 批准号:
    24K15853
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
音声および顔情報の融合解析に基づく対話型人物認識システムに関する研究
基于语音与面部信息融合分析的交互式人物识别系统研究
  • 批准号:
    06780358
  • 财政年份:
    1994
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
3次元声道モデルと音声の並列分散処理による個人性情報の抽出と対話型話者認識
使用 3D 声道模型和并行分布式语音处理提取个人信息和交互式说话人识别
  • 批准号:
    04750366
  • 财政年份:
    1992
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
磁気共鳴映像法(MRI)による三次元声道形状の解析と音声の個人性情報の抽出
利用磁共振成像(MRI)分析三维声道形状并提取个体语音信息
  • 批准号:
    03750313
  • 财政年份:
    1991
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音声生成過程での特徴とニューラルネットワークを用いた話者認識システムの開発
利用语音生成过程和神经网络中的特征开发说话人识别系统
  • 批准号:
    01780057
  • 财政年份:
    1989
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

深層学習に基づく話者認識システムの法科学利用に向けた信頼性の検証
验证基于深度学习的说话人识别系统在法医科学应用中的可靠性
  • 批准号:
    24K07957
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
人工音声による話者認識器詐称防止に関する研究
利用人工语音预防说话人识别器欺骗的研究
  • 批准号:
    19K11975
  • 财政年份:
    2019
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
話者認識のための局所話者識別的特徴処理の研究
说话人识别中的本地说话人判别特征处理研究
  • 批准号:
    09F09805
  • 财政年份:
    2009
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
科学捜査に対応したテキスト依存型自動話者認識システム(FASR)に関する研究
用于法医调查的文本相关自动说话人识别系统(FASR)的研究
  • 批准号:
    20921016
  • 财政年份:
    2008
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
  • 批准号:
    19650040
  • 财政年份:
    2007
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
複数のバイオメトリクス個人情報を利用したロバストな話者認識手法に関する研究
利用多种个人生物特征信息的鲁棒说话人识别方法研究
  • 批准号:
    14780274
  • 财政年份:
    2002
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
3次元声道モデルと音声の並列分散処理による個人性情報の抽出と対話型話者認識
使用 3D 声道模型和并行分布式语音处理提取个人信息和交互式说话人识别
  • 批准号:
    04750366
  • 财政年份:
    1992
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音声生成過程での特徴とニューラルネットワークを用いた話者認識システムの開発
利用语音生成过程和神经网络中的特征开发说话人识别系统
  • 批准号:
    01780057
  • 财政年份:
    1989
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了