音声および顔情報の融合解析に基づく対話型人物認識システムに関する研究
基于语音与面部信息融合分析的交互式人物识别系统研究
基本信息
- 批准号:06780358
- 负责人:
- 金额:$ 0.64万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1994
- 资助国家:日本
- 起止时间:1994 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、音声の個人的特徴と発話時の顔の特徴を高精度で抽出し、総合的あるいは選択的に活用し、端末を操作する人物を認識するシステムの開発を研究目的とする。具体的には、複数の視覚センサと音響センサを設置した視聴覚融合センシングシステムの開発,音声生成過程の解析に基づく個人性情報の抽出を研究目的とする。研究成果は以下の通りである。1.視聴覚融合センシングシステムの開発:端末に複数のビデオカメラとマイクロホンを設置した視聴覚融合センシングシステムを開発する。まず、4本のマイクロホンを用いて音源(口唇)位置の推定を行う手法を開発した。本手法はマイクロホンと音源との距離の差に伴う信号の位相差をマイクロホン信号の相互相関関数より推定し、音源位置を同定する。端末から50cm離れた音源位置を誤差2.4cm以内で推定することに成功した。次に音源位置が既知である場合、周囲雑音を含むマイクロホン信号から音源信号を抽出する適応フィルタを開発し、周囲雑音中より話者の発生音抽出のS/Nを向上させた。2.カラー顔画像による口唇位置の推定:カラー顔画像より口唇の位置を推定する手法を提案した。本手法では口唇が肌の色より赤みがかっている点に着目し、カラー顔画像のHSI変換により口唇部の位置を推定する。被験者6名の顔画像を用いて口唇位置推定実験を行った結果、100%の識別結果が得られた。3.音声生成過程の解析に基づく個人性情報の抽出:磁気共鳴映像法(MRI)により歯冠部を含む声道形状の精密測定に初めて成功し、摩擦子音声時の声道形状データを得ることができた。また、子音の明瞭度を決定する舌-口蓋接触面の垂直応力の計測に成功した。さらに声道及び鼻腔の音響特性を推定し、実音声の分析結果と一致すること、このような音声生成過程の解析より得られた特徴量が、個人識別に有効なパラメータであることを示した。
In this study, the characteristics of the individual voice and voice are extracted with high precision, and the characteristics of the combination are extracted with high precision when speaking. The purpose of the research is to use the selected characters, to understand the characters, and to understand the characters. Concrete には, plural の视覚センサとAudio センサを setting した视聴覚fusion センシングシステムの开発, the analysis of the sound generation process, the extraction of personal information, and the research purpose. The research results are as follows. 1. Visual fusion of the センシングシステムのkai発: the end of the end of the plural のビデオカメラとマイクロホンをSET した视聴覚fused センシングシステムを开発する.まず、4のマイクロホンを uses the いて sound source (lips) position to estimate the を line う technique を开発した. This technique uses the method to estimate the distance between the sound source and the signal and determine the phase difference between the sound source and the sound source. If the end of the sound is 50cm away from the sound source and the error is within 2.4cm, it is presumed that the sound is successful. When the location of the sub-sound source is known, the sound source signal of the week is extractedする Fit 応フィルタを开発し, Zhou囲雑音中より人说の発生音出のS/Nを上させた. 2. Estimation of the position of the lips in the facial image: Presumption of the position of the lips in the facial image and proposal of the technique. This technique uses the color of the lips and lips, the color of the lips, the point of the eyes, and the HSI change of the facial image, and the position of the lips is estimated. The face portraits of the 6 subjects were estimated based on their lip positions, and the result was a 100% recognition result. 3. Analysis of the sound generation process and extraction of personal information: Magnetic Resonance Imaging (MRI) method. Including the precise measurement of the shape of the vocal tract, the success of the first step, and the determination of the shape of the vocal tract when the sound is rubbed. The success of the measurement of the vertical force of the tongue-lid contact surface is determined by the clarity of the consonants and the sound. The acoustic characteristics of the vocal tract and nasal cavity are estimated, and the analysis results of the sound are consistent. The analysis of the sound generation process is a special feature, and the personal identification is effective and effective.
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
松村雅史: "カセンサー体型人工口蓋床による舌-口蓋接触面の垂直応力分布の計測" 電気学会論文誌(C). 114-C. 1073-1077 (1994)
Masashi Matsumura:“使用 Cassensor 型人工腭底测量舌腭接触面的垂直应力分布”,日本电气工程师学会汇刊 (C) 114-C 1073-1077 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
松村雅史: "MRIによる歯冠部を含む声道と鼻腔の3次元形状の計測" 電気学会論文誌(C). 114-C. 1067-1072 (1994)
Masashi Matsumura:“使用 MRI 测量声道和鼻腔(包括牙冠)的三维形状”,日本电气工程师学会汇刊 (C) 114-1072 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉田正樹: "手の運動機能を取り入れたディジタル制御方式にる筋電義手の開発" バイオメカニズム. 12. 303-311 (1994)
Masaki Yoshida:“使用结合手部运动功能的数字控制系统开发肌电假手”生物机制。12. 303-311 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
松村 雅史其他文献
喉頭マイクロフォンを用いた嚥下回数測定デバイスの開発〜信頼性の検討
使用喉部麦克风的吞咽频率测量装置的开发 - 可靠性检查
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Makoto Enomoto;Jun Ohya;松村 雅史 - 通讯作者:
松村 雅史
口腔咽喉音・SpO2センサ一体型ネックバンドデバイスによる無呼吸・低呼吸の検出
使用集成口咽音和 SpO2 传感器的颈带设备检测呼吸暂停和呼吸不足
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
櫃田 毅;西庵 良彦;宮本 孝;池田 志帆;石村 仁志;松村 雅史;山本卓矢,酒井徳昭,奥村英史,松村雅史 - 通讯作者:
山本卓矢,酒井徳昭,奥村英史,松村雅史
ネックバンド型血圧急変モニタリングデバイスの基礎研究~透析治療中における新たな生体情報の無拘束モニタリング~
颈带式血压突变监测装置的基础研究-透析治疗过程中生物信息的新型无拘束监测-
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
櫃田 毅;西庵 良彦;宮本 孝;池田 志帆;石村 仁志;松村 雅史 - 通讯作者:
松村 雅史
廃用性委縮防止のための喉頭マイクロフォンを用いた嚥下回数計測システム
使用喉部麦克风的吞咽频率测量系统可防止废用性萎缩
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
山下 光美;松村 雅史 - 通讯作者:
松村 雅史
松村 雅史的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('松村 雅史', 18)}}的其他基金
ネックバンド型スマートセンサによる日常生活動作時の連続血圧計測と血管障害発症予防
使用颈带式智能传感器在日常活动中连续测量血压并预防血管疾病
- 批准号:
24K15853 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声と顔画像の融合解析に基づく対話型人物認識システムに関する研究
基于语音与人脸图像融合分析的交互式人物识别系统研究
- 批准号:
07780379 - 财政年份:1995
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
3次元声道モデルと音声の並列分散処理による個人性情報の抽出と対話型話者認識
使用 3D 声道模型和并行分布式语音处理提取个人信息和交互式说话人识别
- 批准号:
04750366 - 财政年份:1992
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
磁気共鳴映像法(MRI)による三次元声道形状の解析と音声の個人性情報の抽出
利用磁共振成像(MRI)分析三维声道形状并提取个体语音信息
- 批准号:
03750313 - 财政年份:1991
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
音声生成過程での特徴とニューラルネットワークを用いた話者認識システムの開発
利用语音生成过程和神经网络中的特征开发说话人识别系统
- 批准号:
01780057 - 财政年份:1989
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
音源定位の応用による防犯カメラ音声からの発話者特定技術の開発
应用声源定位开发安全摄像头音频说话人识别技术
- 批准号:
24H02551 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Scientists
音源定位技術で測る鳥類の歌と繁殖行動理解への展開
利用声源定位技术理解鸟鸣和繁殖行为的进展
- 批准号:
23K13968 - 财政年份:2023
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
仮想音源定位と錯聴現象によるVR手法を用いた多次元聴覚BCIの開発
利用虚拟声源定位和听觉错觉现象的 VR 方法开发多维听觉 BCI
- 批准号:
23K11811 - 财政年份:2023
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音源定位をサポートするハプティックデバイスの開発 /一側聾の包括的治療を目指して
开发支持声源定位的触觉设备/旨在综合治疗单侧耳聋
- 批准号:
22K16914 - 财政年份:2022
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
能動的な頭部回転を用いた聴覚‐運動訓練が運動技能の学習および音源定位に与える効果
使用主动头部旋转进行听觉运动训练对运动技能学习和声源定位的影响
- 批准号:
22K17728 - 财政年份:2022
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Sound source localization inside a structure
结构内部的声源定位
- 批准号:
20K14687 - 财政年份:2020
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Evaluation of primate vocal network visualization and sociality using sound source localization technology
利用声源定位技术评估灵长类声音网络可视化和社交性
- 批准号:
20K21811 - 财政年份:2020
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
A study on high resolution sound source localization method using high frequency components
利用高频分量的高分辨率声源定位方法研究
- 批准号:
19K04399 - 财政年份:2019
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音源定位技術で追う鳥類の歌コミュニケーション
利用声源定位技术追踪鸟鸣通讯
- 批准号:
19K15865 - 财政年份:2019
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
非視覚環境における優れた運動技能に寄与する音源定位方略の解明
阐明有助于非视觉环境中卓越运动技能的声源定位策略
- 批准号:
19J13848 - 财政年份:2019
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for JSPS Fellows














{{item.name}}会员




