音声と顔画像の融合解析に基づく対話型人物認識システムに関する研究
基于语音与人脸图像融合分析的交互式人物识别系统研究
基本信息
- 批准号:07780379
- 负责人:
- 金额:$ 0.7万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、音声の個人的特徴と発話時の顔の特徴を高精度で抽出し、総合的あるいは選択的に活用し、端末を操作する人物を認識するシステムの開発を研究目的とする。具体的には、複数の視覚センサと音響センサを設置した視聴覚融合センシングシステムの開発,音声生成過程の解析に基づく個人性情報の抽出を研究目的とする。研究成果は以下の通りである。1.視聴覚融合センシングシステムの開発:端末に複数のビデオカメラとマイクロホンを設置した視聴覚融合センシングシステムを開発する。まず、4本のマイクロホンを用いて音源(口唇)位置の推定を行う手法を開発した。本手法は4本のマイクロホンと音源との距離の差に伴う信号の位相差をマイクロホン信号の相互相関関数より推定し、音源位置を同定する。端末から50cm離れた音源位置を誤差2.4cm以内で推定することに成功した。次に音源位置が既知である場合、周囲雑音を含むマイクロホン信号から音源信号を抽出するため、話者依存型整合フィルタを考案し、10名の成人男子により話者照合実験を行い、有効性を明らかにした。2.カラー顔画像による口唇位置の推定:カラー顔画像より口唇の位置を推定する手法を提案した。本手法では口唇が肌の色より赤みがかっている点に着目し、色空間より口唇部の位置を推定する。被験者10名の顔画像を用いて口唇位置推定実験を行い、100%の識別結果が得られた。連続音声中の口唇形状が、顔画像の正規化に有効であることが示された。3.音声生成過程の解析に基づく個人性情報の抽出:磁気共鳴映像法(MRI)により歯冠部を含む音道形状の精密測定に成功し、摩擦子音発声時の音道形状データを得ることができた。また、音声言語の明瞭度を決定する舌-口蓋接触応力の計測、鼻咽喉閉鎖強度の計測に成功した。さらに声道及び鼻腔の音響特性を推定し、実音声の分析結果と一致すること、このような音声生成過程の解析に基づく音声分析により個人識別に有効な特徴量が得られることを示した。
This study で は, voice の personal 徴 と 発 when の yan の, 徴 を high precision で drew し, 総 あ る い は sentaku に transfer し, end を operation す る characters を know す る シ ス テ ム の open 発 を research purpose と す る. Specific に は, plural の 覚 セ ン サ と sound セ ン サ を set し た depending on hearing fusion セ ン シ ン グ シ ス テ ム の 発, sounds generation process analytical に の base づ く personal intelligence の spare を research purpose と す る. The research results are and である. 1. Depending on the hearing fusion セ ン シ ン グ シ ス テ ム の 発 : open end に plural の ビ デ オ カ メ ラ と マ イ ク ロ ホ ン を set し た depending on hearing fusion セ ン シ ン グ シ ス テ ム を open 発 す る. Youdaoplaceholder0, 4 copies of <s:1> ロホ ロホ ロホ を を using the position of the て sound source (lips) <s:1> to infer that を is in line う, を is used to publish た. This technique は 4 this の マ イ ク ロ ホ ン と audio と の の distance difference に with う signal の bit differ を マ イ ク ロ ホ ン signal の mutual phase masato masato number よ り presumption し with fixed position, audio を す る. The end ら is 50cm away from the れた sound source position を with an error of less than 2.4cm で. It is presumed that the する とに とに とに is successful and the た is た. Time に sound source location が already know で あ る occasions, zhou 囲 を 雑 notes contain む マ イ ク ロ ホ ン signal か ら audio signal を spare す る た め, words dependent type integrated フ ィ ル タ し を test case, 10 の adult man に よ り according to close the speaker's words be 験 を line い, have sharper を Ming ら か に し た. 2. Youdaoplaceholder0 カラ facial portrait による lip position <s:1> presumption :カラ カラ facial portrait よ large lip <s:1> position を presumption する technique を proposal た た. This technique で は oral が muscle の color よ り red み が か っ て い に る point with よ し, color space り oral department の position を presumption す る. The <s:1> facial portraits of 10 subjects are を. The position of the lips of the を て is used to infer that the actual subjects are を and を. The 100% <s:1> identification result が is られた. In the 続 sound, the shape of the lip of the mouth が and the shape of the facial image <e:1> are regularized に, which has the effect of である された とが とが indicating された. 3. Sounds generation process analytical に の base づ く personal intelligence の drew: method of 気 magnetic resonance image (MRI) に よ り 歯 crown を containing の む sound way shape precision measurement に し success, friction consonants sound 発 の way shape デ ー タ を have る こ と が で き た. Youdaoplaceholder0 and the <s:1> clarity of speech を determine the success of する glossy-oral cover contact 応 force <s:1> measurement and nasopharyngeal occlusion intensity <s:1> measurement に た た た. さ ら に track and び の nasal cavity acoustics characteristic を presumption し, be sounds の analysis results agree と す る こ と, こ の よ う な sounds generation process analytical に の base づ く sounds analysis に よ り personal identification に have sharper な, が 徴 quantity to ら れ る こ と を shown し た.
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
M. Matsumura,: "Measurement and Analysis of 3D Shapes of Vocal tract, dental crown and nasal cavity using MRI" 15th International Congress on Acoustics. vol.3. 97-100 (1995)
M. Matsumura,:“使用 MRI 测量和分析声道、牙冠和鼻腔的 3D 形状”第 15 届国际声学大会。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
松村 雅史其他文献
喉頭マイクロフォンを用いた嚥下回数測定デバイスの開発〜信頼性の検討
使用喉部麦克风的吞咽频率测量装置的开发 - 可靠性检查
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Makoto Enomoto;Jun Ohya;松村 雅史 - 通讯作者:
松村 雅史
口腔咽喉音・SpO2センサ一体型ネックバンドデバイスによる無呼吸・低呼吸の検出
使用集成口咽音和 SpO2 传感器的颈带设备检测呼吸暂停和呼吸不足
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
櫃田 毅;西庵 良彦;宮本 孝;池田 志帆;石村 仁志;松村 雅史;山本卓矢,酒井徳昭,奥村英史,松村雅史 - 通讯作者:
山本卓矢,酒井徳昭,奥村英史,松村雅史
ネックバンド型血圧急変モニタリングデバイスの基礎研究~透析治療中における新たな生体情報の無拘束モニタリング~
颈带式血压突变监测装置的基础研究-透析治疗过程中生物信息的新型无拘束监测-
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
櫃田 毅;西庵 良彦;宮本 孝;池田 志帆;石村 仁志;松村 雅史 - 通讯作者:
松村 雅史
廃用性委縮防止のための喉頭マイクロフォンを用いた嚥下回数計測システム
使用喉部麦克风的吞咽频率测量系统可防止废用性萎缩
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
山下 光美;松村 雅史 - 通讯作者:
松村 雅史
松村 雅史的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('松村 雅史', 18)}}的其他基金
ネックバンド型スマートセンサによる日常生活動作時の連続血圧計測と血管障害発症予防
使用颈带式智能传感器在日常活动中连续测量血压并预防血管疾病
- 批准号:
24K15853 - 财政年份:2024
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声および顔情報の融合解析に基づく対話型人物認識システムに関する研究
基于语音与面部信息融合分析的交互式人物识别系统研究
- 批准号:
06780358 - 财政年份:1994
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
3次元声道モデルと音声の並列分散処理による個人性情報の抽出と対話型話者認識
使用 3D 声道模型和并行分布式语音处理提取个人信息和交互式说话人识别
- 批准号:
04750366 - 财政年份:1992
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
磁気共鳴映像法(MRI)による三次元声道形状の解析と音声の個人性情報の抽出
利用磁共振成像(MRI)分析三维声道形状并提取个体语音信息
- 批准号:
03750313 - 财政年份:1991
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
音声生成過程での特徴とニューラルネットワークを用いた話者認識システムの開発
利用语音生成过程和神经网络中的特征开发说话人识别系统
- 批准号:
01780057 - 财政年份:1989
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
深層学習に基づく話者認識システムの法科学利用に向けた信頼性の検証
验证基于深度学习的说话人识别系统在法医科学应用中的可靠性
- 批准号:
24K07957 - 财政年份:2024
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
人工音声による話者認識器詐称防止に関する研究
利用人工语音预防说话人识别器欺骗的研究
- 批准号:
19K11975 - 财政年份:2019
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
話者認識のための局所話者識別的特徴処理の研究
说话人识别中的本地说话人判别特征处理研究
- 批准号:
09F09805 - 财政年份:2009
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for JSPS Fellows
科学捜査に対応したテキスト依存型自動話者認識システム(FASR)に関する研究
用于法医调查的文本相关自动说话人识别系统(FASR)的研究
- 批准号:
20921016 - 财政年份:2008
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Scientists
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
- 批准号:
19650040 - 财政年份:2007
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
複数のバイオメトリクス個人情報を利用したロバストな話者認識手法に関する研究
利用多种个人生物特征信息的鲁棒说话人识别方法研究
- 批准号:
14780274 - 财政年份:2002
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
3次元声道モデルと音声の並列分散処理による個人性情報の抽出と対話型話者認識
使用 3D 声道模型和并行分布式语音处理提取个人信息和交互式说话人识别
- 批准号:
04750366 - 财政年份:1992
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
音声生成過程での特徴とニューラルネットワークを用いた話者認識システムの開発
利用语音生成过程和神经网络中的特征开发说话人识别系统
- 批准号:
01780057 - 财政年份:1989
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




