視覚による表情変化の実時間認識とその読唇への応用

面部表情变化的视觉实时识别及其在唇读中的应用

基本信息

  • 批准号:
    06212203
  • 负责人:
  • 金额:
    $ 1.02万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

本年度の研究では,昨年度まで行なってきた相関値による顔の確認の応用として,読唇を行なった.処理の原理は,相関値を用いて個々の入力画像を平面上にマッピングし,その(x,y)座標値をニューラルネットの入力として用いて判別を行なった.昨年度の実験から,母音の認識は可能であるとの結果を得ていたが,本年度は,いくつかの子音(b,m,p)の認識と,さらに実時間(ビデオレート)の認識に成功した.実時間化にあたっては,トランスピュータ4台による並列処理を行ない,画像追跡,相関計算,平面配置処理をパイプライン化することで,達成できた.平面配置計算はその内部に反復計算を含むが,より初期値を与えることでその反復回数を大幅に削減できる.処理の高速化によって,口唇の動きを連続的に把握できるようになったため,前回の配置結果を次の初期値とすることで,さらなる高速化が可能になった.また,テンプレートを平面配置した結果として,相互の関係が明らかになるため,類似したテンプレートをはぶくことで,相関値計算も高速化できた.認識精度については,話者や照明条件への依存性が高いものの,母音だけであれば80%程度,子音ひとつを含んだ場合には60%程度の成績を得ている.3年間の研究によって,表情や口唇など不定型な対象の認識に対しては,テンプレートマッチングを拡張した相関値による配置方式が有力となることが示せたと考えている.
This year's research is not the same as last year's. The principle of processing is to use the correlation value to determine the input force of the image on the plane. Last year, the understanding of vowels was possible, and the results were achieved. This year, the understanding of vowels (b,m,p) was achieved, and the understanding of time (b,m,p) was achieved. Time, color, four sets of parallel processing, image tracking, correlation calculation, plane configuration processing, color, color, color. Plane configuration calculation includes internal iterative calculation, initial value and iterative number are greatly reduced. The speed of processing is high, and the movement of lips is continuous. The speed of processing is possible. The result of the plane configuration is that the relationship between them is obvious, similar to that of the plane configuration, and the correlation calculation is accelerated. The accuracy of cognition is relatively high, and the speaker's dependence on illumination conditions is relatively high. The vowel score is 80%, and the consonant score is 60%. During the three years of research, the expression is not stable, and the object cognition is relatively high.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
渡辺英之,寺田実,井上博允: "相関値による読唇" 第3回顔のワークショップ資料. 15-20 (1994)
Hideyuki Watanabe、Minoru Terada、Hiroyuki Inoue:“使用相关值进行唇读”第 3 届面部研讨会材料(1994 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

井上 博允其他文献

音響テンプレートマッチングを用いたヒューマノイドの物音認識行動
使用声学模板匹配的人形声音识别行为
刺激の発火頻度基準の情報量による能動的注意と受動的注意の統合機構の実現
基于刺激激发频率的信息量的主动和被动注意一体化机制的实现
Force Feedback in Precise Assembly Tasks
  • DOI:
  • 发表时间:
    1975
  • 期刊:
  • 影响因子:
    0
  • 作者:
    井上 博允
  • 通讯作者:
    井上 博允
ヒューマノイドのオンサイト誘導プランナの実現と行動学習
人形现场引导规划器及行为学习的实现
感覚情報と運動情報の同期発火に着目したロボットの合目標的行動における注意構造の獲得
获取机器人目标导向行为中的注意力结构,重点关注感觉和运动信息的同步激发

井上 博允的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('井上 博允', 18)}}的其他基金

ゲルロボットの研究
凝胶机器人的研究
  • 批准号:
    12875049
  • 财政年份:
    2000
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
ヒューマノイドロボット全身行動の生成・試行・学習・獲得
仿人机器人全身行为的生成、尝试、学习和获取
  • 批准号:
    99F00933
  • 财政年份:
    2000
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
実時間トラッキングビジョンによる環境理解と知的行動に関する総合的研究
利用实时跟踪视觉对环境理解和智能行为进行综合研究
  • 批准号:
    06302040
  • 财政年份:
    1994
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (A)
感覚と行動の統合による機械知能の発現機構の研究
感觉与行为融合的机器智能机制研究
  • 批准号:
    06352039
  • 财政年份:
    1994
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (B)
視覚による顔の発見と追跡および表情変化の動的認識
视觉人脸发现与跟踪以及面部表情变化的动态识别
  • 批准号:
    05220203
  • 财政年份:
    1993
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ロボットの知能と自律性に関する総合的研究
机器人智能与自主性综合研究
  • 批准号:
    05352019
  • 财政年份:
    1993
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (B)
人間の表情の動的変化の実時間認識
实时识别人体面部表情动态变化
  • 批准号:
    04236202
  • 财政年份:
    1992
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
コンプライアンス制御機能を有するパラレル・マニピュレータの研究
具有柔顺控制功能的并联机械手研究
  • 批准号:
    59460094
  • 财政年份:
    1984
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
パラレル・マンピュレータに関する研究
并联机械手的研究
  • 批准号:
    57550143
  • 财政年份:
    1982
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
研究用標準型汎用ロボットアームの開発研究
研究开发标准通用机械臂
  • 批准号:
    X00120----485078
  • 财政年份:
    1979
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research

相似海外基金

画像認識とフレーム自動補間を用いた走動作学習システムの構築
使用图像识别和自动帧插值构建跑步运动学习系统
  • 批准号:
    24K14538
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
食事画像認識AI搭載カーボカウントアプリケーションの有用性に関する特定臨床研究
配备膳食图像识别 AI 的碳水化合物计数应用程序实用性的具体临床研究
  • 批准号:
    24K11672
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
形状理解のためのマルチモーダル学習による、敵対的摂動に頑健な画像認識モデル開発
使用多模态学习进行形状理解,开发对对抗性扰动具有鲁棒性的图像识别模型
  • 批准号:
    24KJ0716
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
内視鏡下甲状腺手術でのAIによる画像認識技術を用いたナビゲーションシステムの開発
利用AI图像识别技术开发甲状腺内镜手术导航系统
  • 批准号:
    24K19779
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
子宮頸部のHPV感染を細胞診WSI画像から推定する画像認識AIの検討
检查图像识别人工智能从细胞学 WSI 图像估计宫颈 HPV 感染
  • 批准号:
    24K13449
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識による手指運動麻痺に対する反復運動再現性の評価アプリケーションの開発
开发使用图像识别评估手指运动麻痹的重复运动再现性的应用程序
  • 批准号:
    24K12380
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
機械学習を用いた心エコー図の画像認識による大動脈弁狭窄症の進行予測
使用机器学习的超声心动图图像识别来预测主动脉瓣狭窄的进展
  • 批准号:
    24K18997
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
画像認識を用いた土壌孔隙径分布の計測による土壌水分特性の特定
利用图像识别测量土壤孔径分布来识别土壤水分特征
  • 批准号:
    24K09005
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    23K23017
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
画像認識による食事記録作成支援アプリを使った栄養士による遠隔食事指導システム
营养师使用基于图像识别的膳食记录创建支持应用程序构建的远程饮食指导系统
  • 批准号:
    23K25247
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了