音声情報と画像情報の統合化による概念の獲得に関する研究

音频与图像信息融合的概念获取研究

基本信息

  • 批准号:
    02805045
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
  • 财政年份:
    1990
  • 资助国家:
    日本
  • 起止时间:
    1990 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では、視覚と聴覚という2つの外的刺激を結びつけて、未知の入力に対する概念の獲得方式を定式化することを目的とし、画像と音声情報より概念を形成するシステムを作成した。本システムでは、この視覚情報(画像)と聴覚情報(音声)を用いて計算機に物の名前や位置等の概念を学習させる。視覚情報としてはカメラで取り込んだ図形画像を入力する。そしてその入力画像から、概念形成に必要なパラメ-タを抽出する。今回の実験で形成する概念は、(1)図形の存在性、(2)図形の位置、(3)図形の大きさ、(4)図形の色、(5)図形の形状、の5つのグル-プに分類される、各概念グル-プに対するパラメ-タを抽出する。聴覚情報として、音声から音声情報を抽出する。方法としては、二つの音声の時系列デ-タ同士のDPマッチングを行ない、それによって算出された最適照合パスおよび照合距離により、類似区間を抽出する。最適照合パスが求まると、以下の基準を満たす区間の論理積をとり共通区間を抽出する。・DPパスの線形性・平均距離・距離の最大値以上で述べた音声と画像のデ-タから、概念を獲得するアルゴリズムを開発した。つまり、文音声とそれに関連する画像より音声と画像の対応付けから概念を獲得していく。評価実験として、簡単な図形の概念(例えば、三角形、大きい、白い、右に)の獲得実験を行った。16文の音声デ-タとそれに対応する画像を入力して、13個の概念が正しく獲得できた。結論として、逐次画像と音声を対応付けながら学習を行う事により、ある概念に対応する音と画像特徴が対応付けられ、人間の概念獲得手法の初期段階が計算機上で実現できた。
In this study, the concept of visual and acoustic information was formulated based on the concept of external stimuli, unknown input force, and objective. The concept of the name and position of the object in the computer is studied by using the concept of the visual information (image) and the visual information (sound). The visual information and images are taken into account. It is necessary for the concept formation to be extracted from the image. The concept of the present situation is: (1) the existence of the shape;(2) the position of the shape;(3) the size of the shape;(4) the color of the shape;(5) the shape of the shape; and (5) the classification of the group; and the extraction of the concept. Sound information extraction The method is to calculate the optimal illumination distance and extract the similar interval. The logical product of the following reference intervals is extracted. DP shape, average distance, distance above the maximum value of the sound and image, the concept of acquisition, the development of the system The concept of sound and image is acquired. Comments on the concept of simple shapes (e.g., triangle, large middle, white middle, right middle) 16 words of sound and sound, 13 concepts of sound and sound, 13 concepts of sound and sound Conclusion: The initial stage of the concept acquisition method is realized on the computer.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
S.Nakagawa,Y.Hashimoto: "Segmentation of Contimuous Speech by HMM and Bayesion Probability." System and Computers in Japan. 21. 23-32 (1990)
S.Nakakawa,Y.Hashimoto:“通过 HMM 和贝叶斯概率对连续语音进行分割。”
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Nakagawa,Y.Ueda: "Automatic Extraction of Phonotactics based on Hidden Markov Models and Language Identification" Studia Phonologica. 24. (1991)
S.Nakakawa,Y.Ueda:“基于隐马尔可夫模型和语言识别的音位学自动提取”Studia Phonologica。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川 聖一、中西 宏文、古部 好計、辰己 昭治: "視聴覚情報を用いた言語・概念の獲得" 電子情報通信学会第2種研究会「概念獲得」研究会資料. LA90ー13. 1-8 (1991)
Seiichi Nakakawa、Hirofumi Nakanishi、Yoshikei Furube 和 Shoji Tatsumi:“使用视听信息习得语言和概念”IEICE 2 类研究组“概念习得”LA90-13 (1991)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川 聖一・鹿野 清宏・東倉 洋一: "音声・聴覚と神経回路綱モデル" オ-ム社, 235 (1990)
Seiichi Nakakawa、Kiyohiro Kano 和 Yoichi Tokura:“言语/听力和神经回路模型”Ohmsha,235 (1990)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

中川 聖一其他文献

A Study of Speaker Identification Using Phoneme-lnformation
利用音素信息识别说话人的研究
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英;Katsuyuki Obayashi
  • 通讯作者:
    Katsuyuki Obayashi
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统

中川 聖一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('中川 聖一', 18)}}的其他基金

実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
  • 批准号:
    19650040
  • 财政年份:
    2007
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
セマンティックディジタルアーカイブのための音声・映像・言語の統合的処理
音频、视频、语言一体化处理,实现语义数字档案
  • 批准号:
    15630003
  • 财政年份:
    2003
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
音声言語処理技術と学習者モデルを用いた語学学習システムの研究
利用口语处理技术和学习者模型的语言学习系统研究
  • 批准号:
    12040104
  • 财政年份:
    2000
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
外国語コミュニケーション能力の総合的な養成研究
外语交际能力综合训练研究
  • 批准号:
    12040103
  • 财政年份:
    2000
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
  • 批准号:
    05213209
  • 财政年份:
    1993
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
  • 批准号:
    04229209
  • 财政年份:
    1992
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合音频、语言、图像信息的概念获取研究
  • 批准号:
    03245209
  • 财政年份:
    1991
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声・画像の視聴覚情報のシンボル記述化による自然言語文法の帰納的学習法の研究
利用音频、图像等视听信息的符号描述进行自然语言语法归纳学习方法研究
  • 批准号:
    01550284
  • 财政年份:
    1989
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
高精度音声認識手法による音声の超極低ビットテキストファイル化・知的符号化合成方式
利用高精度语音识别方法将语音转换为超低比特文本文件及智能编码合成方法
  • 批准号:
    63550272
  • 财政年份:
    1988
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
音節セグメントの同定に基づく音声の超極低ビット符号化合成方式の研究
基于音节段识别的语音超低比特编码合成方法研究
  • 批准号:
    62550243
  • 财政年份:
    1987
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

前立腺における病理画像情報の3次元可視化技術
前列腺病理图像信息3D可视化技术
  • 批准号:
    24K21119
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
深層学習による画像情報を主軸にした包括的な肺機能診断法の確立
利用深度学习建立基于图像信息的综合肺功能诊断方法
  • 批准号:
    23K21424
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
肺がんCT検診の性能向上のための遺伝情報と画像情報の融合研究
遗传信息与图像信息融合研究提高肺癌CT筛查性能
  • 批准号:
    24K03308
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Addressing Urgent Calls for Public Health Workforce Planning: Establishing and Implementing National Indicators to Profile and Monitor the Public Health Workforce in Canada
满足公共卫生人力规划的迫切需求:建立和实施国家指标来描述和监测加拿大公共卫生人力
  • 批准号:
    498865
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Operating Grants
分散型自律組織 (DAO)における医療画像情報の管理運用における実施モデルの研究
去中心化自治组织(DAO)中医学图像信息管理与运营的实现模型研究
  • 批准号:
    23K14851
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Use of normo-thermic perfused organs to profile PK and infection efficiency of novel viral gene therapy vectors.
使用常温灌注器官来分析新型病毒基因治疗载体的 PK 和感染效率。
  • 批准号:
    2891748
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Studentship
Addressing Urgent Calls for Public Health Workforce Planning: Establishing and Implementing National Indicators to Profile and Monitor the Public Health Workforce in Canada
满足公共卫生人力规划的迫切需求:建立和实施国家指标来描述和监测加拿大公共卫生人力
  • 批准号:
    488446
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Operating Grants
画像情報を用いた生活空間における混合音の理解に関する研究
利用图像信息理解生活空间中混合声音的研究
  • 批准号:
    23K11074
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Use of normo thermic perfused organs to profile PK and infection efficiency of novel viral gene therapy vectors
使用常温灌注器官来分析新型病毒基因治疗载体的 PK 和感染效率
  • 批准号:
    BB/Y51343X/1
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Training Grant
深層学習による医用画像情報の悉皆的理解
利用深度学习全面理解医学图像信息
  • 批准号:
    22KF0261
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了