音声・言語・画像情報の統合化による概念の獲得に関する研究
整合音频、语言、图像信息的概念获取研究
基本信息
- 批准号:03245209
- 负责人:
- 金额:$ 1.28万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1991
- 资助国家:日本
- 起止时间:1991 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、視覚と聴覚という2つの外的刺激を結びつけて、未知の入力に対する概念の獲得法式を定式化することを目的とし、画像と音声情報により概念を形成するシステムを作成した。本システムでは、この視覚情報(画像)と聴覚情報(音声)を用いて計算機に物の名前や位置等の概念を学習させる。視覚情報としてはカメラで取り込んだ図形画像を入力し、概念形成に必要なパラメ-タを抽出する。今回の実験で形成する概念は、(1)図形の存在性、(2)図形の位置、(3)図形の大きさ、(4)図形の色、(5)図形の形状、の5つのグル-プに分類される。各概念グル-プに対するパラメ-タを抽出する。聴覚情報として、音声から音声情報を抽出する。方法としては、二つの音声の時系列デ-タ同士のDPマッチングを行ない、それによって算出された最適照合パスおよび照合距離により、類似区間を抽出する。次に、文音声とそれに関連する画像の前処理デ-タより音声と画像の対応付けから概念を獲得していくアルゴリズムを開発した。以前、我々が開発した概念獲得アルゴリズムは、画像の特徴パラメ-タの抽出ミスや音声の共通区間の抽出ミスに対してあまり考慮していなかった。また、学習用の音声と画像のペアの入力順序には多少の制限を設けていた。今年度は、これらに対しても概念が獲得できるアルゴリズムを開発した。評価実験として、まず音声の代りに誤りを含んだ文字列、画像の代りに画像特徴パラメ-タを用いてシミュレ-ション実験を行ない、正しく13個の概念(例えば三角形、丸、白い、大きい、左など)が獲得されていくことを確認した。さらに、実際に音声と画像した場合についても評価実験を行なった。音声の共通区間の抽出精度がシステムの性能にも大きく影響することが明らかになった。
In this study, the concept of visual and acoustic information was formulated based on the concept of external stimuli, unknown input forces, and objective information. The concept of the name and position of the object in the computer is studied by using the concept of the visual information (image) and the visual information (sound). The visual information is extracted from the visual image, and the concept is formed. The concepts that have been formed this time are: (1) the existence of the shape of The concept of the right to choose Sound information extraction The method is to calculate the optimal illumination distance and extract the similar interval. Second, the sound and sound of the image pre-processing, the sound and image of the concept of access to the open In the past, we have developed the concept of obtaining a complete set of images, characteristics of images, and extraction of common areas of sound. The input sequence of sound and image for learning is limited by the number of settings. This year, the concept of "anti-corruption" was launched. 13 concepts (e.g. triangle, pill, white center, large center, left center) were identified by this method. In the case of sound and image, the evaluation is carried out. The extraction accuracy of the common range of sound has a great influence on the performance of the sound system.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
古部 好計: "音声と画像の対応付けに基づく概念の獲得" 情報処理学会第44回全国大会論文集. 3. 27-28 (1992)
Yoshikei Furube:“基于音频和图像之间的对应关系获取概念”第 44 届日本信息处理学会全国会议记录(1992 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
古部 好計: "音声と画像の対応付けに基づく概念の獲得" 人工知能学会全国大会論文集. 189-192 (1991)
Yoshikei Furube:“基于声音和图像之间的对应关系获取概念”日本人工智能学会全国会议记录 189-192 (1991)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中川 聖一其他文献
A Study of Speaker Identification Using Phoneme-lnformation
利用音素信息识别说话人的研究
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英;Katsuyuki Obayashi - 通讯作者:
Katsuyuki Obayashi
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英 - 通讯作者:
北岡 教英
中川 聖一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('中川 聖一', 18)}}的其他基金
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
- 批准号:
19650040 - 财政年份:2007
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
セマンティックディジタルアーカイブのための音声・映像・言語の統合的処理
音频、视频、语言一体化处理,实现语义数字档案
- 批准号:
15630003 - 财政年份:2003
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声言語処理技術と学習者モデルを用いた語学学習システムの研究
利用口语处理技术和学习者模型的语言学习系统研究
- 批准号:
12040104 - 财政年份:2000
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
外国語コミュニケーション能力の総合的な養成研究
外语交际能力综合训练研究
- 批准号:
12040103 - 财政年份:2000
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
- 批准号:
05213209 - 财政年份:1993
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
- 批准号:
04229209 - 财政年份:1992
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声情報と画像情報の統合化による概念の獲得に関する研究
音频与图像信息融合的概念获取研究
- 批准号:
02805045 - 财政年份:1990
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音声・画像の視聴覚情報のシンボル記述化による自然言語文法の帰納的学習法の研究
利用音频、图像等视听信息的符号描述进行自然语言语法归纳学习方法研究
- 批准号:
01550284 - 财政年份:1989
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
高精度音声認識手法による音声の超極低ビットテキストファイル化・知的符号化合成方式
利用高精度语音识别方法将语音转换为超低比特文本文件及智能编码合成方法
- 批准号:
63550272 - 财政年份:1988
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音節セグメントの同定に基づく音声の超極低ビット符号化合成方式の研究
基于音节段识别的语音超低比特编码合成方法研究
- 批准号:
62550243 - 财政年份:1987
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
前立腺における病理画像情報の3次元可視化技術
前列腺病理图像信息3D可视化技术
- 批准号:
24K21119 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
肺がんCT検診の性能向上のための遺伝情報と画像情報の融合研究
遗传信息与图像信息融合研究提高肺癌CT筛查性能
- 批准号:
24K03308 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
深層学習による画像情報を主軸にした包括的な肺機能診断法の確立
利用深度学习建立基于图像信息的综合肺功能诊断方法
- 批准号:
23K21424 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
分散型自律組織 (DAO)における医療画像情報の管理運用における実施モデルの研究
去中心化自治组织(DAO)中医学图像信息管理与运营的实现模型研究
- 批准号:
23K14851 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
画像情報を用いた生活空間における混合音の理解に関する研究
利用图像信息理解生活空间中混合声音的研究
- 批准号:
23K11074 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習による医用画像情報の悉皆的理解
利用深度学习全面理解医学图像信息
- 批准号:
22KF0261 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for JSPS Fellows
画像情報と音響情報の統合による海域や年次変化を考慮した海底底質の高精度推定
通过整合图像和声学信息,考虑海洋面积和年度变化,高精度估计海底沉积物
- 批准号:
22K12076 - 财政年份:2022
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
肺癌の免疫治療における腫瘍免疫機能とPET/MRIを用いた画像情報の統合解析
肺癌免疫治疗中PET/MRI肿瘤免疫功能与影像信息综合分析
- 批准号:
22K07688 - 财政年份:2022
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像情報と時間情報を融合した新たな脳虚血コア判定システムの開発
结合图像信息和时间信息的新型脑缺血核心测定系统的开发
- 批准号:
21K07468 - 财政年份:2021
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
放射線治療で得られる疎な医用画像情報に対する深層画像処理の安定要件の探索
放射治疗中获得的稀疏医学图像信息深度图像处理的稳定性要求探讨
- 批准号:
21K12121 - 财政年份:2021
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




