音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
基本信息
- 批准号:05213209
- 负责人:
- 金额:$ 0.96万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1993
- 资助国家:日本
- 起止时间:1993 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は、人間の幼児がどのような情報によって概念形成を行なっているかを考察し、工学的に概念形成メカニズムを計算機上で実現することを目的とした。人間の場合、いくつかの感覚器を単独であるいは組み合わせて使用し、外部からの刺激を感じてそれらの情報が脳に伝えられ様々な概念を獲得していると考えられる。その中でも特に、視覚と聴力が最も重要な役割を果しているであろうことは容易に想像がつく。そこでこの視覚と聴覚によって得られる情報、つまり音声と画像の情報を用いて計算機に物の名前や位置等の概念を学習させるシステムを作成した。つまり、ある物を表現する画像があったとするとその画像を説明する文を音声によって与えることにより、逐次画像上の形状・色・大きさ・位置といった概念に対応する音声言語を獲得すること、逆に言えば、ある「音」に対応する形状の概念を獲得することが本研究の目標である。但し、物の名前や位置等の概念を単語として与えるのではなく、簡単な文の音声データとそれに対応する画像データを用いて、形状・大きさ・位置・色等の概念を形成することとした。このことから、画像同士の類似性の自動判定・音声同士の類似性の自動判定・画像と音声の対応付け等の機能が基本操作となる。画像情報と音声情報から概念と文法を獲得するシステムを作成し実験を行なった。概念の獲得では対象概念を概ね獲得することができた。left-to-right型HMMによる概念の発声順序、即ち、文法の獲得を試み、正しく獲得された概念を含む画像に対しては全て正しい文を生成できた。本システムでは、音声のスポッティングが動機となって学習が行なわれるため、音声のスポッティングの性能が概念及び文法の獲得に大きく影響する。実際の音声と画像入力を用いて獲得された概念をHMMの入力として文法を獲得した場合、与えられた画像に対して、約50%が正しい概念の系列(文)に変換できた。
This study aims to investigate the concept formation process of human children and the concept formation process of engineering. In the human world, there are different kinds of sensors. They are used in different ways. There are different kinds of stimuli. There are different kinds of information. There are different kinds of concepts. In the middle of the game, the most important thing is to watch the game and imagine it. The concept of the object's name and position is used to create information, sound and image. The purpose of this study is to obtain the concept of sound and speech. However, the concept of name, position, etc. of objects is simple and simple, and the concept of image, shape, position, color, etc. is formed. The functions of automatic determination of similarity between images, automatic determination of similarity between sound and image, automatic determination of similarity between sound and image, and so on are basic operations. The image and sound information are obtained from the concept and syntax. The concept of acquisition is the concept of acquisition. The left-to-right HMM concept is transmitted in sequence, i.e., the grammar is acquired, the concept is acquired, and the image is generated. This article discusses the influence of motivation, performance and grammar on learning. In fact, the sound and image are used to obtain the concept of HMM, the grammar is used to obtain the situation, and the image is used to obtain the concept of series (text).
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中川聖一: "視聴覚情報の統合化に基づく概念の獲得" 人工知能学会誌. 8. 499-508 (1993)
Seiichi Nakakawa:“基于视听信息整合的概念获取”日本人工智能学会杂志 8. 499-508 (1993)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
弁方 幹雄: "画像情報と音声情報からの概念と文法の獲得" 情報処理学会全国大会論文集. 3. 33-34 (1994)
Mikio Benkata:“从图像和音频信息获取概念和语法”日本信息处理学会全国会议论文集 3. 33-34 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中川 聖一其他文献
A Study of Speaker Identification Using Phoneme-lnformation
利用音素信息识别说话人的研究
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英;Katsuyuki Obayashi - 通讯作者:
Katsuyuki Obayashi
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英 - 通讯作者:
北岡 教英
中川 聖一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('中川 聖一', 18)}}的其他基金
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
- 批准号:
19650040 - 财政年份:2007
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
セマンティックディジタルアーカイブのための音声・映像・言語の統合的処理
音频、视频、语言一体化处理,实现语义数字档案
- 批准号:
15630003 - 财政年份:2003
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声言語処理技術と学習者モデルを用いた語学学習システムの研究
利用口语处理技术和学习者模型的语言学习系统研究
- 批准号:
12040104 - 财政年份:2000
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
外国語コミュニケーション能力の総合的な養成研究
外语交际能力综合训练研究
- 批准号:
12040103 - 财政年份:2000
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
- 批准号:
04229209 - 财政年份:1992
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合音频、语言、图像信息的概念获取研究
- 批准号:
03245209 - 财政年份:1991
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声情報と画像情報の統合化による概念の獲得に関する研究
音频与图像信息融合的概念获取研究
- 批准号:
02805045 - 财政年份:1990
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音声・画像の視聴覚情報のシンボル記述化による自然言語文法の帰納的学習法の研究
利用音频、图像等视听信息的符号描述进行自然语言语法归纳学习方法研究
- 批准号:
01550284 - 财政年份:1989
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
高精度音声認識手法による音声の超極低ビットテキストファイル化・知的符号化合成方式
利用高精度语音识别方法将语音转换为超低比特文本文件及智能编码合成方法
- 批准号:
63550272 - 财政年份:1988
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音節セグメントの同定に基づく音声の超極低ビット符号化合成方式の研究
基于音节段识别的语音超低比特编码合成方法研究
- 批准号:
62550243 - 财政年份:1987
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似国自然基金
人工智能时代师范院校学生“群体-个体”双维画像构建及精准思政实践路径研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
数字画像赋能高职生精准就业的机理与路径研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
脑卒中患者家庭照顾者画像模型构建与动态支持策略研究
- 批准号:2025JJ81132
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于“风险画像 ”的冠状动脉旁路移植术患者房颤预警模型及动态适配管理模式构建与实证研究
- 批准号:GDHLYJYZ202401
- 批准年份:2025
- 资助金额:3.0 万元
- 项目类别:省市级项目
基于多模态基座模型的教师全息画像技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
恶性肿瘤患者参与医疗决策行为画像的构建及引导策略研究
- 批准号:2025JJ80816
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于深度学习的变革性研究动态画像构建研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于多源健康数据的肺癌居家患者画像构建及动态健康风险预测研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于画像的规培护士和规培导师双边匹配模型构建及验证
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于“用户画像”的老年肿瘤患者就医需求预测及精准服务支持系统的研究
- 批准号:2025JJ80831
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
病理画像診断の言語モデルをもった口腔がんの新たな診断法の基盤構築
使用病理图像诊断语言模型为新型口腔癌诊断方法奠定基础
- 批准号:
24K13114 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
筋評価が口腔機能低下症の診断に果たす役割:舌超音波画像特徴量の探索と筋構造の解析
肌肉评估在诊断口腔功能减退中的作用:舌超声图像特征探索和肌肉结构分析
- 批准号:
24K13211 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
XAI(説明可能な人工知能)を用いた口臭画像診断システムの開発研究
利用XAI(可解释人工智能)研发口臭图像诊断系统
- 批准号:
24K13210 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
脊椎疾患に対する画像・臨床データ・カルテ記載を統合したマルチモーダルなAI予後予測
整合脊柱疾病图像、临床数据和病历描述的多模态 AI 预后预测
- 批准号:
24K12366 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習による膠原病肺の新規画像分類の確立
利用深度学习建立一种新的胶原病肺部图像分类方法
- 批准号:
24K11624 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
食事画像認識AI搭載カーボカウントアプリケーションの有用性に関する特定臨床研究
配备膳食图像识别 AI 的碳水化合物计数应用程序实用性的具体临床研究
- 批准号:
24K11672 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
人工知能による画像診断とメタボロミクスを融合した乳癌リンパ節転移予測モデルの開発
利用人工智能开发结合图像诊断和代谢组学的乳腺癌淋巴结转移预测模型
- 批准号:
24K11752 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
形状理解のためのマルチモーダル学習による、敵対的摂動に頑健な画像認識モデル開発
使用多模态学习进行形状理解,开发对对抗性扰动具有鲁棒性的图像识别模型
- 批准号:
24KJ0716 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for JSPS Fellows
画像解析センター設立による中枢性脱髄性疾患の早期診断実現と画像的特徴の解明
建立影像分析中心,实现中枢性脱髓鞘疾病的早期诊断并阐明影像特征
- 批准号:
24K10632 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
拡散テンソル画像を用いた膠芽腫における細胞間質液灌流と浸潤の関係の解明
使用扩散张量成像阐明胶质母细胞瘤细胞间液灌注与侵袭之间的关系
- 批准号:
24K10791 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)