音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
基本信息
- 批准号:04229209
- 负责人:
- 金额:$ 1.28万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1992
- 资助国家:日本
- 起止时间:1992 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、視覚と聴覚という2つの外的刺激を結びつけて未知の入力に対する概念の獲得方式を定式化し、機械的に効率のよい帰納的・確率的概念獲得アルゴリズムを確立することを目的としている。昨年度は、実際に音声と画像を与えることにより、その音声が意味する画像の内容(逆に、画像特徴が意味する音声表現)を概念として獲得するシステムを作成したが、今年度は発話順序の制限をゆるめたシステムを開発した。現在、相対位置の概念を扱うシステムを開発している。以前開発したシステムでは、音声や画像の特徴抽出ミスに全く対処しておらず、正しい概念を獲得する上で入力データの順序にも制約があった。昨年度は、これらの欠点に対処すべく、階層構造の概念辞書を構築し概念の一般化操作を繰り返す方法で、この点に対処した。反面、この方法では2概念間の共通概念のみを利用しており、残りの概念が利用されない点等の問題が残った。そこで今年度は、2概念間の共通部・特徴部の両方を使用し、音声の特徴抽出ミスに対処し、入力データの順序に制約のないシステムを作成し評価した。学習で形成する概念は、図形の存在性、図形の絶対位置、図形の大きさ、図形の色、図形の形状の五つの概念グループ(画像の特徴パラメータ次元と対応)に分類されるものとした。また、音声概念に関しては、DPマッチング法により二音声間の類似区間を抽出する方法と、ワードスポッティング法により、ある音声が入力音声中に含まれているかどうかを検出する方法を用いた。評価実験により、実際の音声の実画像人力を用いて学習を行なうことにより、ある概念に対応する音と画像上の特徴とが対応付けられ、人間の概念獲得手法の初期段階が計算上で実現できることがわかった。今後、複数図形からの特徴パラメータの抽出およびアクションの概念獲得等を解決していく必要がある。
In this study, we formalized the acquisition mode of the concept of the unknown input force, and established the objective of the concept of the mechanical input rate. The content of the image (inverse, image characteristics, meaning, sound performance) was created in the past year, and the limit of the speech sequence was developed in the present year. Now, the concept of relative position is developed. In the past, the development of sound and image feature extraction was completely restricted by the order of force acquisition. The last year, the lack of point, hierarchical structure of the concept of dictionary construction, the general operation of the point On the contrary, this method is used to solve the problem of common concepts between concepts. This year, the common part of the concept, the use of the feature part, the sound feature extraction, the entry of the order of the constraint, the creation of the evaluation Learning to form the concept of "the existence of a shape, the absolute position of a shape, the size of a shape, the color of a shape, and the concept of a shape"(the characteristics of a picture are divided into two dimensions) The concept of sound is related to the method of extracting the similar interval between two sounds. Evaluation of sound and images in real time Human resources learning is the first step in the calculation of sound and image characteristics. In the future, the characteristics of the complex shape of the film will be extracted from the film and the concept of the film will be obtained.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中川 聖一: "視聴覚情報の統合化に基づく概念の獲得" 人工知能学会誌. 8. (1993)
Seiichi Nakakawa:“基于视听信息整合的概念获取”人工智能学会杂志 8。(1993)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
中西 宏文: "音声情報と画像情報の統合化による概念獲得" 電子情報通信学会、春季大会論文集. D-203. (1993)
Hirofumi Nakanishi:“通过集成音频和图像信息获取概念”IEICE 春季会议论文集 D-203。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中川 聖一其他文献
A Study of Speaker Identification Using Phoneme-lnformation
利用音素信息识别说话人的研究
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英;Katsuyuki Obayashi - 通讯作者:
Katsuyuki Obayashi
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英 - 通讯作者:
北岡 教英
中川 聖一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('中川 聖一', 18)}}的其他基金
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
- 批准号:
19650040 - 财政年份:2007
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
セマンティックディジタルアーカイブのための音声・映像・言語の統合的処理
音频、视频、语言一体化处理,实现语义数字档案
- 批准号:
15630003 - 财政年份:2003
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声言語処理技術と学習者モデルを用いた語学学習システムの研究
利用口语处理技术和学习者模型的语言学习系统研究
- 批准号:
12040104 - 财政年份:2000
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
外国語コミュニケーション能力の総合的な養成研究
外语交际能力综合训练研究
- 批准号:
12040103 - 财政年份:2000
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
- 批准号:
05213209 - 财政年份:1993
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合音频、语言、图像信息的概念获取研究
- 批准号:
03245209 - 财政年份:1991
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声情報と画像情報の統合化による概念の獲得に関する研究
音频与图像信息融合的概念获取研究
- 批准号:
02805045 - 财政年份:1990
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音声・画像の視聴覚情報のシンボル記述化による自然言語文法の帰納的学習法の研究
利用音频、图像等视听信息的符号描述进行自然语言语法归纳学习方法研究
- 批准号:
01550284 - 财政年份:1989
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
高精度音声認識手法による音声の超極低ビットテキストファイル化・知的符号化合成方式
利用高精度语音识别方法将语音转换为超低比特文本文件及智能编码合成方法
- 批准号:
63550272 - 财政年份:1988
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音節セグメントの同定に基づく音声の超極低ビット符号化合成方式の研究
基于音节段识别的语音超低比特编码合成方法研究
- 批准号:
62550243 - 财政年份:1987
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
前立腺における病理画像情報の3次元可視化技術
前列腺病理图像信息3D可视化技术
- 批准号:
24K21119 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
肺がんCT検診の性能向上のための遺伝情報と画像情報の融合研究
遗传信息与图像信息融合研究提高肺癌CT筛查性能
- 批准号:
24K03308 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
深層学習による画像情報を主軸にした包括的な肺機能診断法の確立
利用深度学习建立基于图像信息的综合肺功能诊断方法
- 批准号:
23K21424 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Addressing Urgent Calls for Public Health Workforce Planning: Establishing and Implementing National Indicators to Profile and Monitor the Public Health Workforce in Canada
满足公共卫生人力规划的迫切需求:建立和实施国家指标来描述和监测加拿大公共卫生人力
- 批准号:
498865 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Operating Grants
分散型自律組織 (DAO)における医療画像情報の管理運用における実施モデルの研究
去中心化自治组织(DAO)中医学图像信息管理与运营的实现模型研究
- 批准号:
23K14851 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Use of normo-thermic perfused organs to profile PK and infection efficiency of novel viral gene therapy vectors.
使用常温灌注器官来分析新型病毒基因治疗载体的 PK 和感染效率。
- 批准号:
2891748 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Studentship
Addressing Urgent Calls for Public Health Workforce Planning: Establishing and Implementing National Indicators to Profile and Monitor the Public Health Workforce in Canada
满足公共卫生人力规划的迫切需求:建立和实施国家指标来描述和监测加拿大公共卫生人力
- 批准号:
488446 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Operating Grants
画像情報を用いた生活空間における混合音の理解に関する研究
利用图像信息理解生活空间中混合声音的研究
- 批准号:
23K11074 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Use of normo thermic perfused organs to profile PK and infection efficiency of novel viral gene therapy vectors
使用常温灌注器官来分析新型病毒基因治疗载体的 PK 和感染效率
- 批准号:
BB/Y51343X/1 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Training Grant
深層学習による医用画像情報の悉皆的理解
利用深度学习全面理解医学图像信息
- 批准号:
22KF0261 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for JSPS Fellows














{{item.name}}会员




