权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

音声・画像の視聴覚情報のシンボル記述化による自然言語文法の帰納的学習法の研究

利用音频、图像等视听信息的符号描述进行自然语言语法归纳学习方法研究

基本信息

批准号：
01550284
负责人：
中川聖一
金额：
$ 1.28万
依托单位：
Toyohashi University of Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for General Scientific Research (C)
财政年份：
1989
资助国家：
日本
起止时间：
1989 至无数据
项目状态：
已结题

项目摘要

本研究の目的は、音声と画像の視聴覚情報を用いて、我々の日常言語の文法を学習・獲得するモデルを計算機上で実現することである。そのために二つの音声間や画像間の差異や一致を検出するアルゴリズム、音声や画像をシンボルで記述するアルゴリズム、シンボル記述化された音声と画像の対応づけアルゴリズム、これらの対応づけ集合から文法を推論するアルゴリズム等の開発が必要である。まず二つの音声間の差異や一致の検出においては、従来の音声認識アルゴリズムを拡張して、線形時間で実行できるアルゴリズムを開発した。この手法は音声がパタ-ン表現であってもシンボル表現であっても適用できる汎用性のあるアルゴリズムである。次に音声パタ-ンをシンボル系列に変換するアルゴリズムを開発した。基本的には1つのシンボルに対応する音素と隠れマルコフモデルで表現し、この連結モデルと音声パタ-ンを照合するもので本研究ではマルコフモデルの精密化を図った。これにより、ていねいに発声された音声に対して、約95%の精度で正しくシンボル系列に変換できた。また、入力線画の理解において既に学習されている“概念"との一致・差異を検出するアルゴリズム、および任意の二つの画像の一致差異を検出するアルゴリズムについて検討した。これらのアルゴリズムは、シンボル記述された同士間の類似度の最大値選択または、類似度の整列問題となり高速化手法が望まれる。このため、自己相以型計算機上でデ-タ数Nに対して、O(N)整列問題を解く並列アルゴリズム、階層型計算機上ではO(log^2N)で選択問題を解く並列アルゴリズムを提案し、有効性を確かめた。以上のように、本研究の目的に必要な基本アルゴリズムの開発ができた。今後は、これらの基本アルゴリズムの統合により、音声と画像のつき合わせによる同一概念の獲得と文法の学習をすすめて行きたい。

Purpose の this study は, voice と portraits の hearing intelligence を with いて, I 々の daily speech をの grammar learning, get するモデルでを computer be presently することである. そのために two つのや portraits の differences between sounds や consistent を検 out するアルゴリズム portrait, voice やをシンボル account でするアルゴリズム, シンボル account change された sounds と portrait の応 seaborne づけアルゴリズム, これらの応 seaborne づけ collection から grammar を inference するアルゴリズム etc. の open 発が necessary である. まず two つのの differences between sounds や consistent の検 out においては, 従の sounds know アルゴリズムを company, zhang して, linear time で line be できるアルゴリズムを open 発した. この gimmick は sounds がパタ - ン performance であってもシンボル performance であっても applicable できる domestic sex のあるアルゴリズムである. The に tone パタ- <s:1> をシをシをシボボに series に changes するアゴリズムをゴリズムをゴリズムを develops たた. Basic には 1 つのシンボルに応 seaborne する phonemes と government れマルコフモデルでし, この link モデルと sounds パタ - ンを as close するもので this study ではマルコフモデルの motors を図った. これにより, ていねいに発 sound された sounds にし seaborne て, about 95% is の precision でしくシンボル series に variations in できた. また, into the line of force の understand においてに learning both されている "concept" との is consistent, difference を検 out するアルゴリズム, および arbitrary の two つの portrait の consistent differences を検 out するアルゴリズムについて beg し検た. これらのアルゴリズムは, シンボル account された with James の similar degree between の nt biggest sentaku または, similar degree の whole column problem となり looking high technique がまれる. このため to type on a computer, their phase でデ - タ number N にし seaborne て, O (N) the whole column problem を solution く parallel アルゴリズム type, class computer では O (log N ^ 2) で sentaku くを solutions are tied for アルゴリズムを proposal し, have sharper をか indeed めた. The above <s:1> ように, the purpose of this study にに necessary な basic アゴリズムゴリズムゴリズム development がでたた. Future は, これらの basic アルゴリズムの integration により portrait, voice とのつき close わせによる same concept の get と study grammar のをすすめて line きたい.