信号処理的手法を用いた言語のモデル化に関する研究

使用信号处理技术的语言建模研究

基本信息

  • 批准号:
    09780326
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 1998
  • 项目状态:
    已结题

项目摘要

音声認識における、統計的言語モデルと統計的音声モデルとの統合過程において必要とされる、言語重みと単語挿入ペナルティーの理論的意味づけに取り組んだ。これらのパラメータはこれまで経験的な、調整パラメータとして扱われてきたが、両者が認識対象の音声文の言語エントロピーと、認識に用いた言語モデルと認識対象文とのクロスエントロピーとを調整する働きを持つパラメータであることを、理論的に示した。さらに、音声認識実験により、用意された2つの言語モデルに対して、上記の基準に基づき与えた異なる2つの言語重みパラメータにより、ほぼ最適な認識性能が得られることが明らかとなり、理論の正当性が実験的に確認された。単語間の接続性に基づき言語空間を探索するために、バイグラム行列の特異値分解に基づく、単語・文脈の線形部分空間表現を獲得した。具体的には、97年度に作成した、新聞記事データベースからバイグラム行列を作成し、ランク数を10〜3000程度まで変化させ、ランク数とバイグラムのエントロピーとの関係を調査し、300程度のランク(部分空間)で、単語・文脈双方の情報を効率的に表現可能なことを明らかにした。構成された部分空間が言語の意味を適切に表現していることは、部分空間上での単語・文脈クラスタリングが、エントロピーの削減に効率的であったことからも、確認された。具体的には、学習された部分空間上で、次元数を変化させ、空間の測度(ユークリッド距離)に基づき単語・文脈を独立にクラスタリングすることで、それぞれ最適なグループ分けを行なうことが可能なことを明らかにした。
Sound recognition, statistical speech, statistical sound integration process, the importance of speech, language selection, theoretical meaning of the group For example, if you want to know the language of the image, you can adjust it. In addition, the sound recognition of the two sets of speech, the intention of the two sets of speech, the basis of the above record, and the difference between the two sets of speech, the optimal cognitive performance of the two sets of speech, the theoretical legitimacy of the two sets of speech, the recognition of the two sets of speech. Interlingual connectivity, basic speech space exploration, special value decomposition, basic language, context, and spatial representation Specifically, in 2007, the production of news items, the number of categories, the number of categories, the The meaning of speech is represented appropriately in some spaces. The meaning of speech is represented appropriately in some spaces. The meaning of speech is represented appropriately in some spaces. Specific, learning, part of the space, the number of dimensions, spatial measurement (distance), the basic language, context, independent, the most appropriate, the most appropriate.

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
小川・武田・板倉: "文長を考慮した言語モデルの検討" 情報処理学会、音声言語処理研究会資料. 16・5. 25-30 (1997)
Okawa、Takeda 和 Itakura:“考虑句子长度的语言模型研究”,日本信息处理协会,语音和语言处理研究小组材料 16/5 (1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
小川・武田・板倉: "一般化ベルヌ-イ試行に基づく言語モデル" 音響学会 全国大会 講演論文集(平成9年度秋期). 2-1-1. 49-50 (1997)
Okawa、Takeda 和 Itakura:“基于广义伯努利试验的语言模型”日本声学学会全国会议论文集(1997 年秋季 2-1-50)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Takeda,A.Ogawa,F.Itakura: "Estimating Entropy of a Language from Optimal Word Insertion tenalty" Proc,Intro Conf.Spoken Language Processing(ICSLP98). 5. 2095-2098 (1998)
K.Takeda、A.Okawa、F.Itakura:“根据最佳词插入能力估计语言的熵”Proc,介绍会议口语处理(ICSLP98)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
寺島、武田、板倉: "bigram行列の特異値分解による分析" 日本音響学会 平成11年度 春期研究発表会講演論文集. I. (1998)
Terashima、Takeda、Itakura:“通过奇异值分解分析二元矩阵”日本声学学会 1999 年春季研究会议论文集 I. (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
A.Ogawa, K.Takeda, F.Itakura: "Language Modeling for Robust Balancing of Acoustic and Lingustic Probablities" Proc.of.IEEE Workshop on Automatic Speech and Understanding Recognition. 246-253 (1997)
A.Okawa、K.Takeda、F.Itakura:“用于声学和语言概率鲁棒平衡的语言建模”Proc.of.IEEE 自动语音和理解识别研讨会。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

武田 一哉其他文献

Multiple-mutation at a potential ligand-binding region decreased allergenicity of a mite allergen Der f 2 without disrupting global structure
潜在配体结合区域的多重突变降低了螨过敏原 Der f 2 的过敏原性,而不破坏整体结构
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kiyokawa N;Sekino T;Matsui T;Takenouchi H;Mimori K;Tang WR;Matsui J;Taguchi T;Katagiri YU;Okita H;Matsuo Y;Karasuyame H;Fujimoto J;荒川礼佳;武田 一哉;Kazuyoshi Takeda;Takuya Nakazawa
  • 通讯作者:
    Takuya Nakazawa
深層学習によるボトルネック特徴量を用いたマルチモーダル音声認識
使用深度学习使用瓶颈特征进行多模态语音识别
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田村 哲嗣;二宮 宏史;北岡 教英;大須賀 晋;入部 百合絵;武田 一哉;速水 悟
  • 通讯作者:
    速水 悟
波面合成におけるチャネル数の主観的影響 -音源が正面付近にある場合-
声道数对波场合成的主观影响-当声源靠近前方时-
視覚画像の提示時間と感性評価
视觉图像呈现时间和情感评价
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 敏幸;筧 一彦;武田 一哉;板倉 文忠;岩城達也
  • 通讯作者:
    岩城達也
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲
  • 通讯作者:
    中村 哲

武田 一哉的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('武田 一哉', 18)}}的其他基金

Cross-disciplinary research on the prediction and control of real-world interactions based on evidence and causality
基于证据和因果关系预测和控制现实世界相互作用的跨学科研究
  • 批准号:
    21H04892
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
確率モデルによる運転行動信号の生成
使用概率模型生成驾驶行为信号
  • 批准号:
    18650037
  • 财政年份:
    2006
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Exploratory Research

相似海外基金

Noise-Adaptive Statistical Speech Synthesis in Varying Acoustic Environments
不同声学环境中的噪声自适应统计语音合成
  • 批准号:
    25880027
  • 财政年份:
    2013
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Deep architectures for statistical speech synthesis
用于统计语音合成的深层架构
  • 批准号:
    EP/J002526/1
  • 财政年份:
    2011
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Fellowship
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
配列の対を生成する統計的言語モデルの開発と配列解析への適用
生成序列对的统计语言模型的开发及其在序列分析中的应用
  • 批准号:
    15700244
  • 财政年份:
    2003
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
日本語音声認識のための統計的言語モデルとそのタスク適応に関する研究
日语语音识别统计语言模型及其任务适配研究
  • 批准号:
    09780307
  • 财政年份:
    1997
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了