音声データベースからの音声知識の発見

从语音数据库中发现语音知识

基本信息

  • 批准号:
    10143203
  • 负责人:
  • 金额:
    $ 1.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
  • 财政年份:
    1998
  • 资助国家:
    日本
  • 起止时间:
    1998 至 无数据
  • 项目状态:
    已结题

项目摘要

現在,マルチメディア情報のライブラリ化が急速に進められている.音声情報においてもニュースなどを自動的にライブラリ化していくことが強く望まれている.自動ライブラリ化は,発声内容が文字情報として与えられている場合とそうでない場合に分けることができる.与えられている場合には,文字情報と音声情報を対応させることが必要であり,そうでない場合には,音声情報のみから話題の要約が必要になる.本研究では,発声内容に関する文字情報が与えられた場合とそうでない場合に分けて研究を行った.文字情報が与えられた場合には,音声情報と言語情報を対応させるために,高精度な音素モデルと高精度な対応付けの方法が必要になる.文字情報が与えられない場合には,汎用の言語モデルや,音声区間の類似性を高速に計算する方法が必要になる.本年度はこれらの研究目的を達成するために,以下の3項目について研究を行った.1. 音声情報と文字情報を対応させるための高精度音素モデルの自動構築法の開発.2. 高精度音素モデルを用いた音声情報と文字情報の高精度対応づけ(自動音素ラベリング)の方法の開発.3. 音響的類似性を利用した,発声内容をあらわすキーワードの自動抽出法の開発.研究項目の1番目に関しては,従来利用されていた方法より高精度な音素モデルを自動的に構築することができた.この方法は事前に要因を規定する必要がないので,要因を規定できない言語モデルの獲得や認識単位の自動設定などへの応用も可能である.しかし,まだ十分なものとは言えず,一層の高精度化が必要である.研究項目の2番目に関しては,一層の高精度化にはパラメータの差分情報や周波数上の利用が必要である.研究項目の3番目に関しては,音響的類似性のみから高頻度で発声されている共通区間を自動的に抽出する手法を開発した.しかし,「〜ました」などの話題に依存しない単語も検出された.今後これらの付属語を除去するために,基本周波数情報や言語情報の利用が必要になると考えている.
Now, the rapid development of information. Sound information is transmitted automatically to the user. Automatic translation, voice content from text information to text information, and from text information to text information. In the case of text information and audio information, it is necessary to offer audio information and topic information. This study is about the text information related to the sound content and the situation. Text information and speech information are the same, and high precision phoneme information and high precision method are necessary. Text information is necessary for high speed calculation of similarity between speech and sound. This year's research objectives were achieved, and the following 3 projects were carried out. 1. Development of Automatic Construction Method for High Precision Phoneme Information and Text Information. 2. Development of a method for high-precision phoneme matching (automatic phoneme matching) of high-precision phoneme matching (automatic phoneme matching) for audio and text information. 3. The similarity of sound is utilized, and the automatic extraction method of sound content is developed. The first part of the research project is to use the method of high precision phoneme construction automatically. This method is based on the requirement that the user should specify the language in advance, and the possibility of automatic setting of the acquired recognition unit. A layer of high precision is necessary. The research project of the two aspects is related to the need for a layer of high precision, differential information and utilization of frequency. The three aspects of the research project are related to the development of methods for automatic extraction of common intervals from high frequency and acoustic similarity. The topic of "~" depends on the language of the topic. In the future, basic frequency information and speech information are necessary for the use of speech information.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Suzuki,Maeda,Makino: "Automatic Acquisition of Phoneme Models and Its Application to Phoneme Labeling of a Large Size of Speech Corpus" Proc.of Discovery Science '98. 437-438 (1998)
Suzuki、Maeda、Makino:“音素模型的自动获取及其在大型语音语料库音素标记中的应用”Proc.of Discovery Science 98。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
鈴木,原田,牧野,阿曽: "離散型HMnetを用いた言語モデルの獲得" 電子情報通信学会論文誌D-II. J81,12. 2695-2702 (1998)
Suzuki、Harada、Makino、Aso:“使用离散 HMnet 的语言模型获取”IEICE Transactions D-II,12. 2695-2702 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
前田,鈴木,牧野: "連続音声の自動ラベリングにおけるHMnetとHMMの比較" 日本音響学会平成10年度秋季研究発表会講演論文集. 3-1-3. 87-88 (1998)
Maeda、Suzuki、Makino:“连续语音自动标记中的 HMnet 和 HMM 的比较”日本声学学会 1998 年秋季会议记录 3-1-3 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
鈴木,牧野: "離散型HMnetを用いた日本語文法構造の自動獲得" 人工知能学会人工知能基礎論研究資料. FAI-9803. 101-104 (1998)
Suzuki,Makino:“使用离散 HMnet 自动获取日语语法结构”人工智能基础研究材料,人工智能协会 FAI-9803 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
前田,鈴木,牧野: "局所的特徴に着目した連続音声の自動ラベリング" 日本音響学会平成11年度春季研究発表会講演論文集. 3-Q-8. 133-134 (1999)
Maeda、Suzuki、Makino:“关注局部特征的连续语音的自动标记”日本声学学会 1999 年春季会议记录 3-Q-8 (1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

牧野 正三其他文献

大規模問題における階層型並列分散遺伝的アルゴリズムの影響についての考察
考虑层次并行分布式遗传算法对大规模问题的影响
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小嶋 和徳;石亀 昌明;牧野 正三
  • 通讯作者:
    牧野 正三
TSP2392における階層サーバ・クライアント型モデルの効果に関する考察
考虑TSP2392中分层服务器/客户端模型的影响
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小嶋 和徳;石亀 昌明;牧野 正三
  • 通讯作者:
    牧野 正三
Music Information Retrieval from a Singing Voice Using Lyrics and Melody Information
使用歌词和旋律信息从歌声中检索音乐信息

牧野 正三的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('牧野 正三', 18)}}的其他基金

非母国語話者のための韻律を包含する発音学習システムに関する研究
针对非母语人士的包含韵律的发音学习系统的研究
  • 批准号:
    12040101
  • 财政年份:
    2000
  • 资助金额:
    $ 1.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声データベースからの音声知識の発見
从语音数据库中发现语音知识
  • 批准号:
    11130204
  • 财政年份:
    1999
  • 资助金额:
    $ 1.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
男女声母音を対象とした分析と認識に関する研究
男女声元音分析与识别研究
  • 批准号:
    56790015
  • 财政年份:
    1981
  • 资助金额:
    $ 1.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
不特定男性話者を対象とする単語音声認識システムに関する研究
不特定男性说话人的单词语音识别系统研究
  • 批准号:
    X00210----475258
  • 财政年份:
    1979
  • 资助金额:
    $ 1.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音節単位で表記された日本語単語構造のパターン認識論的研究
日语音节词结构的模式认识论研究
  • 批准号:
    X00210----375173
  • 财政年份:
    1978
  • 资助金额:
    $ 1.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
日本語単語構造のパターン認識論的研究
日语单词结构的模式认识论研究
  • 批准号:
    X00210----275179
  • 财政年份:
    1977
  • 资助金额:
    $ 1.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音声認識における単語辞書の能率的な構成と換索に関する研究
语音识别中单词词典的高效构建与替换研究
  • 批准号:
    X00210----075054
  • 财政年份:
    1975
  • 资助金额:
    $ 1.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了