確率オートマトンに基づく曖昧検索モデルの発話テキストへの適用

基于随机自动机的模糊搜索模型在口语文本中的应用

基本信息

  • 批准号:
    14780329
  • 负责人:
  • 金额:
    $ 2.18万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2004
  • 项目状态:
    已结题

项目摘要

文字認識(OCR)の生の出力テキストに対して認識誤りの存在を考慮しながら検索を行う曖昧検索手法を、音声認識(SR)の出力テキストに対して応用する方法について検討および提案した。今年度は、様々な曖昧検索手法について比較検討し、国際会議などにおける現地調査を含む関連研究の幅広い調査を行った。1.音声曖昧検索手法の比較検討英文発話テキストを具体的に曖昧検索する方法について検討した。文字認識と音声認識の結果の大きな違いはその認識率であり、活字文字認識率が95から99%であるのに対し、音声認識率は50から80%程度である。この認識率の差は提案する曖昧検索モデルに大きな影響を与えるため、発話テキスト検索では調整が必要となる。具体的には、認識誤りを含まない元のテキストと認識結果とのアラインメント方法、認識誤りの抽出方法、認識誤りの分類方法、確率オートマトンのパラメータの推定方法などについて、発話テキストの曖昧検索に適用可能な方法を検討した。Soundexのように類似した音節を同一のものとして扱う手法は検索精度の点で不十分で、提案手法のように認識誤りの特性を考慮する必要がある。また曖昧に検索するためのコストは検索精度とトレードオフの関係にあるが、現実的なコストで十分な検索精度を実現する必要がある。2.調査音声曖昧検索の研究は発表事例が少ないため、国内外の論文誌等資料を収集するとともに、最新の研究事例について国際会議などに出席して直接調査した。特にメタ検索エンジンなどのWebアプリケーションに組み込んで利用できれば有効と考えており、このような利用方法について検討した。
Text recognition (OCR) is a method of generating output data, considering the existence of cognitive errors, searching for ambiguous search methods, and sound recognition (SR) is a method of generating output data, discussing and proposing. This year's survey of research methods, comparative studies, international conferences, field surveys, and related research was conducted. 1. A Comparative Study of the Methods of Sound Ambiguity Search The recognition rate of character recognition and sound recognition is 95%, the recognition rate of movable character is 99%, and the recognition rate of sound is 50%. The difference in recognition rate is due to the large impact and necessity of adjustment. Specifically, the method of cognitive error including the original information and cognitive results, the method of extracting cognitive error, the method of classifying cognitive error, the method of estimating the accuracy of cognitive error, and the possible applicable methods for ambiguous search of speech information are discussed. Soundex is similar to syllables, but it is necessary to take into account the characteristics of cognitive errors. The relationship between the accuracy of the search and the accuracy of the search is not clear. 2. The research of sound and sound detection includes the collection of data from domestic and foreign papers, the latest research cases, attendance at international conferences and direct investigation. Special information on the use of Web applications, such as web applications, etc.

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
M.OHTA, H.NARITA, K.KATAYAMA, H.ISHIKAWA: "Overlapping clustering methods for a Japanese meta search engine"Proc.TASTED International Conference on Databases and Applications (DBA 2004). 100-106 (2004)
M.OHTA、H.NARITA、K.KATAYAMA、H.ISHIKAWA:“日本元搜索引擎的重叠聚类方法”Proc.TASTED 国际数据库和应用会议(DBA 2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M.OHTA, A.TAKASU, J.ADACHI: "Probabilistic automaton-based fuzzy English-text retrieval"IEICE Trans.Inf.& Syst.. Vol.E86-D, No.9. 1835-1844 (2003)
M.OHTA、A.TAKASU、J.ADACHI:“基于概率自动机的模糊英文文本检索”IEICE Trans.Inf。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
斜交基底を用いたメタ検索におけるランクリストの統合方法の提案
提出一种使用倾斜基础在元搜索中整合排名列表的方法
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

太田 学其他文献

学校図書館法
学校图书馆法
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川上 尚慶;太田 学;高須 淳宏;安達 淳;Atsuhiro Takasu and Manabu Ohta;平久江祐司
  • 通讯作者:
    平久江祐司
多元的デジタルアーカイブズのVR-ARインターフェイスデザイン手法
多维数字档案馆VR-AR界面设计方法
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石本 茜;太田 学;高須 淳宏;安達 淳;渡邉英徳,佐藤康満
  • 通讯作者:
    渡邉英徳,佐藤康満
CRFによる参考文献文字列からの書誌要素抽出の一手法
一种利用CRF从参考文献字符串中提取书目元素的方法
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    荒内 大貴;太田 学;高須 淳宏;安達 淳
  • 通讯作者:
    安達 淳
CRFによる論文文書画像の書誌要素推定における自動誤り検出
使用 CRF 进行文章文档图像的书目元素估计中的自动错误检测
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    井上 諒平;太田 学;高須 淳宏
  • 通讯作者:
    高須 淳宏
学術論文からの実験情報抽出の一手法
一种从学术论文中提取实验信息的方法
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平井 久貴;新妻 弘崇;太田 学;高須 淳宏
  • 通讯作者:
    高須 淳宏

太田 学的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('太田 学', 18)}}的其他基金

コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    23K25158
  • 财政年份:
    2024
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    22H03904
  • 财政年份:
    2022
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

動的に変わる集合に対する類似検索のスケッチを利用した高速化
使用动态变化集的草图加速相似性搜索
  • 批准号:
    21K11901
  • 财政年份:
    2021
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
類似検索を用いた高速な震源決定手法の開発
基于相似性搜索的快速震源确定方法的开发
  • 批准号:
    18J13918
  • 财政年份:
    2018
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
三次元物体の形状類似検索
3D 对象的形状相似度搜索
  • 批准号:
    11J07060
  • 财政年份:
    2011
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高次特異値分解に基づくテンソルデータの圧縮と類似検索に関する研究
基于高阶奇异值分解的张量数据压缩与相似度搜索研究
  • 批准号:
    17700197
  • 财政年份:
    2005
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
楽曲データベースにおける類似検索の実現に向けて
实现歌曲数据库中的相似搜索
  • 批准号:
    11780242
  • 财政年份:
    1999
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
問い合わせ画像中に存在する形状からの類似検索を実現するための自動形状特徴抽出法
用于从查询图像中存在的形状实现相似性搜索的自动形状特征提取方法
  • 批准号:
    10780158
  • 财政年份:
    1998
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
手指動作記述文を利用した手話単語の類似検索方法の研究
基于手部动作描述的手语词相似搜索方法研究
  • 批准号:
    07780356
  • 财政年份:
    1995
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了