权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

日本語音声認識のための統計的言語モデルとそのタスク適応に関する研究

日语语音识别统计语言模型及其任务适配研究

基本信息

批准号：
09780307
负责人：
伊藤彰則
金额：
$ 1.28万
依托单位：
Yamagata University
依托单位国家：
日本
项目类别：
Grant-in-Aid for Encouragement of Young Scientists (A)
财政年份：
1997
资助国家：
日本
起止时间：
1997 至 1998
项目状态：
已结题

来源：
https://kaken.nii.ac.jp/en/grant/KAKENHI-PROJECT-09780307/
关键词：
統計的言語モデル形態素解析読み付与連続音声認識

项目摘要

今年度の研究では,「日本語連続音声認識のための形態素解析によらない統計的言語モデル」の研究を行った.この研究は2つのサブテーマから成っている.一つは統計的に選ばれた文字列を単位とした言語モデルの作成であり,もう一つは統計的手法に基づく漢字かな混じり文への読みの付与である.文字列を単位とした言語モデルの作成においては,提案法の評価実験として,さまざまな文字列への分割方法の比較実験,および学習テキストと評価テキストのタスクと規模を変えた実験を行った.その結果,頻度による文字列の抽出と左最長一致法による解析の組み合わせにおいて,もっとも大きいパ-プレキシティ低減効果(最大9.3%)が見られた.また,コーパスによる性能差を見るために,3種類の対話コーパスと,書き言葉であるEDRコーパスを用いた比較実験を行った.その結果,単一タスクであるATR会話コーパスにおけるパ-プレキシティ低減率がもっとも大きかった.これは,学習テキストのみから統計量の推定と分割単位の双方を決定するためであり,本手法の適用限界を示すものと言うことができる.統計的な手法を用いた読みの付与では,EDRコーパスを用いて,N-gramモデルを応用した読み付与システムを作成し評価した.その結果,当該文字の前後1文字を用いてモデルを作成した場合が最も高性能であることが明らかとなった.システムの最高性能として96.27%の読み付与精度が得られた.

Our study のでは, "Japanese even 続 sounds know のための morpheme analytic によらない statistics words モデル" をの research line った. このは 2 つのサブテーマから into っている. A つは statistical に choose ばれた text columns を単 a とした words モデルの made であり, もう a つは statistical methods に base づく characters かな mixed じり article への読みの give である. Text columns を単 a とした words モデルの made においては, proposed method の review 価 be 験として, さまざまな text columns への segmentation method の is be 験, および learning テキストと review 価テキストのタスクと scale を - えた be 験を line った. その as a result, the frequency による text columns の spare と left the longest consensus method による parsing みの group Close わせにおいて, もっとも big きいパ - プレキシティ low cut sharper fruit (9.3%) largest が see られた. また, コーパスによる see poor performance をるために, 3 species の words コ seaborne ーパスと, book き said leaf である EDR コーパスを with いた comparison be 験を line った. その results, 単 a タスクである ATR session コーパスにおけるパ - プレキシティ low reduction rate がもっとも big きかった. これは, learning テキストのみから statistic の presumption と segmentation 単 a のを decided するためであり, this technique の is limit を shown すものと said うことができる. Statistical な gimmick を with いた読みの give では, EDR コーパスを with いて, N - "gramm モデルを応 with した読み give システムを made し review 価した. その as a result, when the word before and after 1 のを with いてモデルを made しがた occasions most も high-performance であることが Ming らかとなった. システムのと highest performance Youdaoplaceholder0 て96.27% 読み gives precision が to られた.