日本語音声認識のための統計的言語モデルとそのタスク適応に関する研究
日语语音识别统计语言模型及其任务适配研究
基本信息
- 批准号:09780307
- 负责人:
- 金额:$ 1.28万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
今年度の研究では,「日本語連続音声認識のための形態素解析によらない統計的言語モデル」の研究を行った.この研究は2つのサブテーマから成っている.一つは統計的に選ばれた文字列を単位とした言語モデルの作成であり,もう一つは統計的手法に基づく漢字かな混じり文への読みの付与である.文字列を単位とした言語モデルの作成においては,提案法の評価実験として,さまざまな文字列への分割方法の比較実験,および学習テキストと評価テキストのタスクと規模を変えた実験を行った.その結果,頻度による文字列の抽出と左最長一致法による解析の組み合わせにおいて,もっとも大きいパ-プレキシティ低減効果(最大9.3%)が見られた.また,コーパスによる性能差を見るために,3種類の対話コーパスと,書き言葉であるEDRコーパスを用いた比較実験を行った.その結果,単一タスクであるATR会話コーパスにおけるパ-プレキシティ低減率がもっとも大きかった.これは,学習テキストのみから統計量の推定と分割単位の双方を決定するためであり,本手法の適用限界を示すものと言うことができる.統計的な手法を用いた読みの付与では,EDRコーパスを用いて,N-gramモデルを応用した読み付与システムを作成し評価した.その結果,当該文字の前後1文字を用いてモデルを作成した場合が最も高性能であることが明らかとなった.システムの最高性能として96.27%の読み付与精度が得られた.
Our study の で は, "Japanese even 続 sounds know の た め の morpheme analytic に よ ら な い statistics words モ デ ル" を の research line っ た. こ の は 2 つ の サ ブ テ ー マ か ら into っ て い る. A つ は statistical に choose ば れ た text columns を 単 a と し た words モ デ ル の made で あ り, も う a つ は statistical methods に base づ く characters か な mixed じ り article へ の 読 み の give で あ る. Text columns を 単 a と し た words モ デ ル の made に お い て は, proposed method の review 価 be 験 と し て, さ ま ざ ま な text columns へ の segmentation method の is be 験, お よ び learning テ キ ス ト と review 価 テ キ ス ト の タ ス ク と scale を - え た be 験 を line っ た. そ の as a result, the frequency に よ る text columns の spare と left the longest consensus method に よ る parsing み の group Close わ せ に お い て, も っ と も big き い パ - プ レ キ シ テ ィ low cut sharper fruit (9.3%) largest が see ら れ た. ま た, コ ー パ ス に よ る see poor performance を る た め に, 3 species の words コ seaborne ー パ ス と, book き said leaf で あ る EDR コ ー パ ス を with い た comparison be 験 を line っ た. そ の results, 単 a タ ス ク で あ る ATR session コ ー パ ス に お け る パ - プ レ キ シ テ ィ low reduction rate が も っ と も big き か っ た. こ れ は, learning テ キ ス ト の み か ら statistic の presumption と segmentation 単 a の を decided す る た め で あ り, this technique の is limit を shown す も の と said う こ と が で き る. Statistical な gimmick を with い た 読 み の give で は, EDR コ ー パ ス を with い て, N - "gramm モ デ ル を 応 with し た 読 み give シ ス テ ム を made し review 価 し た. そ の as a result, when the word before and after 1 の を with い て モ デ ル を made し が た occasions most も high-performance で あ る こ と が Ming ら か と な っ た. シ ス テ ム の と highest performance Youdaoplaceholder0 て96.27% 読み gives precision が to られた.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
伊藤彰則, 好田正紀: "かな・漢字文字列の連鎖統計による言語モデル" 電子情報通信学会論文誌. J79-D-II・No12. 2062-2069 (1996)
Akinori Ito、Masanori Koda:“基于假名和汉字字符串链统计的语言模型”,电子、信息和通信工程师学会汇刊 J79-D-II,第 12 期。2062-2069 (1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
伊藤 彰則其他文献
DNN 音声合成における複数話者データを用いた学習手法の比較
DNN 语音合成中使用多说话人数据的学习方法比较
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
欧陽 江卉;能勢 隆;花房 伸哉;伊藤 彰則 - 通讯作者:
伊藤 彰則
道案内ロボットのための距離誤差の少ない経路追従手法の開発―実機による検証―
路径引导机器人的低距离误差路径追踪方法的开发 - 实机验证 -
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
若林広悦;廣井富;宮脇健三郎;伊藤 彰則 - 通讯作者:
伊藤 彰則
距離誤差の少ない経路追従手法を実装した道案内ロボットの運用に向けた取り組み
操作实现距离误差较小的路径跟踪方法的路径引导机器人的努力
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
若林広悦;廣井富;宮脇健三郎;伊藤 彰則 - 通讯作者:
伊藤 彰則
手すりを移動するコミュニケーションロボット―全体コンセプト―
沿着扶手移动的通信机器人-总体概念-
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
廣井富;内田裕二;西村駿宏. 中山貴之;黒田尚孝;三宅真司;戸塚典子;伊藤 彰則 - 通讯作者:
伊藤 彰則
運動により知覚的奥行きが分離された刺激間の垂直視差統合処理特性
感知深度因运动而分离的刺激之间的垂直视差积分处理特性
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
武石笑歌;能勢 隆;加瀬嵩人;伊藤彰則;伊藤 彰則;Koichi Ito;宮西雄太,金子寛彦 - 通讯作者:
宮西雄太,金子寛彦
伊藤 彰則的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('伊藤 彰則', 18)}}的其他基金
オンライン授業支援のためのバーチャル・クラスメートの開発
开发虚拟同学支持在线课程
- 批准号:
23K20725 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of a virtual classmate for assistance of online course
开发虚拟同学以协助在线课程
- 批准号:
21H00895 - 财政年份:2021
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
連想的手法を用いた自由発話文音声の認識
使用关联方法的自由语音识别
- 批准号:
06780297 - 财政年份:1994
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
統計と連想に基づく連続音声認識に関する研究
基于统计和关联的连续语音识别研究
- 批准号:
05780277 - 财政年份:1993
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
機能語予測CYK法を用いた連続音声認識システムに関する研究
采用功能词预测CYK方法的连续语音识别系统研究
- 批准号:
04750295 - 财政年份:1992
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
計量的分析のための15世紀朝鮮語形態素解析済みコーパス構築:仏教諺解を対象に
构建 15 世纪韩语词法语料库以进行定量分析:以佛教谚语为目标
- 批准号:
20K00558 - 财政年份:2020
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
統計的手法に基づく多言語形態素解析
基于统计方法的多语言形态分析
- 批准号:
01J02558 - 财政年份:2001
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for JSPS Fellows
文字レベルと単語レベルの確率モデルを融合した形態素解析システム
结合字符级和词级概率模型的词法分析系统
- 批准号:
09780309 - 财政年份:1997
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
タグなしコーパスからの形態素解析情報の抽出
从未标记的语料库中提取形态分析信息
- 批准号:
08780329 - 财政年份:1996
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
人間の言語処理過程に基づき未知語意味推定をする日本語形態素解析アルゴリズムの作成
创建日语形态分析算法,根据人类语言处理过程估计未知单词的含义
- 批准号:
04858008 - 财政年份:1992
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
学習に基づいた形態素解析手法に関する研究
基于学习的形态分析方法研究
- 批准号:
02855098 - 财政年份:1990
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




