離散型HMnetを用いた音声認識システム用言語モデルの自動獲得手法の開発
基于离散HMnet的语音识别系统自动语言模型获取方法的开发
基本信息
- 批准号:11780244
- 负责人:
- 金额:$ 1.47万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1999
- 资助国家:日本
- 起止时间:1999 至 2000
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
前年度は新しい言語モデル用HMnet構成法を開発し,人工言語を用いて従来からの言語モデルとの性能比較を行った。その結果,新しく開発した言語モデル(以下,NL-HMnet)は従来からの言語モデルに比べて高い性能を持つことが確認されたが,一方で学習サンプルに対する過学習が起きやすいという欠点を持つことがわかった。そこで本年度は,以下の項目について研究を行った。・一般的な自然言語に対するNL-HMnetの性能評価前年度は簡単な人工言語を用いて基本性能を評価した。そこで本年度はより一般的な自然言語に対してNL-HMnetの性能評価を行った。対象タスクには比較的文法構造が明確であると思われる解剖所見文書を用いた。n-gramと性能比較を行ったところ,特に長い文(1文あたりの単語数が多い文)が多く含まれる節でよい性能を示した。これは,NL-HMnetが遠くの位置にある単語間の相関をうまく表現できることを示していると思われる。一方で学習サンプルに対する過学習も起き,その結果テストサンプルに対するカバー率が低くなってしまった。・NL-HMnetの状態数を自動決定する方法の開発学習サンプルに対する過学習は,NL-HMnetの状態数が過剰である場合に起きる。一方状態数が過小である場合は十分な性能を持たないので,適切な状態数を設定する必要がある。従来は状態数を経験的に与えていたが,学習サンプルのみからテストセットパープレキシティを推定することで,自動的に適切な状態数を選択できる方法を開発した。従来から確率モデルの規模を選択する基準として用いられているMDLに比べ,どのような条件においても常に適切な状態数を選択できることがわかった。
In the past year, HMnet construction method was developed to compare the performance of artificial speech. As a result, the new development of the speech language (hereinafter referred to as NL-HMnet) has been confirmed to be higher than the performance of the speech language (hereinafter referred to as NL-HMnet), and one party has learned to learn the speech language (hereinafter referred to as NL-HMnet). This year, the following projects were carried out.·The performance evaluation of NL-HMnet for general natural speech and the evaluation of basic performance for simple artificial speech in previous years This year's performance evaluation of NL-HMnet is based on general natural speech. The grammatical structure of the image is clear and clear. n-gram performance comparison: 1 word, 1 word, 2 words, 2 words, 3 words, 3 words, 4 words, 5 words, 6 words, 7 words, 8 words, 9 words, 9 NL-HMnet is located in the middle of the city. A party to the study of the past study of the beginning, and the results of the study of the rate of low NL-HMnet state number is automatically determined by the method of development learning,NL-HMnet state number is determined by the method of development learning. When the number of states is too small, the performance is very high, and the number of states is set appropriately. The method of selecting the appropriate number of states automatically is developed. The size of the target is selected from the baseline and the MDL is selected from the appropriate state.
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
長野雄,鈴木基之,牧野正三: "大規模言語データベースからの言語モデルの自動獲得"東北大学電気通信研究所第302回音響工学研究会資料. 302-1. 1-11 (1999)
Yu Nagano、Motoyuki Suzuki、Shozo Makino:“从大型语言数据库自动获取语言模型”第 302 届声学工程研究会议材料,东北大学电气通信研究所 302-1(1999)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
長野雄,鈴木基之,牧野正三: "確率的にN-gram統計を切り替える言語モデル"東北大学電気通信研究所第309回音響工学研究会資料. 309-3. 31-41 (2000)
Yu Nagano、Motoyuki Suzuki、Shozo Makino:“随机切换 N-gram 统计的语言模型”材料,第 309 届声学工程研究会议,东北大学电气通信研究所 309-3 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
鈴木基之,牧野正三: "HMnetにおける最適な状態数の自動決定法"東北大学電気通信研究所第309回音響工学研究会資料. 308-2. 10-15 (2000)
Motoyuki Suzuki,Shozo Makino:“HMnet 中最佳状态数的自动确定方法”第 309 届声学工程研究会议材料,东北大学电气通信研究所 308-2(2000 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M.Suzuki and S.Makino: "Automatic Determination Algorithm for the Optimum Number of States in NL-HMnet"Proc.Third International Conference on Discovery Science. LNAI 1967. 306-310 (2000)
M.Suzuki 和 S.Makino:“NL-HMnet 中最佳状态数的自动确定算法”Proc.第三届国际发现科学会议。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
長野雄,鈴木基之,牧野正三: "文節NL-HMnetを用いた文モデルの獲得"日本音響学会1999年秋季研究発表会講演論文集. I. 103-104 (1999)
Yu Nagano、Motoyuki Suzuki、Shozo Makino:“使用 Bunsetsu NL-HMnet 获取句子模型”日本声学学会 1999 年秋季研究会议论文集 I. 103-104 (1999)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
鈴木 基之其他文献
Spotify音楽データを用いたユーザの感情に基づく音楽推薦手法の提案
利用Spotify音乐数据提出基于用户情感的音乐推荐方法
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Yukonhiatou Chaxiong;Yoshihisa Tomoki;Kawakami Tomoya;Teranishi Yuuichi;Shimojo Shinji;撫佐昭裕;鈴木 基之;鈴木基之;曽田円香,志風美雨,辻愛美紗,中野美由紀 - 通讯作者:
曽田円香,志風美雨,辻愛美紗,中野美由紀
鈴木 基之的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('鈴木 基之', 18)}}的其他基金
HPV関連中咽頭癌の前癌病変の同定と自然史の解明に基づくバイオマーカーの探索
基于癌前病变的识别和 HPV 相关口咽癌自然史的阐明来寻找生物标志物
- 批准号:
24K12671 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a mutual conversion method between face image and voice during speech
语音时人脸图像与声音相互转换方法的开发
- 批准号:
22K12916 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
HMnetを用いたLSP係数の極低ビットレート符号化法の開発
使用HMnet开发LSP系数的极低比特率编码方法
- 批准号:
17760293 - 财政年份:2005
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
環境汚染物質の人体影響評価のための簡易模擬人体システムの開発に関する基礎研究
开发简单人体系统评估环境污染物对人体影响的基础研究
- 批准号:
08878072 - 财政年份:1996
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Exploratory Research
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:
08358022 - 财政年份:1996
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:
07355015 - 财政年份:1995
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Co-operative Research (B)
人間-環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
04202114 - 财政年份:1993
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
03202115 - 财政年份:1991
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
古代〜中世の錘の研究
古代至中世纪重量的研究
- 批准号:
02904041 - 财政年份:1990
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
02202112 - 财政年份:1990
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
大規模言語モデルのための品質保証技術に関する研究
大规模语言模型质量保证技术研究
- 批准号:
24K02920 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
病理画像診断の言語モデルをもった口腔がんの新たな診断法の基盤構築
使用病理图像诊断语言模型为新型口腔癌诊断方法奠定基础
- 批准号:
24K13114 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
大規模言語モデルと統語的言語モデルの融合
大规模语言模型与句法语言模型的融合
- 批准号:
24KJ0800 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
大規模言語モデルを使用した生成系AIによるAI搭載型治療方針決定支援ツールの開発
使用大规模语言模型的生成人工智能开发配备人工智能的治疗政策决策支持工具
- 批准号:
24K18785 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
プログラミング教育支援のための大規模言語モデルへの入力情報に関する研究
支持编程教育的大规模语言模型输入信息研究
- 批准号:
24K15218 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
マルチモーダル情報を活用するタンパク質言語モデル
利用多模态信息的蛋白质语言模型
- 批准号:
24K20851 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
大規模言語モデルを用いた生物試料情報の標準化
使用大规模语言模型对生物样本信息进行标准化
- 批准号:
24K20889 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
大規模言語モデルを活用した遠隔操作による人・ロボット協働基盤の創成
使用大规模语言模型通过远程控制创建人机协作平台
- 批准号:
24K17236 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
大規模言語モデル(LLM)を用いた企業価値形成にかかる網羅的研究
使用大规模语言模型(LLM)对企业价值形成进行综合研究
- 批准号:
24K00298 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
パーソナル知識グラフの構築・精錬と大規模言語モデルの活用
个人知识图谱的构建和细化以及大规模语言模型的利用
- 批准号:
24K15078 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




