音声認識手法の高度化に関する研究
语音识别方法的进展研究
基本信息
- 批准号:62608001
- 负责人:
- 金额:$ 7.42万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1987
- 资助国家:日本
- 起止时间:1987 至 1989
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
昭和63年度中に得られた研究成果は以下のとうりである。(1)話者適応部では,昨年度提案したベクトル量子場誤差の部分空間別平均化に基づくスペクトルの教師無し話者適応化法を発展させ、少数学習サンプルで、より正確な教師無し話者適応を実現させるため、スペクトル変換の内挿式を個人差のモデルとして、変換コードブックによるファジイ目的関数を最小化するという基準で個人差の代表スペクトルを求めるという高速な話者適応化法を開発した。この方法によって、平均3.6秒程度の音声があれば話者適応化が可能であることを示した。(2)音素認識部では、音素認識ネットワーク素子を用いた音素認識法を提案した。この方法を用いて、成人男子5名が発声した166都市名単語中の約5300個の音素資料に対して、19種類の素を認識した結果、音素自動検出、後続母音独立の条件で、不特定話者に対して、母音を78%、半母音を51%、有声子音を45%、無声子音を62%で認識できた。音素の付加と脱落はそれぞれ46%と24%であった。(3)音素のコンテキスト情報をいた単語認識法を提案し、成人男子10名が発声した166都市名の認識に適用した。その結果、オープン実験で、83.9%の単語認識率を得た。従来法に比べ単語認識率は約5.3%改善された。(4)言語処理部では、CYK法に基づく統語処理アルゴリズムを提案した。この手法は現在提案されている最適文節列選択アルゴリズムより広い文法クラスを扱うことができ、計算時間O(N^3D^2)で複数候補の準最適解が得られる。また文節数最小法の原理を応用した統語処理法も提案した。この方法は、本システムで用いている方法(文節に対するスコアの種類、統語処理のアルゴリズム、統語処理の枠組み、等)以外の方法とも容易に併用できる。文認識実験によって1位の文認識結果が約18.6%改善された。
Showa 63 years in the middle of the research results are as follows: (1)The speaker adaptation part of last year's proposal is partial spatial averaging of quantum field errors, development of speaker adaptation methods, minority learning, correct speaker adaptation, and individual differences in internal patterns. A method for minimizing the number of target variables in a high speed speech adaptation is developed based on the number of representative variables in the individual. This method is suitable for use with an average of 3.6 seconds of sound. (2)The phoneme recognition unit proposes a phoneme recognition method for phoneme recognition. The method was applied to 5 adult males, including 5300 phonemes in 166 city names. The results showed that phonemes were automatically detected, post-vowel independent conditions, non-specific speakers, vowels 78%, semi-vowels 51%, voiced vowels 45%, and silent vowels 62%. 46% and 24% of phonemes are added and dropped. (3)10 adult male students are eligible for recognition. The results of the survey show that 83.9% of the respondents are aware of the language. The recognition rate of Chinese language in the past was improved by about 5.3% compared with that in the past. (4)Speech processing department, CYK method, basic speech processing system. This method is used to calculate the optimal solution of multiple candidates in O(N^3D^2). The principle of minimum number of text segments is used in the proposal of traditional language processing method. This method is easy to use in combination with methods other than those used in this system (types of text, types of language processing, types of language processing, etc.). The result of text recognition was improved by 18.6% in the first place.
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
松本、関: 電子情報通信学会論文誌A. J71-A. 1750-1751 (1988)
Matsumoto, Seki:电子、信息和通信工程师学会会刊 A. J71-A 1750-1751 (1988)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
岡田,伊藤,牧野,城戸: 電子情報通信学会論文誌A. J70-D,NO.12. 2479-2490 (1987)
Okada, Ito, Makino, Kido:IEICE Transactions A. J70-D,NO.12 (1987)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
盛合、牧野、城戸: 電子情報通信学会論文誌D. J71-D. 1028-1036 (1988)
Moriai,Makino,Kido:电子、信息和通信工程师学会汇刊 D. J71-D 1028-1036 (1988)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
井出、牧野、石森、城戸: 電気学会論文誌C. 108. 810-817 (1988)
Ide、Makino、Ishimori、Kido:日本电气工程师学会汇刊 C. 108. 810-817 (1988)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
城戸 健一其他文献
城戸 健一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('城戸 健一', 18)}}的其他基金
音声認識手法の高度化に関する研究
语音识别方法的进展研究
- 批准号:
63608001 - 财政年份:1988
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声認識手法の高度化に関する研究
语音识别方法的进展研究
- 批准号:
01608001 - 财政年份:1987
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人間における音声情報の処理機構の解明と応用に関する総合的研究
人类语音信息处理机制阐明与应用的综合研究
- 批准号:
56380005 - 财政年份:1981
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Co-operative Research (A)
音声言語情報の人間における生成・知覚・認識及び理解の過程に関する総合的研究
人类口语和语言信息的生成、感知、识别和理解过程的综合研究
- 批准号:
X00050----438005 - 财政年份:1979
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Co-operative Research (A)
単語音声の自動認識に関する研究
词音自动识别研究
- 批准号:
X00090----955089 - 财政年份:1974
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
単語音声の自動認識に関する研究
词音自动识别研究
- 批准号:
X00090----855097 - 财政年份:1973
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音響計測における多元情報処理に関する研究
声学测量中多维信息处理研究
- 批准号:
X00080----746065 - 财政年份:1972
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
音声情報の自動処理に関する基礎的研究
语音信息自动处理基础研究
- 批准号:
X00040-----92415 - 财政年份:1972
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Special Project Research
音声情報の自動処理に関する基礎的研究
语音信息自动处理基础研究
- 批准号:
X46040-----90921 - 财政年份:1971
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Special Project Research
自動制御を利用した電力用変圧器の騒音制御に関する研究
自动控制电力变压器噪声控制研究
- 批准号:
X45120----450037 - 财政年份:1970
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Developmental Scientific Research
相似海外基金
手書き文字認識を組み込んだ記述式自動採点システムの開発と改良
结合手写字符识别的描述性自动评分系统的开发和改进
- 批准号:
23K28201 - 财政年份:2024
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
少量の実データに基づく画像内文字認識及びその応用
基于少量真实数据的图像字符识别及其应用
- 批准号:
22KJ0905 - 财政年份:2023
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for JSPS Fellows
並行AIモデルによる手書き英作文の文字認識自動採点システムの開発
利用并行AI模型开发手写英语作文字符识别自动评分系统
- 批准号:
22K02917 - 财政年份:2022
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Adopting Transkribus in the National Library of Scotland: Understanding how Handwritten Text Recognition Will Change Management and Use of Digitised M
苏格兰国家图书馆采用 Transkribus:了解手写文本识别将如何改变数字化 M 的管理和使用
- 批准号:
2422919 - 财政年份:2020
- 资助金额:
$ 7.42万 - 项目类别:
Studentship
未就学児における文字認識の解明と読み困難に対する早期支援システムの社会実装
学龄前儿童性格识别的阐明和阅读困难早期支持系统的社会实施
- 批准号:
19J01121 - 财政年份:2019
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for JSPS Fellows
小学校外国語絵本型カリキュラムにおける文字認識を豊かにする文字指導
小学外语绘本课程中文字教学丰富文字识别
- 批准号:
19H00071 - 财政年份:2019
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Encouragement of Scientists
手書き文字認識問題を対象とした深層学習における入力パターン内論理構造の自己組織化
深度学习中手写字符识别问题输入模式内逻辑结构的自组织
- 批准号:
19K12045 - 财政年份:2019
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Text Recognition of Historical Japanese Documents
日本历史文献的文本识别
- 批准号:
18K19800 - 财政年份:2018
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Text recognition software development for legal services
法律服务文本识别软件开发
- 批准号:
520334-2017 - 财政年份:2017
- 资助金额:
$ 7.42万 - 项目类别:
Engage Grants Program
Text Recognition and Comprehension Strategies of Deaf Children with Good Reading Skills
具有良好阅读能力的聋哑儿童的文本识别和理解策略
- 批准号:
23330273 - 财政年份:2011
- 资助金额:
$ 7.42万 - 项目类别:
Grant-in-Aid for Scientific Research (B)