音声対話における音声の認識と合成に関する研究
口语对话中的语音识别与合成研究
基本信息
- 批准号:05241104
- 负责人:
- 金额:$ 74.43万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
今年度は、対話音声の分析、認識、合成、対話制御のモデル化の4点から研究を行った。主な成果は次の通りである。(1)雑音に強い分析法として、帯域分割分割自己相関分析法を提案し、種々の雑音に有効であることを確かめた。また、この方法をダミ-ヘッドを用いた2入力信号に拡張すると、ロバスト性が向上することを確認した。(板倉)(2)音声の振幅包絡を周波数分析して発話速度を抽出する方法を考案し、日本語と英語の発話速度の変化を定量的に示した。また、日本語のbimoraic foot現象、英語の強勢間の音節の等時性などを明らかにした。(北沢)(3)識別学習と入力音声への適応機能の導入により高精度な音素認識アルゴリズムを確立した。また離散型HMnetを用いた強力な言語モデルの獲得法を提案してその有効性を示した。(牧野)(4)強い言語的制約に頼っていた従来の連続音声認識システムに、文法の学習、未知語処理、認識誤りを含んだ文の意味解釈などの機能を導入して、比較的自由な発話を許すことに成功した。(中川)(5)韻律、分節特徴、音質の柔軟な制御が可能なホルマントテンプレート接続型音声合成方式を提案し、新しく開発したARX音声分析法を用いて抽出した音道及び音源パラメタを用いて、良好な合成音声を得た。(粕谷)(6)対話音声と朗読音声の特徴を比較し、対話音声を合成するための韻律規則を作成した。また、特定のタスクを用いて、対話履歴による省略、焦点の付与の制御を行い、ユーザに分かりやすい応答音声が生成する手法を開発した。(広瀬)(7)音声認識の誤りを考慮し、認識や聞き直しを行う対話制御方式の数学的なモデル化を行い、このような制御方式を採る対話システムの総合的な性能と音声認識システムの性能との間の定量的な関係を導いた。(新美)
This year, the sound analysis, recognition, synthesis, and speech control of this year's dialects and dialects are conducted at 4 o'clock in the study. The main results are related to each other. (1) the sound intensity analysis method, domain segmentation and self-correlation analysis proposal, and sound intensity analysis method are required to ensure the accuracy of the analysis. Please use the 2 input signal to make sure that the signal is up and down. (2) Sound amplitude package cycle wavenumber analysis, speech speed extraction method, Japanese English language speed measurement and quantitative analysis. In time, such as the Japanese, Japanese bimoraic foot, and the English language, we will be able to communicate with each other in time. (North China) (3) the sound receiver can input the high-precision phoneme recognition device to ensure that the device is installed. The loose HMnet uses the word "strength" to make a proposal to show that it has sex. (Makino) (4) strengthen the system of language learning, language learning, grammar learning, unknown science, and misunderstanding, which means that the interpretation of language means that the machine can enter into the language, and the free language language is successful. (Nakagawa) (5) the proposed method of sound synthesis may be used in the system of sound synthesis. (Nakagawa) (5) the proposed method of sound synthesis is proposed, and the new method of ARX sound analysis is used to extract the sound channel and sound source. (meal Valley) (6) speech sounds, voice sounds, sounds The use of audio, the omission of speech performance, the payment of focus and the control of the bank, and the sound of the voice response of the telephone, and the telephone. (7) the performance of sound and sound knowledge, the way of language control, the way of mathematical control, the way of mathematical control, the way of speech control, the way of mathematical control, the mode of control, the way of control, the quantitative guidance of performance. (Xinmei)
项目成果
期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中川 聖一: "文脈自由文法制御によるOne Pass型HMM連続音声認識法" 電子情報通信学会論文誌. J76-D-II-7. 1337-1345 (1993)
Seiichi Nakakawa:“使用上下文无关语法控制的 One Pass 型 HMM 连续语音识别方法”,电子、信息和通信工程师学会汇刊 J76-D-II-7 (1993)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S.Kajita: "Speech analysis and speech recognition using subband-autocorrelation analysis" J.Acoust.Soc.Jpn.(E). 15(5). 329-338 (1994)
S.Kajita:“使用子带自相关分析进行语音分析和语音识别”J.Acoust.Soc.Jpn.(E)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
中川 聖一: "ワードスポッティング法を用いた文脈自由文法制御フレーム同期型HMM連続音声認識法" 電子情報通信学会論文誌. J76-D-II-7. 1329-1336 (1993)
Seiichi Nakakawa:“使用单词识别方法的上下文无关语法控制的帧同步 HMM 连续语音识别方法”电子、信息和通信工程师协会学报 J76-D-II-7 (1993)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S.Kitazawa: "Tempo estimation by wave envelope for recognition of paralinguistic features in spontaneous speech" Proc.of ICSLP-94. 3. 1691-1694 (1994)
S.Kitazawa:“通过波包络进行节奏估计,用于识别自发语音中的副语言特征”Proc.of ICSLP-94。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Y.Tsurumi: "An unsuperivised speaker adaptation method for continuous parameter HMM by maximum a posteriori probability estimation" Proc.of ICSLP-94. 1. 431-434 (1994)
Y.Tsurumi:“通过最大后验概率估计实现连续参数 HMM 的无监督说话人自适应方法”Proc.of ICSLP-94。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
新美 康永其他文献
新美 康永的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('新美 康永', 18)}}的其他基金
知的インターフェイス機能をもった地理データベースに関する研究
具有智能接口功能的地理数据库研究
- 批准号:
04208203 - 财政年份:1992
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
知的インタ-フェイス機能をもった地理デ-タベ-スに関する研究
具有智能接口功能的地理数据库研究
- 批准号:
03209203 - 财政年份:1991
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
知的インタ-フェイス機能をもった地理デ-タベ-スに関する研究
具有智能接口功能的地理数据库研究
- 批准号:
02225203 - 财政年份:1990
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
地理デ-タベ-スの構築と知的インフ-フェイスに関する研究
地理数据库建设与智能基础设施研究
- 批准号:
01643505 - 财政年份:1989
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
単語音声認識における話者適応化方式に関する研究
单词语音识别中的说话人适应方法研究
- 批准号:
60580025 - 财政年份:1985
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
構造記述能力をもつ波形情報入力処理システムの研究
具有结构描述能力的波形信息输入处理系统研究
- 批准号:
X00040----320223 - 财政年份:1978
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Special Project Research
構造記述能力をもつ波形情報入力処理システムの研究
具有结构描述能力的波形信息输入处理系统研究
- 批准号:
X00040----220922 - 财政年份:1977
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Special Project Research
構造記述能力をもつ波形情報入力処理システムの研究
具有结构描述能力的波形信息输入处理系统研究
- 批准号:
X00040----121722 - 财政年份:1976
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Special Project Research
音声人力端末のための基礎的研究
语音人力终端基础研究
- 批准号:
X00040----820909 - 财政年份:1973
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Special Project Research
限定単語の自動識別に関する研究
有限词自动识别研究
- 批准号:
X46210------5161 - 财政年份:1971
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
能の謡の音楽的分析のための音響分析基盤の高度化
推进能乐歌曲音乐分析的声学分析平台
- 批准号:
24K03475 - 财政年份:2024
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
歌声の音響分析と印象調査および歌い手のフォルマントの生成に関する研究
歌声声学分析与印象研究、歌手共振峰生成研究
- 批准号:
22K13773 - 财政年份:2022
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
医療面接における客観的評価方法の開発ー音響分析を用いた評価についてー
开发医疗访谈中的客观评估方法 - 使用声学分析进行评估 -
- 批准号:
22K10474 - 财政年份:2022
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Data-driven sound field measurement for high-resolution spatial audio analysis and its applications
数据驱动的高分辨率空间音频分析声场测量及其应用
- 批准号:
22H03608 - 财政年份:2022
- 资助金额:
$ 74.43万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Deep learning for audio analysis
深度学习音频分析
- 批准号:
495310-2016 - 财政年份:2016
- 资助金额:
$ 74.43万 - 项目类别:
University Undergraduate Student Research Awards
Sensing Direction of Violence, Crimes, Incidents and Events by Audio Analysis
通过音频分析感知暴力、犯罪、事件和事件的方向
- 批准号:
130600 - 财政年份:2011
- 资助金额:
$ 74.43万 - 项目类别:
Feasibility Studies
Audio Analysis for Pipeline Leak Detection
用于管道泄漏检测的音频分析
- 批准号:
401393-2010 - 财政年份:2010
- 资助金额:
$ 74.43万 - 项目类别:
Engage Grants Program
A peer-to-peer approach to automated audio analysis
自动音频分析的点对点方法
- 批准号:
382167-2009 - 财政年份:2009
- 资助金额:
$ 74.43万 - 项目类别:
University Undergraduate Student Research Awards
Multichannel audio analysis and forensics
多通道音频分析和取证
- 批准号:
372773-2008 - 财政年份:2008
- 资助金额:
$ 74.43万 - 项目类别:
University Undergraduate Student Research Awards
Graph algorithms for audio analysis
用于音频分析的图算法
- 批准号:
298270-2004 - 财政年份:2006
- 资助金额:
$ 74.43万 - 项目类别:
Discovery Grants Program - Individual