人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
基本信息
- 批准号:15017225
- 负责人:
- 金额:$ 2.62万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
人間間の音声コミュニケーションを観測すると、音声の音響情報から様々なパラ言語情報,非言語情報を抽出することで円滑なコミュニケーションを実現していることが分かる。本研究では,パラ言語情報として発話意図に,また,非言語情報として話し手の知覚的年齢情報に着眼してその自動抽出を検討した。特に発話意図の抽出に関しては,音響音声学に立脚した音声工学とは完全に異なる観点からの音声モデリングを行なった。音声の物理現象の中に,話者・収録環境に依存しない普遍構造が存在することを実証しており,その普遍構造とパラ言語情報との関連について検討した。話者認識技術に基づいてユーザの知覚的年齢の推定を試みた。子供音声・成人・老人音声データベース(合計男女約1000人)に対してその音声聴取時に感じる年齢を,大学生30名を対象として聴取実験によりラベリングさせた。その結果より,データベース話者各々に対して知覚的年齢分布が定義される未知入力話者に対する知覚的年齢推定は,未知話者とデータベース話者との距離を尤度という形で求め,各データベース話者に付随する知覚的年齢分布を,この尤度を用いて期待値化することで推定した。実験の結果,機械による推定値と人間による推定値間の相関は0.9となった。音声ストリームを確率論的に状態系列として捉え,次に相対論的に状態間の関係のみに着眼し(構造化し),その関係を情報論的に定量化する。こうして構造化された音声は性別,年齢,話者,マイク,伝送特性などに一切影響を受けず話し手の脳から聞き手の脳にまで到達する。音響音声学が提供する音声表象は「歪んでいない音声は存在しない」と主張し,本研究で提案する新しい音声の物理表象では「人間が発声する限り音声は歪み得ない」と主張する構造を唯一歪ませるのがパラ言語情報であり,本研究では種々の感情・意図によって構造のサイズがどう変化するのか,及び構造そのものがどう歪むのか,について実験的検討を行ない良好な結果を得ることができた。
The voice of the human world can be detected, and the voice and audio information can be extracted. This study focuses on the automatic extraction of non-verbal information and verbal information. Special speech meaning extraction related to sound acoustics vertical sound engineering completely different point sound separation In the physical phenomena of sound, the speaker and the recording environment depend on the existence of universal structures. The speaker recognizes technology as the basis for the estimation of the age of knowledge. Children, adults and elderly (about 1000 men and women in total), 30 college students, and 30 students As a result, the estimated annual distribution of knowledge among unknown incoming speakers is defined. The estimated annual distribution of knowledge among unknown incoming speakers is defined. The estimated annual distribution of knowledge among unknown incoming speakers is defined. The estimated annual distribution of knowledge among unknown incoming speakers is defined. As a result, the estimated value of the machine is 0.9. The relationship between the states of the acoustic theory and the information theory is quantified. The structure of the voice is gender, age, speaker, transmission characteristics, all affected by the voice, voice, voice. Sound acoustics provides sound representation, and the physical representation of sound is proposed. The structure is unique, and the speech information is proposed. The results of the investigation were good.
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
N.Minematsu 他: "Automatic estimation of perceptual age using speaker modeling techniques"Proc. Euro Speech 2003. 3005-3008 (2003)
N. Minematsu 等人:“使用说话者建模技术自动估计知觉年龄”Proc. Euro Speech 2003. 3005-3008 (2003)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
峯松 信明 他: "音声に内在する音響的普遍構造とそれに基づく音声コミュニケーション"第3回話し言葉の科学と工学ワークショップ講演集. 143-150 (2004)
Nobuaki Minematsu 等人:“语音固有的通用声学结构和基于它的语音通信”第三届口语科学与工程研讨会论文集 143-150 (2004)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
浜野紘一, 峯松信明 他: "音声の分節的特徴に着眼したパラ・非言語情報推定に関する実験的検討"電子情報通信学会音声研究会資料. (2004)
Koichi Hamano、Nobuaki Minematsu 等人:“以语音片段特征为重点的非语言信息估计实验研究”IEICE 语音研究组材料(2004 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
峯松 信明其他文献
日本語上級中国人学習者と日本語母語話者教師の真偽疑問文と疑問詞疑問文の産出
日语高级汉语学习者及日语母语教师真/假疑问句及疑问疑问句的制作
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
伊達 宏子;中村 則子;峯松 信明;伊達宏子・花薗悟・郭田夫 - 通讯作者:
伊達宏子・花薗悟・郭田夫
生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明 - 通讯作者:
峯松 信明
Evaluation of the Prosodic Naturalness of Japanese Learners’ Utterances after Practicing with OJAD Suzuki-kun
与 OJAD Suzuki-kun 一起练习后日语学习者言语韵律自然度的评估
- DOI:
10.24467/onseikenkyu.23.0_6 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
伊達 宏子;中村 則子;峯松 信明 - 通讯作者:
峯松 信明
Effects of English Shadowing Training Using Unlearned Passages on Listening and Speaking Skills
使用未学过的段落进行英语影子训练对听力和口语技能的影响
- DOI:
10.24539/let.59.0_77 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
中西 のりこ;峯松 信明;椢原 卓弥 - 通讯作者:
椢原 卓弥
A viewpoint shift from technical aid for speaking to that for listening: From output to input
从口语技术援助到听力技术援助的观点转变:从输出到输入
- DOI:
10.20697/jasj.79.3_154 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
峯松 信明 - 通讯作者:
峯松 信明
峯松 信明的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('峯松 信明', 18)}}的其他基金
Measurement of L2 pronunciation deviation and L2 listening disfluency and its application to prosody training for smooth international communication
二语发音偏差和二语听力不流利度测量及其在国际交流顺畅韵律训练中的应用
- 批准号:
23K17459 - 财政年份:2023
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Challenging Research (Pioneering)
Measurement and modeling of cognitive breakdown and their use to enhance cognitive robustness for international oral communication
认知崩溃的测量和建模及其用于增强国际口头交流认知稳健性的用途
- 批准号:
22H00527 - 财政年份:2022
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Technically-enhanced high variability phonetic training and its effective application to English listening training for Japanese learners
技术强化的高变异性语音训练及其在日语学习者英语听力训练中的有效应用
- 批准号:
18F18724 - 财政年份:2018
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for JSPS Fellows
構造不変の定理に基づく聴覚・視覚・身体メディアの普遍的表象に関する基礎研究
基于结构不变性定理的听觉、视觉和物理媒体普遍表征的基础研究
- 批准号:
07F07078 - 财政年份:2007
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for JSPS Fellows
構造不変の定理に基づく音声アフォーダンスの提案とそれに立脚した音声認識系の構築
提出基于结构不变性定理的语音可供性并构建基于其的语音识别系统
- 批准号:
19024023 - 财政年份:2007
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
言語情報とパラ言語情報を統合した音声の構造的表象の提案とその音声合成への応用
整合语言和副语言信息的语音结构表示的提出及其在语音合成中的应用
- 批准号:
19650036 - 财政年份:2007
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Exploratory Research
構造不変の定理に基づく音声アフォーダンスの提案とそれに立脚した音声認識系の構築
提出基于结构不变性定理的语音可供性并构建基于其的语音识别系统
- 批准号:
18049018 - 财政年份:2006
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
- 批准号:
16016219 - 财政年份:2004
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
発音の明瞭性に着眼した発音構造の包括的記述とその語学学習への応用に関する研究
以发音清晰度为核心的发音结构综合描述及其在语言学习中的应用研究
- 批准号:
15652033 - 财政年份:2003
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Exploratory Research
人間による音声言語処理過程の分析とそれに立脚した音声対話システムの構築
人类口语处理过程分析及基于其的口语对话系统构建
- 批准号:
14019021 - 财政年份:2002
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
移動体からの情報アクセスのための音声インタフェースの開発
开发用于从移动设备访问信息的语音接口
- 批准号:
18049037 - 财政年份:2006
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人とコンピュータの円滑な対話を実現する音声インタフェース
语音界面,实现人与计算机之间的流畅交互
- 批准号:
11780245 - 财政年份:1999
- 资助金额:
$ 2.62万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)