発声上の癖の推定に基づく英語音声の発音評価・教示手法の開発

基于发声习惯估计的英语语音发音评价与教学方法开发

基本信息

项目摘要

本研究ではまず,英単語発声中の強勢音節自動検出技術を,隠れマルコフモデルを用いて構築した。また,構築された強勢音節検出器を使って,学習者の発音上の癖の推定及び,その視覚化を実験的に検討した。ここでは,強勢・弱勢生成において優先的に用いられている音響的特徴量を強勢発音上の「癖」と定義した。この視覚化パターンが,各学習者が持つ英語発音能力とほぼ一致する様子についても実験的に検証した。しかしながら上記の癖推定は,学習者に数十の異なる単語発声を要求していた。これは,癖推定及び視覚化処理が,強勢検出器を用いることで得られる強勢音節検出「率」を使って実現されていたことに因る。学習者へのフィードバックを考慮した場合,単語単発声のみを使用した癖推定と視覚化,及び,インタラクティブなフィードバックの実現が望まれる。そこで次に,上記の癖推定技術を改良することで,単語発声のみを用いた癖視覚化技術の構築を行なった。ここでは,強勢検出率を扱うのではなく,正解強勢パターン(学習者が意図したパターン)の照合スコアと,競合パターンの最大スコアとの間の比(尤度比)に着眼した。そして,この尤度比を最大にするような特徴パラメータセット,即ち,正解強勢パターンと,最大尤度の競合パターン間の差異が最も明確化されるパラメータセットを癖として定義した。こうすることで,複数発声使用時と非常に類似した視覚化パターンを生成することができ,インタラクティブに表示される癖パターンと,数十単語発声後に描かれる癖パターンとに(表現上の)高い整合性を持たせることができた。提案手法の評価は,複数発声により描かれる(単語発声群)に対する癖パターンと,個々の単語発声により画かれる癖パターンの「平均」パターンとの間に観測される相関(類似性)を見ることで行なった。その結果,日本人発声による英単語音声で相関値0.83,母語話者による英語発声で相関値0.72となった。単語単発声のみで推定していることを考慮すると,上記の結果は十分な精度が得られていると考えられる。更には,上記の研究で構築された強勢音節・弱勢音節のHMMを文強勢検出に応用した。その結果,フレーズ成分の除去が,文強勢検出においては有効に寄与していることが示された。
In this study, we developed a technique for automatic detection of strong syllables in English speech. In this paper, we construct a strong syllable detector, which can be used to estimate the learner's phonological habits and to investigate the visual effects. This is the definition of "addiction" on the basis of the characteristics of sound, which are generated by the strong and weak. In this way, all learners can maintain their English pronunciation ability and English pronunciation consistency. There are dozens of different language requirements for learners. The strong detector is used to detect the strong syllable rate. When learners consider the situation, the use of single language sounds is estimated and visualized, and the realization of single language sounds is expected In this paper, the author introduces the improvement of the technique for estimating the noise of speech and the construction of the technique for detecting the noise of speech. The ratio of the maximum number of students who are interested in the competition is the ratio of the maximum number of students who are interested in the competition. The difference between the maximum degree of competition and the maximum degree of competition is the most explicit. The use of multiple sounds is very similar to the use of multiple sounds, and the use of multiple sounds is very similar to the use of multiple sounds. The evaluation of the proposed method is based on the correlation (similarity) between multiple sound sources and single sound sources. As a result, the correlation value of Japanese pronunciation is 0.83, and that of native speakers is 0.72. The result of the calculation is very accurate. Furthermore, the study on the construction of strong syllables, weak syllables and HMM strong text detection and use. As a result, the removal of the "white" component, the strong detection of the "white" component, the "component, the white" component, the "component, the white component, the" component, the "

项目成果

期刊论文数量(20)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
峯松信明,中川聖一: "PSOLA分析合成に基づくFO変換音声の品質向上に関する実験的検討"電子情報通信学会論文誌. J83-DII,7. 1590-1599 (2000)
Nobuaki Minematsu、Seiichi Nakakawa:“基于 PSOLA 分析和合成的提高 FO 转换语音质量的实验研究”,电子、信息和通信工程师学会汇刊 J83-DII,7. 1590-1599 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
峯松信明: "英単語発音上の癖の自動推定・視覚化とそれに基づく発音能力の韻律的評定"電子情報通信学会論文誌. J83-DII NO.2. 486-499 (2000)
Nobuaki Minematsu:“英语单词发音习惯的自动估计和可视化以及基于它的发音能力的韵律评估”,电子信息和通信工程师学会汇刊J83-DII NO.2(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
N.Minematsu and S.Nakagawa: "Performance comparison among HMM,DTW and human abilities in terms of identifying stress patterns of word utterances"Proc.ICSLP2000. Vol.1. 617-620 (2000)
N.Minematsu 和 S.Nakakawa:“HMM、DTW 和人类能力在识别单词话语重音模式方面的性能比较”Proc.ICSLP2000。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
N.Minematsu and S.Nakagawa: "Visualization of pronunciation habits based upon abstract representation of acoustic observations"Proc.INSTIL2000. Vol.1. 130-137 (2000)
N.Minematsu 和 S.Nakakawa:“基于声学观察的抽象表示的发音习惯可视化”Proc.INSTIL2000。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
峯松信明,小橋川哲,広瀬啓吉: "語学学習支援を目的とした英語音声からのリズム同定に関する実験的検討"日本音響学会春季講演論文集. 3-6-6. 331-332 (2001)
Nobuaki Minematsu、Tetsu Kobashikawa、Keikichi Hirose:“用于语言学习支持的英语语音节奏识别实验研究”日本声学学会春季会议记录 3-6-332(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

峯松 信明其他文献

日本語上級中国人学習者と日本語母語話者教師の真偽疑問文と疑問詞疑問文の産出
日语高级汉语学习者及日语母语教师真/假疑问句及疑问疑问句的制作
生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明
  • 通讯作者:
    峯松 信明
Effects of English Shadowing Training Using Unlearned Passages on Listening and Speaking Skills
使用未学过的段落进行英语影子训练对听力和口语技能的影响
  • DOI:
    10.24539/let.59.0_77
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中西 のりこ;峯松 信明;椢原 卓弥
  • 通讯作者:
    椢原 卓弥
Evaluation of the Prosodic Naturalness of Japanese Learners’ Utterances after Practicing with OJAD Suzuki-kun
与 OJAD Suzuki-kun 一起练习后日语学习者言语韵律自然度的评估
A viewpoint shift from technical aid for speaking to that for listening: From output to input
从口语技术援助到听力技术援助的观点转变:从输出到输入

峯松 信明的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('峯松 信明', 18)}}的其他基金

Measurement of L2 pronunciation deviation and L2 listening disfluency and its application to prosody training for smooth international communication
二语发音偏差和二语听力不流利度测量及其在国际交流顺畅韵律训练中的应用
  • 批准号:
    23K17459
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Pioneering)
Measurement and modeling of cognitive breakdown and their use to enhance cognitive robustness for international oral communication
认知崩溃的测量和建模及其用于增强国际口头交流认知稳健性的用途
  • 批准号:
    22H00527
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Technically-enhanced high variability phonetic training and its effective application to English listening training for Japanese learners
技术强化的高变异性语音训练及其在日语学习者英语听力训练中的有效应用
  • 批准号:
    18F18724
  • 财政年份:
    2018
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
構造不変の定理に基づく聴覚・視覚・身体メディアの普遍的表象に関する基礎研究
基于结构不变性定理的听觉、视觉和物理媒体普遍表征的基础研究
  • 批准号:
    07F07078
  • 财政年份:
    2007
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
構造不変の定理に基づく音声アフォーダンスの提案とそれに立脚した音声認識系の構築
提出基于结构不变性定理的语音可供性并构建基于其的语音识别系统
  • 批准号:
    19024023
  • 财政年份:
    2007
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
言語情報とパラ言語情報を統合した音声の構造的表象の提案とその音声合成への応用
整合语言和副语言信息的语音结构表示的提出及其在语音合成中的应用
  • 批准号:
    19650036
  • 财政年份:
    2007
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
構造不変の定理に基づく音声アフォーダンスの提案とそれに立脚した音声認識系の構築
提出基于结构不变性定理的语音可供性并构建基于其的语音识别系统
  • 批准号:
    18049018
  • 财政年份:
    2006
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
  • 批准号:
    16016219
  • 财政年份:
    2004
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
発音の明瞭性に着眼した発音構造の包括的記述とその語学学習への応用に関する研究
以发音清晰度为核心的发音结构综合描述及其在语言学习中的应用研究
  • 批准号:
    15652033
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
  • 批准号:
    15017225
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    23K23017
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
  • 批准号:
    23K20170
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
  • 批准号:
    24K04125
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
  • 批准号:
    22KJ2898
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
  • 批准号:
    23K16944
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    22H01749
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
  • 批准号:
    22K12168
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識と機械学習による新たな医学教育システムの創出
使用自动语音识别和机器学习创建新的医学教育系统
  • 批准号:
    22K10459
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了