話者の映像及び話声の性質が高精度高感性音声提示システムに与える影響

演讲者视频和说话声音特征对高精度、高灵敏度音频演示系统的影响

基本信息

  • 批准号:
    17700223
  • 负责人:
  • 金额:
    $ 2.11万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2006
  • 项目状态:
    已结题

项目摘要

本研究の目的は,話者映像の有無や,ピッチ,話速といった話声の性質,話者映像と話声の同期,話者の口の動きといったパラメータが,音韻知覚及び視聴者の感性情報にどのような影響を及ぼすか定量的に明らかにし,得られた知見に基づいて,高感性音声提示システムの構築法を検討することである.今年度は昨年度と同様に音声の話速に注目し,話速を遅らせることで時間長を伸長した音声と通常速度の話者映像との組み合わせが,文章了解度にどのような影響を及ぼすかを検討した.あわせて,単語刺激を用いて話者映像と伸長音声を組み合わせた際の映像と音声のズレの検知限,許容限を心理実験により求め,両者の関係を分析した.まず,文章了解度試験を行ったところ,音声伸長量が200ms以内であれば,話者映像と音声の間にズレが生じていても,話者映像を付加することによる文章了解度の向上が見込めるという結果が得られた.この結果は,昨年度単語を用いて得られた結果と同様であり,音声伸長量を200ms以内に設定すれば,話者映像が音韻知覚を促進するということを示している.一方,伸長音声と通常速度の話者映像を用いて話者映像と音声とのズレの検知限を求めたところ,約230msが検知限となることが示された.また,ズレの許容限は約340msであった.これらの結果と,昨年度得られた単語了解度の結果を総合すると,話者映像と音声のズレが検知できない範囲であれば,話者映像が音韻知覚の向上に寄与するということが示唆される.逆に言うと,話者映像と音声のズレの検知といった感性情報が音声知覚に負の影響を及ぼしているといえよう.これらの知見は,高感性音声提示システムを構築する上での指針となり得る極めて重要な知見であると思われる.
は の purpose, this study image の presence of や, the speaker's words ピ ッ チ, words speed と い っ た words sound の properties, image と words sound の the speaker's words in the same period, the callee の mouth の dynamic き と い っ た パ ラ メ ー タ が, phonological know 覚 and び regard 聴 の emotional intelligence に ど の よ う な influence を and ぼ す quantitative に Ming か ら か に し, too ら れ た knowledge に base づ い て, high perceptual voice prompt シ ス Youdaoplaceholder0 <s:1> construction method を検 for する とである とである. Our annual と は yesterday with others に sounds speed に attention し の words, words speed を 遅 ら せ る こ と で long を elongation し た sounds と の words usually speed image と の group み close わ せ が, article for degrees に ど の よ う な influence を and ぼ す か を beg し 検 た. あ わ せ て, stimulate を 単 language use い て image と elongation sounds of the speaker's words を group み close わ せ た interstate の image と sounds の ズ レ の 検 limit, allowable limit を psychological be 験 に よ り め, who struck の masato analysis を し た. ま ず, article for degree of test line を っ た と こ ろ, sounds elongation が within 200 ms で あ れ ば, image と sounds of the speaker's words between の に ズ レ が raw じ て い て も, image is the speaker's words を plus す る こ と に よ る の article for degrees upward が see 込 め る と い う knot Fruit が have ら れ た. こ は の results, yesterday's annual を 単 language use い て must ら れ と た results with others in で あ り, sounds elongation を に set within 200 ms す れ ば, image is the speaker's words が phonological knowledge 覚 を promote す る と い う こ と を shown し て い る. Side, elongation sounds と の words usually speed image を with い て image と sounds of the speaker's words と の ズ レ の 検 known limit を o め た と こ ろ, about 230 ms が 検 known limit と な る こ と が shown さ れ た. ま た, ズ レ の allowable limit は about 340 ms で あ っ た. こ れ ら の と result, last year have ら れ た 単 language understanding degree の results を 総 close す る と, image is the speaker's words と sounds の ズ レ が 検 know で き な い van 囲 で あ れ ば, image is the speaker's words が phonological knowledge 覚 の に send upward す る と い う こ と が in stopping さ れ る. Inverse に said う と, image と sounds of the speaker's words の ズ レ の 検 know と い っ た emotional intelligence が sounds know 覚 に negative の を and ぼ し て い る と い え よ う. こ れ ら の knowledge は, high perceptual voice prompt シ ス テ ム を build す る on で の pointer と な り must る extremely め て important な knowledge で あ る と think わ れ る.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
単語音声と話者映像のずれが視聴覚統合に及ぼす影響
文字音频和演讲者视频之间的差异对视听整合的影响
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 良季;傳田 遊亀;中山 雅人;西浦 敬信;Keiji Tatsumi;Keiji Tatsumi;Keiji Tatsumi;Keiji Tatsumi;Keiji Tatsumi;Keiii Tatsumi;Keiji Tatsumi;巽 啓司;由上 隆士;永尾浩之;永尾 治之;田中章浩;津村光美
  • 通讯作者:
    津村光美
視聴覚の提示タイミングおよび提示速度の違いが単語音声認知に及ぼす影響
视听呈现时间和呈现速度差异对单词语音识别的影响
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 良季;傳田 遊亀;中山 雅人;西浦 敬信;Keiji Tatsumi;Keiji Tatsumi;Keiji Tatsumi;Keiji Tatsumi;Keiji Tatsumi;Keiii Tatsumi;Keiji Tatsumi;巽 啓司;由上 隆士;永尾浩之;永尾 治之;田中章浩
  • 通讯作者:
    田中章浩
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

坂本 修一其他文献

聴覚情報処理障害の聞き取り困難に関する一考察 選択的注意に関連したスペクトラム障害としての一側面?
关于听觉信息处理障碍导致的听力困难的研究:它是与选择性注意相关的谱系障碍的一个方面吗?
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川瀬 哲明;佐々木 志保;小渕 千絵;坂本 修一
  • 通讯作者:
    坂本 修一
DMS273細胞株由来の高転移性細胞の解析による小細胞肺がんの転移促進因子の同定
通过分析源自 DMS273 细胞系的高转移细胞来鉴定小细胞肺癌的转移促进因子
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂本 修一;川田 学
  • 通讯作者:
    川田 学
仮想的に音像定位させた聴覚信号によって誘導される事象関連電位に関する検討
虚拟声像定位听觉信号诱发事件相关电位的研究
聴覚情報処理障害を疑った患者に対するスピーカアレイを用いた競合音声下単語了解度検査
使用扬声器阵列对疑似患有听觉信息处理障碍的患者进行竞争性演讲下的单词清晰度测试
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川瀬 哲明;寺岡 諒;佐々木 志保;小渕 千絵;坂本 修一
  • 通讯作者:
    坂本 修一
小細胞肺がんの異種移植マウスモデルにおける新規転移促進因子の同定
小细胞肺癌异种移植小鼠模型中新型转移促进因子的鉴定
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂本 修一;川田 学
  • 通讯作者:
    川田 学

坂本 修一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('坂本 修一', 18)}}的其他基金

人間の選択的情報処理に基づく聴空間共有型コミュニケーションプラットホームの実現
基于人类选择性信息处理的共享听觉空间交流平台的实现
  • 批准号:
    22H00523
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
新規治療標的の同定を目指した小細胞肺がんの脳転移メカニズムの解析
分析小细胞肺癌脑转移机制,寻找新的治疗靶点
  • 批准号:
    21K06957
  • 财政年份:
    2021
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
話者の映像及び話声の性質を考慮した高品位高感性コミュニケーションシステムの構築
构建考虑发言者视频和语音特点的高质量、高灵敏度的通信系统
  • 批准号:
    19700200
  • 财政年份:
    2007
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
NBS1依存性相同組換えの放射線生物影響における意義
NBS1 依赖性同源重组在放射生物学效应中的意义
  • 批准号:
    16710032
  • 财政年份:
    2004
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

オンライン・コミュニケーションにおける視聴覚統合の時空間特性
网络传播中视听融合的时空特征
  • 批准号:
    23K22377
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
精神疾患における視聴覚統合様式のメカニズムの探索
视听整合模式治疗精神疾病的机制探讨
  • 批准号:
    24KJ1262
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ASDモデルマウスにおける視聴覚統合とその障害
ASD 模型小鼠视听整合及其损伤
  • 批准号:
    23K12938
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
オンライン・コミュニケーションにおける視聴覚統合の時空間特性
网络传播中视听融合的时空特征
  • 批准号:
    22H01106
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
スナネズミにおける視聴覚統合メカニズムの解明
沙鼠视听整合机制的阐明
  • 批准号:
    22K21315
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
視聴覚統合機能と概念獲得機能の統一モデルの提唱:神経制約計算機モデルを用いて
提出视听整合和概念获取功能的统一模型:使用神经约束计算机模型
  • 批准号:
    20H04494
  • 财政年份:
    2020
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
三次元物体の距離・接近知覚を実現する視聴覚統合過程:ベイズモデリングと脳波
实现三维物体距离/接近感知的视听集成过程:贝叶斯建模和脑电波
  • 批准号:
    19J11435
  • 财政年份:
    2019
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
視聴覚統合の神経基盤:齧歯類スナネズミをモデルとした研究
视听整合的神经基础:以啮齿类沙鼠为模型的研究
  • 批准号:
    19J22981
  • 财政年份:
    2019
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
顔と音声の視聴覚統合における社会的環境要因の効果について
社会环境因素对人脸声音视听整合的影响
  • 批准号:
    19J00722
  • 财政年份:
    2019
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
脳機能計測のフィードバックを用いた視聴覚統合と記憶検索のメカニズム解明とその応用
利用脑功能测量的反馈阐明视听整合和记忆检索的机制及其应用
  • 批准号:
    14J01927
  • 财政年份:
    2014
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了