発声器官の機械系による構成と音声獲得メカニズムの解明

阐明发声器官的机械结构和声音获取机制

基本信息

  • 批准号:
    11780294
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1999
  • 资助国家:
    日本
  • 起止时间:
    1999 至 2000
  • 项目状态:
    已结题

项目摘要

人間の発声器官は主に、肺、声帯、声道、舌、口蓋とそれらを動かす筋肉などから成り、互いに適当な位置や形状を形成することにより音声が生成される。本研究は、人間と同等の発声器官を機械系によって構成し、聴覚フィードバックと自己学習によって人間の音声学習過程を再現し、また人間らしい発声手法を獲得させることを目的としてきた。人間の発声機構は大きく分けて、声帯振動による音源の生成と、声道部共鳴によるホルマントの付加という二つの働きによって構成されている。主として顎や舌の非定常な動作によって引き起こされる変化から子音が生成され、母音は定常的な声道形状を形成することによって生成される。この発声機構を、エアコンプレッサ、圧力調節弁、流量調節弁、人工声帯、調音用共鳴管、マイクロホン、音声解析用計算機から成る機械系モデルによって構築した。7つのモータ(流量操作:1、声帯操作:1、共鳴管操作:5)によって機械系をダイナミックに制御することにより、聴覚フィードバックを用いた学習によって人間のように機械系が自ら音声を獲得できることを示した。特に本年は、音声から発声動作を逆推定する処理にニューラルネットワーク(NN)を適用した。学習時において、NNはシステムが生成した音響の音響パラメータを入力とし、そのときの制御パラメータを教師信号とすることで、ある音響を生成するために必要な声道の形状を学習する。学習後、NNを声道モデルに対し直列につなぐ。NNに生成したい音響の音響パラメータを入力し、出力された制御パラメータから求められる声道の形状に変化させることによって、望む音響を生成することが可能となった。今後は、機械モデルによる音声獲得と人間の学習機構の解明を通して、新しいヒューマンインタフェース実現に向けての検討をおこなっていく。
Human の 発 acoustic organ は に Lord, lung, acoustic 帯, channel, tongue, flap と そ れ ら を dynamic か す brawn な ど か ら り, mutual い に な position appropriate を や shapes form す る こ と に よ り sounds が generated さ れ る. は, this study human と equal の 発 sound organs を mechanics department に よ っ て し, hearing フ ィ ー ド バ ッ ク と に study よ っ て を reappear し の sounds of learning process and ま た human ら し い 発 acoustic technique を get さ せ る こ と を purpose と し て き た. Human の 発 sound institutions は large き く points け て, acoustic vibration に 帯 よ る audio の generated と, vocal tract resonance に よ る ホ ル マ ン ト の plus と い う two つ の 働 き に よ っ て constitute さ れ て い る. Main と し て jaw や tongue の unsteady な action に よ っ て lead き up こ さ れ る variations change か ら consonants が generated さ れ, vowel は stationary な track shape を form す る こ と に よ っ て generated さ れ る. こ の 発 sound institutions を, エ ア コ ン プ レ ッ サ, pressure adjusting chemical, chemical flow regulation, artificial acoustic 帯, tuning with resonance tube, マ イ ク ロ ホ ン, analytical computer sounds か ら into る mechanics department モ デ ル に よ っ て build し た. 7 つ の モ ー タ (traffic operation: 1, sound 帯 operation: 1, the resonance tube operation: 5) に よ っ て mechanics department を ダ イ ナ ミ ッ ク に suppression す る こ と に よ り, hearing フ ィ ー ド バ ッ ク を with い た learning に よ っ て human の よ う に mechanics department が since ら sounds を get で き る こ と を shown し た. に this year は, sounds か ら 発 sound action を inverse presumption す る 処 Richard に ニ ュ ー ラ ル ネ ッ ト ワ ー ク (NN) を applicable し た. When studying に お い て, NN は シ ス テ ム が generated し た sound の パ ラ メ ー タ を と into force し, そ の と き の suppression パ ラ メ ー タ を teacher signal と す る こ と で, あ る sound を generated す る た め に な necessary channel の shape を learning す る. After learning, the NNを channel モデ に に に is in direct line with the vertical channel に に なぐ なぐ. NN に generated し た い sound の パ ラ メ ー タ を し into force, output さ れ た suppression パ ラ メ ー タ か ら o め ら れ る track の shape に variations change さ せ る こ と に よ っ て, む sound を generated す る こ と が may と な っ た. Future は, mechanical モ デ ル に よ る sounds と の human learning institutions の interpret を tong し て, new し い ヒ ュ ー マ ン イ ン タ フ ェ ー ス be am に to け て の beg を 検 お こ な っ て い く.

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
佐治裕一郎,Pitoyo Hartono,橋本周司,澤田秀之: "声道物理モデルによる音響生成"情報処理学会研究報告. MUS-36. 13-18 (2000)
Yuichiro Saji、Pitoyo Hartono、Shuji Hashimoto、Hideyuki Sawada:“使用声道物理模型生成声音”日本信息处理学会研究报告 13-18 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
佐治裕一郎,Pitoyo Hartono,橋本周司,澤田秀之: "声道物理モデルのニューラルネットワークによる制御"情報処理学会 第62回全国大会 講演論文集. (2001)
Yuichiro Saji、Pitoyo Hartono、Shuji Hashimoto、Hideyuki Sawada:“使用神经网络控制声道物理模型”第 62 届日本信息处理学会全国会议论文集(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
澤田 秀之: "発声機構の機械モデルとその聴覚フィードバック制御"計測自動制御学会 さぬき制御システム研究会. (2000)
Hideyuki Sawada:“发声机制的机械模型及其听觉反馈控制”赞岐控制系统研究组,仪器与控制工程师学会(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Hideyuki Sawada and Shuji Hashimoto: "Mechanical Model of Human Vocal System and Its Control with Auditory Feedback"JSME International Journal, Series C. Vol.43,No.3. 645-652 (2000)
Hideyuki Sawada 和 Shuji Hashimoto:“人类发声系统的机械模型及其听觉反馈控制”JSME 国际期刊,C 系列,第 43 卷,第 3 期。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Hideyuki Sawada: "Mechanical Construction of Human Vocal System for Singing VoiceProduction"The International Journal of the Robotics Society of Japan. (掲載予定). (2000)
Hideyuki Sawada:“人类发声系统的机械构造”日本机器人学会国际杂志(2000 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

澤田 秀之其他文献

Analysis of the Micro-vibration Characteristics of a Shape Memory Alloy Wire
形状记忆合金丝的微振动特性分析
  • DOI:
    10.14923/transelej.2022jcp5005
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岩名 紘基;重宗 宏毅;澤田 秀之
  • 通讯作者:
    澤田 秀之
招待講演「発話ロボットによる発話動作の再現と肢体不自由児の発話訓練への応用」
特邀报告:《利用说话机器人再现言语动作及其在肢体残疾儿童言语训练中的应用》
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kouno;K.;Tan;J. K.;Ishikawa;S.;澤田 秀之
  • 通讯作者:
    澤田 秀之
ヒューマンコミュニケーション賞受賞(2008年3月23日)「発話ロボットを用いた聴覚障碍者のための発話訓練」
人类交流奖获得者(2008 年 3 月 23 日)“使用会说话的机器人对听障人士进行言语训练”
人工音声〜声道物理モデルの聴覚フィードバック制御に基づく音声生成( 『からだ』と『カラダ』)
人工语音 ~ 基于声道物理模型(“身体”和“身体”)的听觉反馈控制的语音生成

澤田 秀之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('澤田 秀之', 18)}}的其他基金

A Study of Spatial Cognition in High-dimensional Geometric Space through Touch and Tactile Interaction
通过触摸和触觉交互进行高维几何空间的空间认知研究
  • 批准号:
    22K19817
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
A study of the fast phase transformation of Shape-memory alloy wires and its application to tactile display and bidirectional tactile communication
形状记忆合金丝快速相变及其在触觉显示和双向触觉通信中的应用研究
  • 批准号:
    20H04214
  • 财政年份:
    2020
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
機械式発話ロボットの開発と構音障碍患者の発声訓練支援システムの構築
机械语音机器人的研制及构音障碍患者发声训练支持系统的构建
  • 批准号:
    15700164
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
発声障碍者音声の明瞭化フィルタリングに関する研究
发音障碍者言语清晰度过滤的研究
  • 批准号:
    13780288
  • 财政年份:
    2001
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

構音・発声器官の機能を模擬する発話障害者の音声支援器に関する研究
模拟发音和发音器官功能的言语障碍者言语支持装置的研究
  • 批准号:
    17K01555
  • 财政年份:
    2017
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
音声情報圧縮の基礎研究:言語音のスペクトル変化と発声器官の動きとの同時観測
语音信息压缩基础研究:同时观察语音频谱变化和发声器官的运动
  • 批准号:
    16J05172
  • 财政年份:
    2016
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ヒトの発声器官のモデル化と発声のシミュレーション
人体发声器官建模及发声模拟
  • 批准号:
    97J02739
  • 财政年份:
    1998
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
磁気センサによる発声器官の動態観測と発話指令時刻の抽出
利用磁传感器观察发声器官的动态并提取语音命令时间
  • 批准号:
    X00095----365151
  • 财政年份:
    1978
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (D)
霊長類の発声器官の研究
灵长类发声器官的研究
  • 批准号:
    X440952----84657
  • 财政年份:
    1969
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (D)
霊長類の発声器官の比較解剖
灵长类发声器官的比较解剖学
  • 批准号:
    X43210------4123
  • 财政年份:
    1968
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了