自由発話理解のための数学モデルの研究

自由言论理解的数学模型研究

基本信息

  • 批准号:
    09740161
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 1998
  • 项目状态:
    已结题

项目摘要

近年、音声認識/合成の分野では“より自由な発声"を扱うようになってきた。自由発話での大きな特徴として、話者の感情が込められることが挙げられる。今年度は、基本6感情から「恐怖」を除く「怒り」「驚き」「悲しみ」「嫌悪」「喜び」を取り上げ、その表現を制御する要因として話すテンポ、声の高さ、声の大きさに注目した。各々に対応する音響量は、発話速度、基本周波数(ピッチ)、振幅値となり、これを感情を表す特徴量とした。韻律モデルとしては、従来から用いられてきた藤崎モデルを採用した。まず、5つの各感情をよく表すように藤崎モデルのパラメータを決定した。次にこのパラメータが妥当なものかどうかを、実際に音声を合成出力して検証した。音声合成システムは、音素を合成単位とした、波形合成方式を採用した。保存データは、音素の波形データそのものではなく、波形の特徴となる局所的なピークを制御点としたデータを、各音素について作成し、合成に用いる。合成の際には、ピッチ周期にあわせて、制御点を時間軸上に配置し、それを余弦関数による補間を行うことにより、音声波形を生成する。データとして持っているのは各音素のデータだけであり、音素間のわたりの部分の波形には、その両端の音声データから制御点の移動により得られる中間波形を用いる。決定したパラメータから合成された単語音声から、各感情を知覚できるかを実験した。結果として、「怒り」「嫌悪」「悲しみ」については85%以上の高い正反応率が得られ、合成に用いたパラメータ値が妥当なものであることが裏付けられた。一方「喜び」と「驚き」については、韻律だけからその2つを区別することが困難であるどの仮説を得ることができた。
In recent years, in the field of sound recognition/synthesis, there is a <s:1> division で で "よ <s:1> free な release of sound "を うようになって うようになって た た た. The characteristics of the free expression of で, <s:1> and な are と and て, and the speaker 's <s:1> emotions が込められる and とが挙げられる. Our 6 は, basic emotions か ら "terrorist" を except く "nu り" "jing き" "Lamentations し み" "xi び" を "disrelish 悪" take り げ, そ の performance を suppression す る by と し て words す テ ン ポ の louder, high acoustic の さ, き さ に attention し た. Each 々 に 応 seaborne す る acoustics は, 発 velocity, basic frequency number (ピ ッ チ), amplitude numerical と な り, こ れ を feelings を table す, 徴 quantity と し た. Rhythm モ デ ル と し て は, 従 か ら with い ら れ て き た cane battery モ デ ル を using し た. Youdaoplaceholder0, 5 まず まず each emotion をよく form すように Fujisaki モデ パラメ パラメ タを タを decision た た. Time に こ の パ ラ メ ー タ が appropriate な も の か ど う か を, be interstate に sounds を synthetic output し て 検 card し た. The sound-to-sound synthesis システム システム, phoneme を synthesis 単 bit と <s:1> た, and waveform synthesis を adopt を た. Save デ ー タ は, phoneme の waveform デ ー タ そ の も の で は な く, waveform is の 徴 と な る bureau of な ピ ー ク を suppression point と し た デ ー タ を, each phoneme に つ い て made し, synthetic に い る. Synthetic の interstate に は, ピ ッ チ cycle に あ わ せ て, suppression point を に on the time axis し, そ れ を cosine masato number に よ る filling line between を う こ と に よ り, voice waveform を す る. デ ー タ と し て hold っ て い る の は each phoneme の デ ー タ だ け で あ り, phoneme の わ た り の part の waveform に は, そ の struck the の sounds デ ー タ か ら suppression point の mobile に よ り must ら れ る middle waveform を with い る. Decision し た パ ラ メ ー タ か ら synthetic さ れ た 単 voice sound か ら, know the feelings を 覚 で き る か を be 験 し た. Results と し て, "nu り" "too 悪" "Lamentations し み" に つ い て は 85% の high positive rate of 応 が い ら れ, synthetic に い た パ ラ メ ー タ numerical が appropriate な も の で あ る こ と が in pay け ら れ た. Party "xi び と" jing き に つ い て は, rhythm だ け か ら そ の 2 つ を difference す る こ と が difficult で あ る ど の 仮 said を る こ と が で き た.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
延澤志保, 斎藤博昭, 中西正和: "日本語における有繋文字列" 情報処理学会プログラミングシンポジウム予稿集. 137-142 (1998)
Shiho Nobuzawa、Hiroaki Saito、Masakazu Nakanishi:“日语中的连接字符串”日本信息处理学会编程研讨会论文集 137-142 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
小池和仁,斎藤博昭,中西正和: "感情音声の合成" 電子情報通信学会信学技報. SP98-107. 83-88 (1998)
Kazuhito Koike、Hiroaki Saito、Masakazu Nakanishi:“情感语音的综合”IEICE 技术报告 83-88 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
koike,K.,Suzuki,H.,Saito,H: "Prosodic Parameters in Emotional Speech" Proceedings of the 5th International Conference on Spoken Language Processing. 4 (1998)
小池,K.,铃木,H.,斋藤,H:“情感言语中的韵律参数”第五届国际口语处理会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

斎藤 博昭其他文献

日本語フレームネットにおけるアノテーシヨン支援環境の構築
日本框架网上注释支持环境的构建
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    久保谷 俊太;小原 京子;斎藤 博昭
  • 通讯作者:
    斎藤 博昭
語彙の階層情報を利用した日本語フレームネットの意味役割推定
使用词汇层次信息的日语框架网语义角色估计
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    曽根 孝明;小原 京子;斎藤 博昭
  • 通讯作者:
    斎藤 博昭

斎藤 博昭的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('斎藤 博昭', 18)}}的其他基金

フレーム意味論とコーパスデータに基づく日本語語彙意味情報資源の構築
基于框架语义和语料数据的日语词汇语义信息资源构建
  • 批准号:
    19011004
  • 财政年份:
    2007
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声対話における自由発話理解の研究
口语对话中的自由言语理解研究
  • 批准号:
    07221213
  • 财政年份:
    1995
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声対話における自由発話理解の研究
口语对话中的自由言语理解研究
  • 批准号:
    06232215
  • 财政年份:
    1994
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

Governing Democratic Discourse: Social Media, Online Harms, and the Future of Free Speech
治理民主话语:社交媒体、网络危害和言论自由的未来
  • 批准号:
    MR/V025600/1
  • 财政年份:
    2022
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Fellowship
Countering online terrorist propaganda whilst respecting the right to free speech
打击网上恐怖主义宣传,同时尊重言论自由权
  • 批准号:
    2570744
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Studentship
New everyday practices of free speech on campus: Beyond racialised and religious stereotypes
校园言论自由的新日常实践:超越种族和宗教刻板印象
  • 批准号:
    AH/V012649/1
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Research Grant
Free Speech and Legal Ethnic: A case study on lawyers discourse
言论自由与法律伦理:律师话语的案例研究
  • 批准号:
    19K13580
  • 财政年份:
    2019
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Establishment of text writing application for upper limb disabled person using hands-free speech recognition and gaze detection
利用免提语音识别和目光检测建立上肢残疾人文本书写应用
  • 批准号:
    16K21579
  • 财政年份:
    2016
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Comparative Free Speech Jurisprudence
比较言论自由法理学
  • 批准号:
    1535250
  • 财政年份:
    2015
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Standard Grant
The Reevaluation of Free Speech doctrine based on the Legal Theory of Luis Brandeis
基于路易斯·布兰代斯法律理论的言论自由主义重新评价
  • 批准号:
    26780013
  • 财政年份:
    2014
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Historical foundations of "strict scrutiny" in the United States: In focus on free speech jurisprudence in the Warren Court Era
美国“严查”的历史基础:聚焦沃伦法院时代的言论自由判例
  • 批准号:
    26380053
  • 财政年份:
    2014
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of technologies for next-generation voice changer towards barrier-free speech communication
开发下一代语音转换器以实现无障碍语音通信
  • 批准号:
    22680016
  • 财政年份:
    2010
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Young Scientists (A)
Extension and Application of Niose Cacellation using Fixed Beamforming for Hands-Free Speech Acquisition in Man-Machine Communication
使用固定波束成形的 Niose Cacellation 进行人机通信免提语音采集的扩展和应用
  • 批准号:
    319251-2005
  • 财政年份:
    2007
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了