ゼロ・少音声言語資源の音声処理技術の構築

零少口语资源语音处理技术构建

基本信息

  • 批准号:
    21K12611
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

英語や日本語のように音声データやその書き起こしデータ(音声言語資源)が豊富な言語に対して研究が盛んに行われてきた。一方、マサイ語や方言音声のような音声データが少ない(少資源)あるいは音声データが殆どない(ゼロ資源)音声に対して、音声認識システムを構築することはできない。しかし、そのような言語に対して検索等の音声処理ができれば、理解への手助けなど、新しい展開が可能になる。そこで本研究課題では、少資源音声/ゼロ資源音声に対する検索技術および情報処理技術の構築を目指すものである。本研究課題を実現する上では、方言音声やゼロ資源言語に対して検索技術が有効な技術と位置付け、高精度・高速・低容量での音声検索技術の研究開発を推進している。令和4年度はこの技術を遠野方言に応用するため、新しい音声の検索方式として、最新の深層学習手法を導入し、音声中の音声検索語検出における平均事後確率ベクトル圧縮方式および、フレーム圧縮手法および複数の深層学習モデルのスコア統合方式、音声データの最尤および上位の状態系列の利用による検索精度向上方式を実装した。遠野の語り部の方言音声を分析すると、標準語日本語音声と比べ音声言語体系が異なるため単語単位での音声認識システムを用いることができず、キーワードの音素/音節列と、遠野音声の音素/音節列を照合する方式を研究開発した。遠野方言音声を用いた適応学習なしに、任意のキーワードの検索を実現することができることを確認した。またキーワードをそのまま音声(方言音声)で与え、音声同士を比較・検索する方式についても研究開発し、一旦深層学習モデルを通し、フレームレベル(1/100秒毎)の不特定特徴量で照合する方式を研究開発し、その有効性を検証した。さらに、これらの技術を応用し、これまで収録した遠野方言音声を利用し、方言音声理解支援のための新たな音声処理システムの設計を進めた.
English, Japanese, Chinese, Spanish, Spanish, A party, a dialect, a sound, a Sound processing, such as speech search, is possible for understanding, manual assistance, and new development. This research topic focuses on the construction of information technology and information processing technology. This research project is aimed at advancing the research and development of sound detection technology for dialect sound, resource speech, location, high precision, high speed and low capacity. In 2004, we introduced the latest deep learning techniques into the application of technology in the field of remote dialects, and the average post-validation rate of sound detection in sound detection was adjusted to include compression methods, compression techniques, and multiple deep learning methods. The research on phoneme/syllable sequence of Tohno sounds and phoneme/syllable sequence of Tohno sounds is carried out. Tohno dialect sound is used in the appropriate learning, arbitrary search and search, and this is confirmed. Research and development of methods for comparing and searching sound with dialect sound; research and development of methods for combining non-specific feature quantities of deep learning sound (1/100 second); and research and development of effectiveness. The new sound processing system is designed to support the use of local dialect sound.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
楽曲ジャンル分類へのEfficientNetV2の適用
EfficientNetV2在音乐流派分类中的应用
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Reo Minakawa;Kazunori Kojima;Shi-wook Lee;Yoshiaki Itoh;坂田大地,小嶋和徳,伊藤慶明
  • 通讯作者:
    坂田大地,小嶋和徳,伊藤慶明
rame-Level Matching Scheme Using Posteriorgram Probability Distance of Spoken Data to Improve Search Accuracy of Spoken Term Detection,
使用口语数据的后图概率距离的帧级匹配方案来提高口语术语检测的搜索准确性,
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Reo Minakawa;Kazunori Kojima;Shi-wook Lee;Yoshiaki Itoh
  • 通讯作者:
    Yoshiaki Itoh
Average Posterior Probability Vector Method for Spoken Query-spoken Term Detection
用于口语查询口语术语检测的平均后验概率向量方法
  • DOI:
    10.20729/00223427
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    横田 平志;小嶋 和徳;李 時旭;伊藤 慶明
  • 通讯作者:
    伊藤 慶明
異種・複数の深層学習モデルを用いた音声中の検索語検出方式の高精度・低メモリ化
使用异构和多个深度学习模型的语音中的高精度和低内存搜索词检测方法
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西野将弘,伊藤慶明,小嶋和徳,李時旭
  • 通讯作者:
    西野将弘,伊藤慶明,小嶋和徳,李時旭
音声中の音声検索語検出におけるフレーム圧縮手法および複数の深層学習モデルのスコア統合による検索精度・検索速度・メモリ量の改善
利用帧压缩技术和多个深度学习模型的分数集成来检测语音中的语音搜索词,提高搜索精度、搜索速度和内存容量
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    畠山和望;小嶋和徳;李 時旭;伊藤慶明
  • 通讯作者:
    伊藤慶明
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

伊藤 慶明其他文献

並列分散GAにおける多層型トポロジに関する考察
并行分布式遗传算法中多层拓扑的思考
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    菊池 雅彦;石亀 昌明;伊藤 慶明;小嶋 和徳
  • 通讯作者:
    小嶋 和徳
検索語毎の性能期待値に基づく複数サブワードモデルの検索結果統合方式
基于每个搜索词性能期望的多子词模型搜索结果整合方法
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 慶明;岩田 耕平;小嶋 和徳;石亀 昌明;田中 和世;李 時旭
  • 通讯作者:
    李 時旭
混合正規分布間の誤差推定値近似に関する実験的考察
混合正态分布之间近似误差估计的实验考虑
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    李 時旭,児島 宏明;田中 和世;伊藤 慶明
  • 通讯作者:
    伊藤 慶明
筆の傾きによる紙との接触面の変化を考慮した電子筆モデル
一种电子画笔模型,考虑了由于画笔倾斜而导致的与纸张接触面的变化。
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 聡;石亀 昌明;伊藤 慶明;小嶋 和徳
  • 通讯作者:
    小嶋 和徳
感情の強さを制御可能な音声合成のためのFOパターン生成
用于语音合成的 FO 模式生成可控制情绪强度

伊藤 慶明的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('伊藤 慶明', 18)}}的其他基金

魚肉すり身低温貯蔵中のタンパク質変性とその復性に関する研究
鱼酱低温贮藏过程中蛋白质变性及其恢复研究
  • 批准号:
    01F00314
  • 财政年份:
    2002
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了