Studies on Speech Recognition, Closed Caption and Summarization of Broadcast News

广播新闻语音识别、隐藏式字幕和摘要研究

基本信息

  • 批准号:
    09480064
  • 负责人:
  • 金额:
    $ 8.38万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 1999
  • 项目状态:
    已结题

项目摘要

It is well-known that HMMs only of the basic structure can not capture the correlation among successive frames adequately. In our previous work, to solve this problem, segmental unit HMMs were introduced and their effectiveness was shown. And the integration of Δ cepstrum and ΔΔ cepstrum into the segmental unit HMMs was also found to improve the recognition performance in the work. Firstly, we compared frame-based models and segment-based models. Results showed the effectiveness of the use of segmental features as input vectors. Secondly, we compared syllable-based HMMs and triphone-based HMMs. Recognition experiments showed that syllable-based HMMs are suitable for Japanese.Next, we developed a method that constructs language models using a task adaptation strategy and idiomatic expressions of news articles. First, we investigated the effect of a task adaptation method of N-gram language model using a limited amount of target articles. Second, we investigated the effect of the language model adaptation method using the latest articles. Third, we investigated the effect of the use of idiomatic expressions as morpheme units, since some specific expressions and idiomatic expressions are frequently observed in news articles. We showed that our proposed three methods were effective for constructing N-gram language models.Finally, we proposed and evaluated a method for summarizing each sentence in TV news texts written in Japanese. It is not appropriate to select important sentences for abstracting news text, because a news text consists of only a few and long sentences. Then, we tried to reduce redundant parts, which consisted of modifier etc., of each sentence. We used a simple parsing method specialized for news texts so that the syntactical structure was not destroyed. We evaluated this summarizing method by obtaining information by means of questionnaires to 32 examinees.
众所周知,仅基于基本结构的HASH不能充分捕捉连续帧之间的相关性。在我们以前的工作中,为了解决这一问题,分段单元的HALTORY被引入,并显示其有效性。同时,将Δ倒谱和Δ Δ倒谱结合到HSPs的分段单元中,也提高了识别性能。首先,我们比较了基于帧的模型和基于段的模型。结果表明,使用分段特征作为输入向量的有效性。其次,我们比较了基于音节和基于三音子的Herring。识别实验表明,基于音节的障碍语适用于日语。接下来,我们开发了一种使用任务适应策略和新闻文章的习惯表达来构建语言模型的方法。首先,我们使用有限数量的目标文章,研究了N-gram语言模型的任务适应方法的效果。其次,我们使用最新的文章研究了语言模型自适应方法的效果。第三,我们考察了习语作为语素单位使用的效果,因为一些特定的表达和习语经常出现在新闻文章中。最后,我们提出了一种对日语电视新闻文本中的每一个句子进行摘要的方法,并对该方法进行了评价。摘要新闻语篇的句子数量少,句子又长,不宜只选取重要的句子进行摘要。然后,我们试图减少多余的部分,其中包括修改器等,每一个句子。我们使用了一种专门用于新闻文本的简单解析方法,这样就不会破坏句法结构。通过对32名被试的问卷调查,对这种总结方法进行了评价。

项目成果

期刊论文数量(34)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中川聖一: "丸善"パターン情報処理. 310 (1999)
中川精一:“丸善”图案信息处理310(1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K. Hanai, K. Yamamoto, N. Minematsu and S. Nakagawa: "Continuous speech recognition using segmental unit input HMMS with mixture of probability density functions and context dependency"Proc. 5th Int. Conf. Spoken Language Processing. 2935-2938 (1998)
K. Hanai、K. Yamamoto、N. Minematsu 和 S. Nakakawa:“使用分段单元输入 HMMS 结合概率密度函数和上下文依赖性的连续语音识别”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川聖一: "岩波書店"5章音声認識「音声」(田窪,前川,本多,白井,中川). 177〜229 (1998)
Seiichi Nakakawa:《岩波书店》第 5 章语音识别“语音”(Takubo、Maekawa、Honda、Shirai、Nakakawa)177-229 (1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Seiichi Nakagawa: "Speech Recognition, Speech"Iwanami-Shoten (in Japanese). (1998)
Seiichi Nakakawa:“语音识别,语音”岩波书店(日语)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川聖一: "音声認識用言語モデルのためのタスク適応化と定型表現の利用" 自然言語処理. 6・2. 97-115 (1999)
Seiichi Nakakawa:“语音识别语言模型的任务适应和使用”自然语言处理 6・2(1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

NAKAGAWA Seiichi其他文献

小学校のICT活用をモデルとした保育での取り組み
以小学使用信息通信技术为蓝本的儿童保育举措
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一;堀田博史・佐藤朝美・森田健宏
  • 通讯作者:
    堀田博史・佐藤朝美・森田健宏
幼児教育でのタブレット端末等の活用
幼儿教育中平板设备等的利用
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵
  • 通讯作者:
    堀田博史・佐藤朝美・中村恵
最近の音声言語処理研究の動向 - 筆者の音声認識、音声翻訳、話者認識の研究を中心として -
口语处理研究的最新动态 - 重点关注作者在语音识别、语音翻译、说话人识别方面的研究 -
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一
  • 通讯作者:
    中川聖一

NAKAGAWA Seiichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('NAKAGAWA Seiichi', 18)}}的其他基金

A detection method using relative phase information for spoofed speech based on speech synthesis, speaker adaptation and edited speech
一种基于语音合成、说话人适应和编辑语音的利用相对相位信息的欺骗语音检测方法
  • 批准号:
    16K12461
  • 财政年份:
    2016
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Study on privacy protection in spoken language
口语隐私保护研究
  • 批准号:
    22650034
  • 财政年份:
    2010
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
High accuracy transcription, cleaning and fast term detection for spoken documents
语音文档的高精度转录、清理和快速术语检测
  • 批准号:
    22300059
  • 财政年份:
    2010
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Automatic indexing for lecture speech and its advanced utilization through speech interaction
讲座演讲自动索引及其通过语音交互的高级利用
  • 批准号:
    17300064
  • 财政年份:
    2005
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on content summarization for large spoken documents and content retrieval through spoken dialogue
大型口语文档内容摘要及口语对话内容检索研究
  • 批准号:
    13480095
  • 财政年份:
    2001
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development for speech interface for form -based in formation access services on Web
基于表单的Web信息访问服务语音接口的开发
  • 批准号:
    13558033
  • 财政年份:
    2001
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of a multi-modal dialogue system and a tool for a spoken dialogue system
多模态对话系统和口语对话系统工具的开发
  • 批准号:
    08558030
  • 财政年份:
    1996
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on multi-modal man-machine interface through spontaneous speech
基于自发语音的多模态人机界面研究
  • 批准号:
    06452401
  • 财政年份:
    1994
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Research for the Formation of Basic Concepts in Physics
物理学基本概念形成的研究
  • 批准号:
    05680163
  • 财政年份:
    1993
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
A Study on Ambiguous Utterance Understanding for Speech Input
语音输入的歧义话语理解研究
  • 批准号:
    03452167
  • 财政年份:
    1991
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)

相似海外基金

Development and Applications of a Novel Acoustic Model for Respiratory System
新型呼吸系统声学模型的开发与应用
  • 批准号:
    RGPIN-2016-06549
  • 财政年份:
    2021
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Discovery Grants Program - Individual
Development and Applications of a Novel Acoustic Model for Respiratory System
新型呼吸系统声学模型的开发与应用
  • 批准号:
    RGPIN-2016-06549
  • 财政年份:
    2020
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Discovery Grants Program - Individual
Construction of acoustic model on small training data for dysarthric speech recognition
用于构音障碍语音识别的小训练数据声学模型的构建
  • 批准号:
    20K19862
  • 财政年份:
    2020
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development and Applications of a Novel Acoustic Model for Respiratory System
新型呼吸系统声学模型的开发与应用
  • 批准号:
    RGPIN-2016-06549
  • 财政年份:
    2019
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Discovery Grants Program - Individual
Toward the next generation in transcranial MR-guided focused ultrasound: Innovations in thermal and acoustic model-based planning and monitoring for improved safety, efficacy and efficiency
迈向下一代经颅 MR 引导聚焦超声:基于热和声学模型的规划和监测创新,以提高安全性、有效性和效率
  • 批准号:
    9803678
  • 财政年份:
    2019
  • 资助金额:
    $ 8.38万
  • 项目类别:
Toward the next generation in transcranial MR-guided focused ultrasound: Innovations in thermal and acoustic model-based planning and monitoring for improved safety, efficacy and efficiency
迈向下一代经颅 MR 引导聚焦超声:基于热和声学模型的规划和监测创新,以提高安全性、有效性和效率
  • 批准号:
    10159735
  • 财政年份:
    2019
  • 资助金额:
    $ 8.38万
  • 项目类别:
Automatic acquisition of optimized acoustic model unit for automatic speech recognition using deep learning
使用深度学习自动获取用于自动语音识别的优化声学模型单元
  • 批准号:
    19K12027
  • 财政年份:
    2019
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Toward the next generation in transcranial MR-guided focused ultrasound: Innovations in thermal and acoustic model-based planning and monitoring for improved safety, efficacy and efficiency
迈向下一代经颅 MR 引导聚焦超声:基于热和声学模型的规划和监测创新,以提高安全性、有效性和效率
  • 批准号:
    10401242
  • 财政年份:
    2019
  • 资助金额:
    $ 8.38万
  • 项目类别:
Development and Applications of a Novel Acoustic Model for Respiratory System
新型呼吸系统声学模型的开发与应用
  • 批准号:
    RGPIN-2016-06549
  • 财政年份:
    2018
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Discovery Grants Program - Individual
Development and Applications of a Novel Acoustic Model for Respiratory System
新型呼吸系统声学模型的开发与应用
  • 批准号:
    RGPIN-2016-06549
  • 财政年份:
    2017
  • 资助金额:
    $ 8.38万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了