大規模音声言語コーパスを用いた独話文の統計的係り受け解析技術の開発

基于大规模口语语料库的独白句统计依存分析技术开发

基本信息

  • 批准号:
    17700148
  • 负责人:
  • 金额:
    $ 2.3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2006
  • 项目状态:
    已结题

项目摘要

本研究では、講演等の同時通訳における要素技術として利用することを想定し、音声入力に追従して処理可能(実時間性)、入力途中の段階でそれまでの部分に対する構文構造を生成可能(漸進性)、ならびに、日本語文法に逸脱する文であっても解析可能(頑健性)、を備えた独話音声の構文解析手法を開発している。最終年度は、独話音声の解析システムの設計・実現、及び、解析システムの評価を実施し、以下に示す成果を得ることができた。(1)独話音声の解析システムの設計・実装:解析単位認識プログラム、及び、統計的な係り受け解析プログラムを設計し、実装した。解析単位の認識には、節境界解析プログラムCBAPを使用し、独話文だけでなく、独話全体の解析が可能となるように、文境界が未知である状況で決定的に節境界を検出できる枠組みとした。統計的な係り受け解析では、大量の構文木データから係り受け確率を学習した。学習には、あらかじめ人手で作成した約5000文の構文木つき独話文データを使用した。係り受け解析を漸進的に実行するために、節境界が検出されるたびに、節の内部の文節の係り受け解析を実行し、また、節の最終文節の係り受け解析については、節が入力されるたびにその係り先を検討し、解析状況に応じて動的に決定する仕組みを定めた。本手法によれば、漸進的に係り受け先が決定すると同時に、解析結果に基づいて文末を判定することも可能であり、講演音声の同時的なアプリケーションにおいて利用可能なシステムとして実現している。(2)解析システムの評価:昨年度に開発した方式をもとに実装したシステムの総合評価を実施した。テストデータとして10分程度の実際の講演音声を使用した。講演全体に対する解析結果を評価対象とし、解析単位に基づく漸進的な手法の効果と限界を明らかにした。その結果、リアルタイムでの漸進的な構文解析を85%程度の精度で実行できること確認した。本研究による成果については、2編の学術雑誌論文、及び、2編の国際会議論文等により公表した。
At the same time, in this study, we discuss the elements of technology, technology, and so on. In this study, we discuss the elements of this study, such as the use of technology and technology to make use of the possibility of thinking and thinking, the possibility of sound input, and the possibility (timeliness). During the course of the study, it is possible (progressive) to create a part of the text (progressive), Japanese grammar, and Japanese grammar. It is necessary to use the method of analyzing the sound of a monologue. The most recent annual and monologue voice analysis equipment design shows, analyzes and analyzes the performance of the audio system. The following shows that the results show that the results are satisfactory. (1) Voice analysis of solo voice equipment: analyze the location of the phone, analyze the statistics of the phone, analyze the device design and install the device. Analysis of location knowledge, realm analysis of CBAP users, solo text analysis, monologue analysis of the whole group of people who may be aware of the situation, and the state of the text that is not known. According to the statistics, there are a lot of statistics, such as the analysis of the statistics, and a large number of students. Learn how to use your hands to make up about 5000 books, books and books. In the process of analysis, the system, the level, the level In this method, the system is determined at the same time, and the results are analyzed. At the end of the text, it is determined that the system may be affected, and at the same time, the sound of the sound may be detected. (2) Analysis of the financial situation: in the year of last year, the mode of operation was in accordance with the current situation. I don't know what to do. I don't know how to use a 10-point scale. To perform the whole process of analyzing the results of the analysis of the results. The result of the test, the analysis of the improved document, the accuracy of 85%, and the confirmation of the accuracy. The results of this study are published in public tables, including academic journal articles, academic journal articles, and international conference papers.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Influence of Pause Length on Listeners' Impressions in Simultaneous Interpretation
同声传译中停顿长度对听众印象的影响
Structured Sentence Retrieval Based on Lexical Dependencies
基于词汇依存的结构化句子检索
話し言葉解析に基づく話者知識の自動獲得
基于口语分析的说话人知识自动获取
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shigeki Matsubara;Tomohiro Ohno;大野 誠寛;丁 哲;Tomohiro Ohno;Zhe Ding;小野 貴博
  • 通讯作者:
    小野 貴博
Interpreting Unit Segmentation of Conversational Speech in Simultaneous Interpretation Corpus
同声传译语料库中会话语音的口译单元切分
漸進的係り受け解析に基づく独話音声のリアルタイム字幕生成
基于渐进依存分析的独白语音实时字幕生成
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

松原 茂樹其他文献

系列変換モデルを用いた傾聴的な応答表現の生成
使用级数变换模型生成聆听响应表达式
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村田 匡輝;大野 誠寛;松原 茂樹
  • 通讯作者:
    松原 茂樹
アンケート調査に基づく障害者グループホームの「地域」に関する考察
基于问卷调查的残疾人集体之家“区域”思考
植村剛、辻井雅也、里中東彦、堀和一郎、内田淳正、須藤啓広
植村刚、辻井雅也、里中彦、堀和一郎、内田纯正、须藤博宏
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高橋 宏典;菊池 邦生;竹下 俊行;松原 茂樹;鈴木 光明;瀧澤 俊広;乳幼児における屈筋腱断裂(zonel)の3例.
  • 通讯作者:
    乳幼児における屈筋腱断裂(zonel)の3例.
【小児腫瘍における多施設共同臨床試験の背景と進捗】小児固形腫瘍観察研究
[小儿肿瘤多中心临床试验背景及进展]小儿实体瘤观察研究
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    瀧澤 俊広;大口 昭英;松原 茂樹;竹下 俊行;大喜多肇
  • 通讯作者:
    大喜多肇
当事者研究から見えてきた、社会・建築に期待すること
相关人员的研究揭示了对社会和建筑的期望
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    綾屋 紗月;岩佐 明彦;上野 佳奈子;古賀 政好;松原 茂樹;橋口 亜希子;矢野 拓洋;市川 幹朗
  • 通讯作者:
    市川 幹朗

松原 茂樹的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('松原 茂樹', 18)}}的其他基金

研究データリポジトリの構築に向けた学術論文テキストの解析と利用
分析和使用学术论文文本来构建研究数据存储库
  • 批准号:
    23K21844
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
障害者の活動拠点の整備による地域コミュニティの持続可能性に関する研究
通过发展残疾人活动中心研究当地社区的可持续性
  • 批准号:
    23K04194
  • 财政年份:
    2023
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Contribution Measurement of Cited Literatures in Scholarly Papers: Towards a New Method for Literature Evaluation
学术论文中引用文献的贡献测量:迈向文献评价的新方法
  • 批准号:
    23K18506
  • 财政年份:
    2023
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Scholarly document analysis for data repository construction
数据存储库建设的学术文献分析
  • 批准号:
    21H03773
  • 财政年份:
    2021
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音声対話システムの個性化に関する基礎的研究
口语对话系统个性化基础研究
  • 批准号:
    21650028
  • 财政年份:
    2009
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
大規模音声言語対訳コーパスを用いた同時的な対話翻訳手法の開発とその評価
使用大规模双语口语语料库的同声对话翻译方法的开发和评估
  • 批准号:
    15700127
  • 财政年份:
    2003
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
英語講演の同時通訳システムの実現に関する研究
英语讲座同声传译系统的实现研究
  • 批准号:
    13780278
  • 财政年份:
    2001
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
同時通訳システムの実現を目指した日英話し言葉翻訳に関する研究
以实现同声传译系统为目标的日英口语翻译研究
  • 批准号:
    11780261
  • 财政年份:
    1999
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

ナラティブはどのようにして生じるのか?-自然言語処理技術を用いた検討-
叙事是如何出现的?
  • 批准号:
    24K16786
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
言語流暢性課題の定性的分析方法の構築:語彙特性と自然言語処理の応用
构建语言流畅性任务的定性分析方法:词汇特征和自然语言处理的应用
  • 批准号:
    24K10484
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自然言語処理に最適な語彙と分割の仕方を自動で獲得する人工知能の創出
创建自动获取自然语言处理最佳词汇和切分方法的人工智能
  • 批准号:
    24K20852
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
能動学習を用いた、放射線科所見文重要度推定用自然言語処理システムの開発
开发自然语言处理系统,使用主动学习来评估放射学结果的重要性
  • 批准号:
    24K18797
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自然言語処理技術を用いた食物アレルゲン性予測システム構築
利用自然语言处理技术构建食物过敏性预测系统
  • 批准号:
    24K01707
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
自然言語処理を用いた重粒子線治療の適応判定のための自動チャットシステムの開発
开发自动聊天系统,利用自然语言处理确定重离子放射治疗的适用性
  • 批准号:
    24K18821
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自然言語処理を活用した皮質脳波解析による長文読解の神経ネットワーク基盤の解明
通过自然语言处理的皮层脑电图分析阐明长句阅读的神经网络基础
  • 批准号:
    24K18686
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自然言語処理技術を用いた教授学習支援システムの開発
利用自然语言处理技术开发教学支持系统
  • 批准号:
    24K16768
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自然言語処理を利用した1910-30年代の日本文芸批評の研究
利用自然语言处理研究 1910 年代至 1930 年代的日本文学批评
  • 批准号:
    24K15991
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
教師が客観的に授業を自己評価するための自然言語処理による新しい発話分析法の開発
使用自然语言处理开发一种新的语音分析方法,供教师客观地自我评估他们的课程
  • 批准号:
    23K12785
  • 财政年份:
    2023
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了