日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装

日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现

基本信息

  • 批准号:
    02F02348
  • 负责人:
  • 金额:
    $ 0.26万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2004
  • 项目状态:
    已结题

项目摘要

「研究目的」日本語では「誰が何を」などの情報が往々にして表現されない。しかし、この情報は自動要約、質疑応答などの様々な言語処理アプリケーションの高度化に必要になる。特に、機械翻訳(日本語→英語)システム開発においては、それらの省略された情報(ゼロ代名詞)が英語で必須であるため、その先行詞を同定する事は一つの大きな課題となっている。その解決策として、文法や文脈を考慮したアルゴリズムを考案したが、その実装と有用性評価が研究目的。「研究実績」新聞90記事を使用し、ガ格、ヲ格、ニ格のゼロ代名詞の先行詞を自動同定する実験の結果と改良点□実装結果:アルゴリズムの内容が全てプログラム化されていないため、ここでは精度よりも、実験から得れた知見について述べる。1.26.6%(24/90)記事は、全てのゼロ代名詞の先行詞の同定が正しく行われていることから、提唱しているアルゴリズムは省略の基本は掴んでおり、その有用性はあるといえる。2.不正解の原因は、1の結果からすると、著者による書体の違いからくる文体(文型)と省略度合いにも起因しているといえる。つまり、省略を誘発する要因は、統語、意味、文脈、分野の専門知識、世界知識に大きく分かれ、右の要因ほど機械処理には困難になる。人にとっても、理解により多くの推論が必要になり、文が曖昧になる。しかし、著者により統語的な省略だけにとどめる人もいれば、それ以外の要因で推論できるものも省略する人もおり、その度合いに大きな個人差がある。1での結果に、これが顕著に現れていると考えられる。□改良点と今後の課題3.2への対策:エラーや個人的書体とゼロ代名詞使用のヴァリエーションへの対策4.今回の分析で、異なる主語を誘発する動詞があることが判明。これにより、この部分にかんしては、先行詞の同定に世界知識などに頼らなくても機械的に処理することができるようになる。該当する動詞のリスト作成が必要。5.省略の有無(必須情報)の明確な定義付け動詞の選択制限だけではなく、共起する名詞句の意味制約も関連し、また、先行詞が不特定だったり一般である時には、先行詞を同定する必要が感じられない。
"Research objective" Japanese for "who and what" and information for the performance of the This information is necessary for automatic offer, query and response, and for speech processing to be highly developed. Special, mechanical translation (Japanese → English), the development of the word, the omission of the word (pronoun), the English word must be, the antecedent is the same, the word is a big problem. The purpose of this study is to evaluate the solution, grammar and context of the problem. "Research achievements" News 90 Notes: The antecedents of pronouns in the use, category, category and category are automatically identified. The results of the implementation and improvement points are as follows: The contents of the pronouns in the use, category, category and category are completely identified. The accuracy of the content is determined. The results of the implementation are as follows: 1.26.6%(24/90) of the entries were negative, positive, negative, negative, 2. The cause of the error is: 1. The result is: 1. The author is: 2. The style is: 3. The omission is: 3. The cause is: 4. The author is: 3. The author is: 4. The author is: 5. The author is: 4. The author is: 5. The author is: 5. The main reason for omission, language, meaning, context, division of knowledge, knowledge of the world, and the main reason for mechanical processing are difficult. People, understanding, inference, necessity, ambiguity In addition to the important reasons for the omission of the word, the number of people in the middle of the word 1. The result of the test is that the test is not successful. 3.2 Countermeasures for future problems: the use of pronouns in the body of a book, and the use of pronouns in the body of a book. This is the first time that we've had a chance to learn about the world, and the first time we've had a chance to learn about it. It is necessary to make this verb. 5. Omit the explicit definition of the existence or absence (necessary information); select the verb; restrict the verb; restrict the verb's meaning; restrict the verb's meaning.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

松本 裕治其他文献

自由エネルギー距離によるハブの抑制
自由能距离的轮毂抑制
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林 雄太;新保 仁;松本 裕治
  • 通讯作者:
    松本 裕治
ベクトルのスパース化を用いたk近傍法におけるハブの軽減
使用向量稀疏化的 k 最近邻方法中的集线器缓解
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    重藤 優太郎;新保 仁;松本 裕治
  • 通讯作者:
    松本 裕治
確信度に基づく退院時サマリの分析
基于置信水平的出院总结分析
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    安道 健一郎;奥村 貴史;小町 守;松本 裕治
  • 通讯作者:
    松本 裕治
Novel trends in research data utilisation based on open science.
基于开放科学的研究数据利用的新趋势。
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大村 舞;松本 裕治;奥村貴史;Yasunori Yamamoto and Atsuko Yamaguchi;Norio Kobayashi
  • 通讯作者:
    Norio Kobayashi
決定木による「怒り」識別のための音響的特徴の検討と評価
使用决策树研究和评估“愤怒”识别的声学特征

松本 裕治的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('松本 裕治', 18)}}的其他基金

超分子ヒドロゲルの階層的ダイナミクスに基づくゾル-ゲル転移の制御
基于超分子水凝胶分级动力学的溶胶-凝胶转变控制
  • 批准号:
    15J04575
  • 财政年份:
    2015
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
意見情報抽出のための深い文解析に関する研究
深度句子分析观点信息提取研究
  • 批准号:
    08F08367
  • 财政年份:
    2008
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
  • 批准号:
    02F00348
  • 财政年份:
    2002
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
利用者からの要求を考慮したテキストデータからの知識抽出
考虑用户请求从文本数据中提取知识
  • 批准号:
    13131207
  • 财政年份:
    2001
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
  • 批准号:
    08204207
  • 财政年份:
    1996
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
  • 批准号:
    07204204
  • 财政年份:
    1995
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
  • 批准号:
    06207205
  • 财政年份:
    1994
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
  • 批准号:
    04219205
  • 财政年份:
    1992
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
  • 批准号:
    03235205
  • 财政年份:
    1991
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
  • 批准号:
    02249203
  • 财政年份:
    1990
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
  • 批准号:
    02F00348
  • 财政年份:
    2002
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
日本語の代名詞およびゼロ代名詞の"被束縛変項"解釈と"怠慢の代名詞"解釈
日语代词和零代词解释为“束缚变量”和“忽略代词”
  • 批准号:
    03851086
  • 财政年份:
    1991
  • 资助金额:
    $ 0.26万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了