種々の統計情報を統合した統計的自然言語解析に関する研究

整合各种统计信息的统计自然语言分析研究

基本信息

  • 批准号:
    09878066
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Exploratory Research
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では,構文解析の曖昧性解消を行うために,構文的な統計情報と語彙的な統計情報を統合する手法を提案する.我々が提案する統合的確率言語モデルは,構文的優先度などの構文的な統計情報を反映する構文モデルと,単語の出現頻度や単語の共起関係などの語彙的な統計情報を反映する語彙モデルの2つの下位モデルから成る.この統合的確率言語モデルは,構文的な統計情報と語彙的な統計情報を同時に学習する去の多くのモデルと異なり,両者を個別に学習する点に特徴がある.構文的な統計情報と語彙的な統計情報を独立に取り扱うことにより,それぞれの統計情報を異なる言語資源から独立に学習することができるだけでなく,それぞれの統計情報が曖昧性解消においてどのような効果を果たすのかを容易に分析することができる.この統合的確率言語モデルを評価するために,日本語文の文節の係り受け解析を行った.構文モデルを用いたときの文節の正解率は73.38$%となり,ベースラインに比べて11.70$%向上した.また,構文モデルと語彙モデルを組み合わせることにより,文節の正解率はさらに10.96$%向上し84.34$%となった.この結果,本研究で提案する枠組において,語彙的な統計情報は構文的な統計情報と同程度に曖昧性解消に貢献することを確認した.なお,本研究の成果は下記国際会議で報告されている。Kiyoaki Shirai,Kentaro Inui,Hozumi Tanaka,Takenobu Tokunaga.An Empirical Study on Statistical Disambiguation of Japanese Dependency Structures Using a Lexically Sensitive Language Model.Proceedings of Natural Language Processing Pacific Rim Symposium,1997.
This study proposes a method for resolving ambiguity in text analysis and integrating statistical information in text analysis. The statistical information reflects the priority of the sentence, the frequency of occurrence of the single sentence, the co-occurrence relationship of the single sentence, and the statistical information of the words. The integration accuracy rate of speech, structure of statistical information, statistical information of words, simultaneous learning, multiple learning, individual learning, point characteristics, etc. The statistical information of the structure of the text and the statistical information of the words are taken independently. The statistical information of the words is taken independently. The statistical information of the words is taken independently. The statistical information of the words is taken independently. The statistical information of the words is taken independently. This integration rate speech evaluation, Japanese language section of the text system analysis. The correct solution rate of the structure is 73.38$%, which is higher than that of 11.70$%. The correct solution rate of the text section is 10.96$% upward and 84.34$% upward. As a result, this study proposes that the statistical information of words contributes to the resolution of ambiguity to the same extent as the statistical information of text construction. The results of this research are reported in the following international conference. Kiyoaki Shirai,Kentaro Inui,Hozumi Tanaka,Takenobu Tokunaga.An Empirical Study on Statistical Disambiguation of Japanese Dependency Structures Using a Lexically Sensitive Language Model.Proceedings of Natural Language Processing Pacific Rim Symposium,1997.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田中 穂積其他文献

動的言語観-二十世紀言語哲学の一復帰と新展開
动态语言观:20世纪语言哲学的回归与新发展
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kitagawa T.;Nakanishi T.;Kiyoki Y.;城山英明;田中 穂積;Sasaoka T;高山佳奈子;山田 友幸
  • 通讯作者:
    山田 友幸
音声対話理解技術とソフトウエアロボットの行動(招待講演)
语音对话理解技术与软件机器人行为(特邀讲座)
海外へのアップロードと日本の刑法の適用
海外上传与日本刑法的适用
E.H.Shortliffe 著, "Computer-Based Medical Consultations : MYCIN", American Elsevier, A4判, 264ぺージ, 10,080, 1976
E.H.Shortliffe,《基于计算机的医疗咨询:MYCIN》,美国爱思唯尔,A4尺寸,264页,10,080日元,1976年
  • DOI:
  • 发表时间:
    1978
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田中 穂積
  • 通讯作者:
    田中 穂積
言語理解と行動制御-音声認識・言語理解・コンピュータグラフィックス技術の統合
语言理解和行为控制——语音识别、语言理解和计算机图形技术的集成

田中 穂積的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田中 穂積', 18)}}的其他基金

言語理解と行動制御
语言理解和行为控制
  • 批准号:
    13NP0301
  • 财政年份:
    2001
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Creative Scientific Research
言語理解と行動制御に関する研究
语言理解与行为控制研究
  • 批准号:
    12NP9201
  • 财政年份:
    2000
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Creative Basic Research
音声対話における言語の解析と生成に関する研究
口语对话中的语言分析与生成研究
  • 批准号:
    05241102
  • 财政年份:
    1993
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
人間と機械における情報の表現と意味に関する研究
人类和机器的信息表示和意义研究
  • 批准号:
    02215103
  • 财政年份:
    1990
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
人間と機械における情報の表現と意味に関する研究
人类和机器的信息表示和意义研究
  • 批准号:
    63633006
  • 财政年份:
    1988
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
人間と機械における情報の表現と意味に関する研究
人类和机器的信息表示和意义研究
  • 批准号:
    01633005
  • 财政年份:
    1988
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
生体適合性ポリマーの合成とその生体適合性に関する研究
生物相容性聚合物的合成及其生物相容性研究
  • 批准号:
    X00210----475696
  • 财政年份:
    1979
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
古代・中世のバルカンにおける民族交流の歴史的研究
古代和中世纪巴尔干地区民族交流的历史研究
  • 批准号:
    X00090----351083
  • 财政年份:
    1978
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了