語彙化文法理論に基づく言語学的に妥当な文法の自動獲得
基于词汇化语法理论的语言有效语法自动获取
基本信息
- 批准号:15700120
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究課題で開発を行ってきた英語構文解析器Enjuの改良、詳細な分析、及び成果発表を行った。特に、曖昧性解消確率モデルの改良・分析を行い、その成果を国際学会で発表した。曖昧性解消には、カンマの有無、句の長さ、品詞の情報が有効に働くこと、確率モデルの学習データは比較的少量でも高精度が達成できること、長い文でも解析精度はあまり変化しないことなどを実験的に示した。これらの成果はさらなる精度向上に向けての指針となると考えられる。また、Enjuの文法および確率モデルが構文解析だけでなく文生成にも適用でき、高精度を達成することを示した。さらに、Enjuの応用についての研究も引き続き行った。生物学論文からの情報抽出に対して、昨年度はEnjuの出力(predicate argument structure)の上のパターン規則を自動獲得することで高精度が達成できることを示したが、これに加えて、機械学習アルゴリズムSVMを組み合わせることでさらに精度を向上させる研究を行った。Predicate argument structureのパターンを機械学習の素性とすることにより、Enjuの出力を機械学習の入力として利用し、これにより、機械学習のみやパターン規則のみを用いるよりも高精度が達成できることを示した。また、生物学論文の大規模データベースMEDLINEの全アブストラクト約1,500万件をEnjuで解析し、その解析結果を利用して文献検索を行うシステムを開発した。これほど大規模なテキストを構文解析する実験は初の試みである。さらに、この文献検索システムは既存のキーワード検索に比べてはるかに高い精度で検索結果が得られることを示し、構文解析の有用性を実用アプリケーションにおいて示した。
The project of this study begins with the improvement of the English text parser, the improvement of the Enju parser, and the analysis of the results. The rate of resolution of ignorance is very high, and the results of the improvement analysis and the results of the International Society of International Studies are in the table. In this paper, the results show that the accuracy is very high, and the accuracy is very high. It is necessary to improve the accuracy of the system. The results show that the precision is up and the precision is up. The grammar, Enju, grammar, accuracy, accuracy and accuracy. In this case, Enju will use the research tool to introduce the line. The information of biology is very important. Last year's Enju effort (predicate argument structure) showed that the performance of the rules automatically improved the accuracy of the test. The accuracy of the test was improved. The accuracy of the SVM was improved. Predicate argument structure is used in the field of mechanical engineering, and Enju is used to make full use of the mechanical properties of the machine. The rules are used to verify the accuracy of the system. There are about 15 million pieces of Enju analysis and analysis results on the basis of large-scale MEDLINE analysis and biological literature. This is the first time you need to analyze the text of the large-scale model. In this paper, the literature is used to compare the results of the existing information systems with high precision data, and the usefulness of the literature is analyzed in this paper.
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Probabilistic Disambiguation Models for Wide-Coverage HPSG Parsing
- DOI:10.3115/1219840.1219851
- 发表时间:2005-06
- 期刊:
- 影响因子:0
- 作者:Yusuke Miyao;Junichi Tsujii
- 通讯作者:Yusuke Miyao;Junichi Tsujii
Yusuke Miyao, Jun'ichi Tsujii: "A model of syntactic disambiguation based on lexicalized grammars"Proceedings of the 7^<th> Conference on Natural Language Learning. 1-8 (2003)
Yusuke Miyao、Junichi Tsujii:“基于词汇化语法的句法消歧模型”第七届自然语言学习会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Biomedical Information Extraction with Predicate-Argument Structure Patterns
使用谓词-论元结构模式提取生物医学信息
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Yakushiji;A.
- 通讯作者:A.
Efficacy of Beam Thresholding, Unification Filtering and Hybrid Parsing in Probabilistic HPSG Parsing
概率 HPSG 解析中波束阈值、统一过滤和混合解析的功效
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Yusuke Miyao;Takuya Matsuzaki;Tadayoshi Hara;Hiroko Nakanishi;Takashi Ninomiya
- 通讯作者:Takashi Ninomiya
Finding Anchor Verbs for Biomedical IE Using Predicate-Argument Structures
使用谓词论证结构查找生物医学 IE 的锚动词
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:Yakushiji;A.;(Tsujii;J.)
- 通讯作者:J.)
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
宮尾 祐介其他文献
議論の構造化と妥当性評価のためのBayesian Argumentation-Scheme Networksの提案とアノテーションデータ作成
贝叶斯论证方案网络的提议以及用于构建论证和评估有效性的注释数据的创建
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
近藤 崇宏;鷲尾 光樹;林 克彦;宮尾 祐介 - 通讯作者:
宮尾 祐介
Introduction to Professional and Vocational University in Japan: a case of PIIF
日本专业职业大学简介:以PIIF为例
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
稲葉 通将;東中 竜一郎;千葉 祐弥;駒谷 和範;宮尾 祐介;長井 隆行;Kaoru Kawanaka - 通讯作者:
Kaoru Kawanaka
インドネシアのジャワ島、スマトラ島における文化財調査ノート
印度尼西亚爪哇岛和苏门答腊岛文化财产调查记录
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
濵園 侑美;Marrese-Taylor Edison;石垣 達也;宮尾 祐介;小林 一郎;高村 大也;中川原郁子(日本砂漠学会編);河野一隆 - 通讯作者:
河野一隆
明治期における胎児の成長図―医療・美術・民間信仰の狭間で
明治时期胎儿生长图:医学、艺术与民间信仰之间
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
近藤 崇宏;鷲尾 光樹;林 克彦;宮尾 祐介;安井眞奈美 - 通讯作者:
安井眞奈美
宮尾 祐介的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('宮尾 祐介', 18)}}的其他基金
多言語コーパスへのHPSGの適用による言語に依存しない意味表現の自動構築
通过将 HPSG 应用于多语言语料库自动构建与语言无关的语义表示
- 批准号:
00J09650 - 财政年份:2000
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows