Study on Integration of Statistical Information and Linguistic Constraint Information

统计信息与语言约束信息的整合研究

基本信息

  • 批准号:
    12480089
  • 负责人:
  • 金额:
    $ 6.21万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2002
  • 项目状态:
    已结题

项目摘要

Along with the increase of machine readable linguistic data, statistical natural language processing has been actively researched. However, most of the statistical natural language processing aims at surface language processing, and is not appropriate to detailed semaintical language analysis. On the other hand, constraint-base grammar formalisms such as Head-driven Phrase Structure Grammar attempt to describe linguistic phenomena as lexical knowledge and most of the linguistic constraints are presented in the lexicon. While such a grammar formalism specifies complicated linguistic information in a very modular way, they have a drawback that any input that violate linguistic constraints cannot be parsed in any way.This research aimed at compensating drawback of both approaches by integrating both mechanisms : We first implemented a rubust and high-quality word-based dependency analysis of sentences using statistical information. Then the constraint-based grammar formalism receiving the output of statistical dependency information, finds out possible interpretation according to the dependency structure. To achieve a robust language processing, we implemented a constraint relaxing mechanism. We implemented the idea of type coersion and co-composition proposed in Generative Lexicon as well as an user interface to browse the intermediate processing information.As for dependency analysis, we utilized Support Vector Machines so as to cope with a large scale feature space, and devised a deterministic bottom-up parsing algorithm for Japanese and English. We implemented a part of Japanese grammar based on Head-driven Phrase Structure Grammar. Those statistical and constraint-based grammar and parser are runnable in the user-inteface we developed to be used for the grammar developpers and the users of the natural language processing system.
沿着机器可读语言数据的增加,统计自然语言处理得到了积极的研究。然而,大多数统计自然语言处理的目标是表面的语言处理,并不适合详细的语义语言分析。另一方面,基于约束的语法形式主义,如中心语驱动短语结构语法,试图将语言现象描述为词汇知识,大多数语言约束都在词汇中呈现。虽然这样的语法形式主义规定了复杂的语言信息在一个非常模块化的方式,他们有一个缺点,任何违反语言约束的输入不能以任何方式解析。本研究旨在弥补这两种方法的缺点,通过整合两种机制:我们首先实现了一个rubust和高质量的基于单词的依赖分析的句子使用统计信息。然后,基于约束的语法形式化接收统计依赖信息的输出,根据依赖结构找出可能的解释。为了实现一个强大的语言处理,我们实现了一个约束放松机制。我们实现了Generative Lexicon中提出的类型强制和协同组合的思想,并提供了一个用户界面来浏览中间处理信息;在依赖分析方面,我们利用支持向量机来科普大规模的特征空间,并设计了一个确定性的自底向上的日语和英语句法分析算法。我们实现了一部分基于中心语驱动短语结构语法的日语语法。这些基于统计和约束的语法和语法分析器可以在我们开发的用户界面中运行,供语法开发人员和自然语言处理系统的用户使用。

项目成果

期刊论文数量(72)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
大谷朗, 宮田高志, 松本裕治: "HPSGにもとづく日本語文法について-実装に向けての精緻化"自然言語処理. 7(5). 19-49 (2000)
Akira Otani、Takashi Miyata、Yuji Matsumoto:“关于基于 HPSG 的日语语法 - 实现的细化”自然语言处理 7(5)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Tetsuji Nakagawa, Taku Kudoh and Yuji Matsumoto: "Unknown Word Guessing and Part-of-Speech Tagging Using Support Vector Machines"Proceedings of the Sixth Natural Language Processing Pacific Rim Symposium. 325-331 (2001)
Tetsuji Nakakawa、Taku Kudoh 和 Yuji Matsumoto:“使用支持向量机进行未知词猜测和词性标注”第六届自然语言处理环太平洋研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Edson Miyamoto: "Case markers as clause boundary inducers in Japanese"Journal of Psycholinguistic Research. 31・4. 307-346 (2002)
Edson Miyamoto:“日语中的格标记作为子句边界诱导词”《心理语言学研究杂志》31・4(2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
森本芳弘, 松本裕治: "HPSGの単一化の機能拡張と実行過程の追跡システムの実装"言語処理学会第9回年次大会発表論文集. 9. 429-432 (2003)
Yoshihiro Morimoto、Yuji Matsumoto:“HPSG 统一的功能扩展和执行过程跟踪系统的实现”语言处理学会第九届年会论文集 9. 429-432 (2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takashi Miyata, Akita Ohtani, Yuji Matsumoto: "An HPSG Account of the Hierarchical Clause Formation in Japanese : HPSG-Based Japanese Grammar for Practical Parsing"Proceedings the 15th Pacific Asia Conference on Language, Information and Computation. 15.
Takashi Miyata、Akita Ohtani、Yuji Matsumoto:“日语层次从句形成的 HPSG 说明:基于 HPSG 的实用语法分析的日语语法”第 15 届亚太语言、信息和计算会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

MATSUMOTO Yuji其他文献

MATSUMOTO Yuji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('MATSUMOTO Yuji', 18)}}的其他基金

Nanoscale Engineering of Compositional Modulations in Alloys and Composite Thin Film Oxides for Exploration of Their New Properties and Functionalities
合金和复合薄膜氧化物成分调节的纳米工程,探索其新性能和功能
  • 批准号:
    20H02610
  • 财政年份:
    2020
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of a comprehensive educational method of algorithmic design for the expansion of creativity using IT
开发算法设计的综合教育方法,以利用信息技术扩展创造力
  • 批准号:
    19K12680
  • 财政年份:
    2019
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Nano-strained interfaces in nanocomposite ferroelectric films and the origin of their free polarization rotation
纳米复合铁电薄膜中的纳米应变界面及其自由极化旋转的起源
  • 批准号:
    15H02021
  • 财政年份:
    2015
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Development of site-specific nuclease to control mutated mtDNA in MELAS iPS cell-derived neuronal cells
开发位点特异性核酸酶来控制 MELAS iPS 细胞衍生的神经元细胞中的突变 mtDNA
  • 批准号:
    26860831
  • 财政年份:
    2014
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Development of the hybrid process of sublimation and solution re-crystallization with ionic liquid as a new purification of organic semiconductor materials
开发升华和离子液体溶液重结晶混合工艺作为有机半导体材料的新型纯化方法
  • 批准号:
    25600074
  • 财政年份:
    2013
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Nano-level observation of shape, size, and, distribution of lignin in cell wall
纳米级观察细胞壁木质素的形状、尺寸和分布
  • 批准号:
    23658140
  • 财政年份:
    2011
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
The value of space affection: Realization of "inspired workplace" for creative work
空间情感的价值:实现创意工作的“灵感职场”
  • 批准号:
    23760574
  • 财政年份:
    2011
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Joint Natural Language Processing with Global Information
联合自然语言处理与全球信息
  • 批准号:
    23240020
  • 财政年份:
    2011
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Metallic glass flux-vapor growth of SiC single crystal films
金属玻璃熔剂-SiC单晶薄膜的气相生长
  • 批准号:
    23656028
  • 财政年份:
    2011
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Study of development of the tumor imaging method using fumarate metabolism
富马酸代谢肿瘤成像方法的开发研究
  • 批准号:
    23659602
  • 财政年份:
    2011
  • 资助金额:
    $ 6.21万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了