ITR: Automated Structuring of Text Information

ITR:文本信息的自动构建

基本信息

  • 批准号:
    0081962
  • 负责人:
  • 金额:
    $ 49.98万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2000
  • 资助国家:
    美国
  • 起止时间:
    2000-09-01 至 2004-08-31
  • 项目状态:
    已结题

项目摘要

At present, access to the information in large-scale text collections is largely limited to keyword-based searches which retrieve entire documents or passages. While such tools are often satisfactory in retrieving information on general topics, they provide little support for accessing information involving specific relationships, events, or facts.Information extraction technology offers the possibility of creating structured, tabular representations of selected relations from large text collections --- representations which can support more detailed document querying. Until now, however, developing extraction systems for a broad range of relations has been too expensive and time-consuming to consider its use in this way. Recent developments in extraction system customization offer the promise of substantially easing this task, and so making this approach to document indexing feasible.This research project will: 1) use corpus-based techniques to automatically identify the most common relationships within a sublanguage (the set of texts concerning a particular subject matter), and the different ways in which these relations are expressed in the text; 2)construct systems to extract information about these relationships from new text, building tabular summaries; and 3) provide a user interface for querying these relationships and accessing the underlying documents. Taken together, these tools should offer significant new capabilities for accessing the information in large text collections.
目前,对大规模文本集合中信息的访问很大程度上局限于基于关键字的搜索,即检索整个文档或段落。虽然这些工具在检索关于一般主题的信息方面通常令人满意,但它们对访问涉及特定关系、事件或事实的信息提供的支持很少。信息提取技术提供了从大型文本集合中创建选定关系的结构化、表格表示的可能性——这种表示可以支持更详细的文档查询。然而,到目前为止,为广泛的关系开发提取系统过于昂贵和耗时,无法考虑以这种方式使用它。提取系统定制方面的最新发展有望大大简化这一任务,从而使这种文档索引方法变得可行。该研究项目将:1)使用基于语料库的技术自动识别子语言(关于特定主题的文本集)中最常见的关系,以及这些关系在文本中表达的不同方式;2)构建系统,从新文本中提取有关这些关系的信息,构建表格摘要;3)提供查询这些关系和访问底层文档的用户界面。总之,这些工具应该为访问大型文本集合中的信息提供重要的新功能。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ralph Grishman其他文献

Distributed Representation Learning for Knowledge Bases with Entity Descriptions
具有实体描述的知识库的分布式表示学习
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    5.1
  • 作者:
    Fan Miao;Zhou Qiang;Thomas Fang Zheng;Ralph Grishman
  • 通讯作者:
    Ralph Grishman
Viterbi Algorithm
  • DOI:
    10.1007/978-0-387-30164-8_878
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ralph Grishman
  • 通讯作者:
    Ralph Grishman
COMLEX Syntax – A Large Syntactic Dictionary for Natural Language Processing
  • DOI:
    10.1023/a:1001142417369
  • 发表时间:
    1997-11-01
  • 期刊:
  • 影响因子:
    1.800
  • 作者:
    Catherine MacLeod;Ralph Grishman;Adam Meyers
  • 通讯作者:
    Adam Meyers

Ralph Grishman的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ralph Grishman', 18)}}的其他基金

A Dictionary of Nominal Complements
名词补语词典
  • 批准号:
    9633286
  • 财政年份:
    1996
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
Collaborative Research on Knowledge Aquisition for Japanese-English Machine Translation
日英机器翻译知识获取协同研究
  • 批准号:
    9303013
  • 财政年份:
    1993
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
From Text Corpora to Text Databases: Research in Text Processing and Retrieval
从文本语料库到文本数据库:文本处理与检索研究
  • 批准号:
    9302615
  • 财政年份:
    1993
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
A Sublanguage Approach to Japanese-English Machine Translation
日英机器翻译的子语言方法
  • 批准号:
    8902304
  • 财政年份:
    1989
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
Industry-University Co-operative Research Program: Acquisition and Use of Semantic Information for Natural Language Processing
产学合作研究项目:自然语言处理语义信息的获取和利用
  • 批准号:
    8501843
  • 财政年份:
    1985
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
Conference on Sublanguage Description and Processing (Computer Research) - New York University, New York, Ny, January, 1984
子语言描述和处理会议(计算机研究) - 纽约大学,纽约州纽约市,1984 年 1 月
  • 批准号:
    8301197
  • 财政年份:
    1983
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Industry/University Cooperative Research Activity: Robust Natural Language Parsing Using Graded Acceptability (Computer Research)
产学合作研究活动:使用分级可接受性的鲁棒自然语言解析(计算机研究)
  • 批准号:
    8202373
  • 财政年份:
    1982
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
Natural Language Interfaces Using Limited Semantic Information
使用有限语义信息的自然语言界面
  • 批准号:
    8002453
  • 财政年份:
    1980
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Continuing Grant
Research Into Natural Language Interfaces For Data Base Retrieval
数据库检索自然语言接口的研究
  • 批准号:
    7803118
  • 财政年份:
    1978
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant

相似海外基金

Identification and impact of polymers on stem cell products in an automated biomanufacturing platform
自动化生物制造平台中聚合物对干细胞产品的识别和影响
  • 批准号:
    10089013
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Collaborative R&D
ARC Training Centre for Automated Vehicles in Rural and Remote Regions
ARC农村和偏远地区自动驾驶汽车培训中心
  • 批准号:
    IC230100001
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Industrial Transformation Training Centres
Scalable and Automated Tuning of Spin-based Quantum Computer Architectures
基于自旋的量子计算机架构的可扩展和自动调整
  • 批准号:
    2887634
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Studentship
VIPAuto: Robust and Adaptive Visual Perception for Automated Vehicles in Complex Dynamic Scenes
VIPAuto:复杂动态场景中自动驾驶车辆的鲁棒自适应视觉感知
  • 批准号:
    EP/Y015878/1
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Fellowship
Screen4SpLDs - Development of an Automated Pre-Screening Tool for Specific Learning Disabilities in Children.
Screen4SpLDs - 开发针对儿童特定学习障碍的自动预筛查工具。
  • 批准号:
    EP/Y002121/1
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Research Grant
CRII: SaTC: Automated Knowledge Representation for IoT Cybersecurity Regulations
CRII:SaTC:物联网网络安全法规的自动化知识表示
  • 批准号:
    2348147
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Automated Formal Verification of Quantum Protocols for the Quantum Era
量子时代量子协议的自动形式验证
  • 批准号:
    24K20757
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
RII Track-4:NSF: Automated Design and Innovation of Chemical Production Processes with Intelligent Computing
RII Track-4:NSF:利用智能计算进行化学品生产过程的自动化设计和创新
  • 批准号:
    2327303
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
Automated Software Testing Platform
自动化软件测试平台
  • 批准号:
    10092457
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Collaborative R&D
A Holistic Approach to Improve Learning and Motivation in Introductory Programming with Automated Grading, Web-based Team Support, and Game Development
通过自动评分、基于网络的团队支持和游戏开发提高入门编程学习和动机的整体方法
  • 批准号:
    2345097
  • 财政年份:
    2024
  • 资助金额:
    $ 49.98万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了