Text Data Mining Using Information Extraction
使用信息提取的文本数据挖掘
基本信息
- 批准号:0117308
- 负责人:
- 金额:$ 24万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2001
- 资助国家:美国
- 起止时间:2001-10-01 至 2005-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The goal of this research project is to develop new algorithms and systems for effectively discovering knowledge in unstructured textual data. The approach first uses trained information extraction systems to obtain structured data from unstructured natural-language documents or web pages, and then applies rule induction methods to discover interesting patterns in this extracted data. Since data automatically extracted from text is noisy, heterogeneous, and non-standardized, the project studies two approaches to effectively mining extracted data. First, methods are developed for inducing rules that only partially match extracted text. Second, methods are developed that automatically cluster noisy variations of strings into standardized data items prior to mining. Algorithms are also developed for using discovered knowledge to further improve the accuracy of information extraction. Developed methods are being evaluated on large text corpora in business, medicine, science, and technology. The research will contribute to the development of technology capable of automatically discovering significant scientific, commercial, and industrial knowledge from the ever-growing supply of textual electronic information.
该研究项目的目标是开发新的算法和系统,以有效地发现非结构化文本数据中的知识。该方法首先使用经过训练的信息提取系统从非结构化的自然语言文档或网页中获取结构化数据,然后应用规则归纳方法在提取的数据中发现有趣的模式。由于从文本中自动提取的数据是嘈杂的,异构的,非标准化的,该项目研究了两种方法来有效地挖掘提取的数据。首先,方法开发的诱导规则,只有部分匹配提取的文本。其次,开发的方法,自动聚类嘈杂的变化字符串到标准化的数据项挖掘之前。算法也被开发用于使用发现的知识,以进一步提高信息提取的准确性。开发的方法正在商业,医学,科学和技术的大型文本语料库上进行评估。这项研究将有助于开发能够从不断增长的文本电子信息中自动发现重要的科学,商业和工业知识的技术。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Raymond Mooney其他文献
Dialogue with Robots: Proposals for Broadening Participation and Research in the SLIVAR Community
与机器人对话:扩大 SLIVAR 社区参与和研究的提案
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Casey Kennington;Malihe Alikhani;Heather Pon;Katherine Atwell;Yonatan Bisk;Daniel Fried;Felix Gervits;Zhao Han;Mert Inan;Michael Johnston;Raj Korpan;Diane Litman;M. Marge;Cynthia Matuszek;Ross Mead;Shiwali Mohan;Raymond Mooney;Natalie Parde;Jivko Sinapov;Angela Stewart;Matthew Stone;Stefanie Tellex;Tom Williams - 通讯作者:
Tom Williams
Sparse Meets Dense: A Hybrid Approach to Enhance Scientific Document Retrieval
稀疏与密集:增强科学文档检索的混合方法
- DOI:
10.48550/arxiv.2401.04055 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Priyanka Mandikal;Raymond Mooney - 通讯作者:
Raymond Mooney
Raymond Mooney的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Raymond Mooney', 18)}}的其他基金
NRI: FND: Improving Robot Learning from Feedback and Demonstration using Natural Language
NRI:FND:使用自然语言通过反馈和演示改进机器人学习
- 批准号:
1925082 - 财政年份:2019
- 资助金额:
$ 24万 - 项目类别:
Standard Grant
NRI: Robots that Learn to Communicate through Natural Human Dialog
NRI:通过自然人类对话学习交流的机器人
- 批准号:
1637736 - 财政年份:2016
- 资助金额:
$ 24万 - 项目类别:
Standard Grant
EAGER: Robots that Learn to Communicate with Humans Tthrough Natural Dialog
EAGER:通过自然对话学习与人类交流的机器人
- 批准号:
1548567 - 财政年份:2015
- 资助金额:
$ 24万 - 项目类别:
Standard Grant
RI: Small: Perceptually Grounded Learning of Instructional Language
RI:小:教学语言的感知基础学习
- 批准号:
1016312 - 财政年份:2010
- 资助金额:
$ 24万 - 项目类别:
Continuing Grant
RI: Learning Language Semantics from Perceptual Context
RI:从感知上下文中学习语言语义
- 批准号:
0712097 - 财政年份:2007
- 资助金额:
$ 24万 - 项目类别:
Continuing Grant
ITR: Feedback from Multi-Source Data Mining to Experimentation for Gene Network Discovery
ITR:从多源数据挖掘到基因网络发现实验的反馈
- 批准号:
0325116 - 财政年份:2003
- 资助金额:
$ 24万 - 项目类别:
Continuing Grant
Symbolic Learning for Natural Language Processing: Integrating Information Extraction and Querying
自然语言处理的符号学习:集成信息提取和查询
- 批准号:
9704943 - 财政年份:1997
- 资助金额:
$ 24万 - 项目类别:
Continuing Grant
Learning Search-Control Heuristics for Logic Programs: Applications to Speedup Learning and Language Acquisition
逻辑程序的学习搜索控制启发式:加速学习和语言习得的应用
- 批准号:
9310819 - 财政年份:1994
- 资助金额:
$ 24万 - 项目类别:
Continuing Grant
Refining Concepts And Domain Theories By Combining Explanation-Based And Empirical Learning
通过结合基于解释的学习和实证学习来完善概念和领域理论
- 批准号:
9102926 - 财政年份:1991
- 资助金额:
$ 24万 - 项目类别:
Continuing Grant
相似国自然基金
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国青年学者研究基金项目
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
- 批准号:
- 批准年份:2020
- 资助金额:40 万元
- 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
- 批准号:61373035
- 批准年份:2013
- 资助金额:77.0 万元
- 项目类别:面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
- 批准号:31070748
- 批准年份:2010
- 资助金额:34.0 万元
- 项目类别:面上项目
高维数据的函数型数据(functional data)分析方法
- 批准号:11001084
- 批准年份:2010
- 资助金额:16.0 万元
- 项目类别:青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
- 批准号:31060015
- 批准年份:2010
- 资助金额:25.0 万元
- 项目类别:地区科学基金项目
Computational Methods for Analyzing Toponome Data
- 批准号:60601030
- 批准年份:2006
- 资助金额:17.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Tools and methods for mining text data for electricity markets
用于挖掘电力市场文本数据的工具和方法
- 批准号:
564082-2021 - 财政年份:2021
- 资助金额:
$ 24万 - 项目类别:
University Undergraduate Student Research Awards
Research Challenges in Privacy-Aware Mobility Data Analysis and in Text Mining with Enriched Data
隐私意识移动数据分析和丰富数据文本挖掘的研究挑战
- 批准号:
RGPIN-2016-03913 - 财政年份:2021
- 资助金额:
$ 24万 - 项目类别:
Discovery Grants Program - Individual
Research Challenges in Privacy-Aware Mobility Data Analysis and in Text Mining with Enriched Data
隐私意识移动数据分析和丰富数据文本挖掘的研究挑战
- 批准号:
RGPIN-2016-03913 - 财政年份:2020
- 资助金额:
$ 24万 - 项目类别:
Discovery Grants Program - Individual
Discovering the nineteenth-century soundscape through text mining: A big data approach
通过文本挖掘发现十九世纪的音景:一种大数据方法
- 批准号:
2203778 - 财政年份:2019
- 资助金额:
$ 24万 - 项目类别:
Studentship
Research Challenges in Privacy-Aware Mobility Data Analysis and in Text Mining with Enriched Data
隐私意识移动数据分析和丰富数据文本挖掘的研究挑战
- 批准号:
RGPIN-2016-03913 - 财政年份:2019
- 资助金额:
$ 24万 - 项目类别:
Discovery Grants Program - Individual
Efficient Text Big Data Mining Technology via Structure Extraction
基于结构提取的高效文本大数据挖掘技术
- 批准号:
19H01133 - 财政年份:2019
- 资助金额:
$ 24万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Research Challenges in Privacy-Aware Mobility Data Analysis and in Text Mining with Enriched Data
隐私意识移动数据分析和丰富数据文本挖掘的研究挑战
- 批准号:
RGPIN-2016-03913 - 财政年份:2018
- 资助金额:
$ 24万 - 项目类别:
Discovery Grants Program - Individual
Research Challenges in Privacy-Aware Mobility Data Analysis and in Text Mining with Enriched Data
隐私意识移动数据分析和丰富数据文本挖掘的研究挑战
- 批准号:
RGPIN-2016-03913 - 财政年份:2017
- 资助金额:
$ 24万 - 项目类别:
Discovery Grants Program - Individual
Research Challenges in Privacy-Aware Mobility Data Analysis and in Text Mining with Enriched Data
隐私意识移动数据分析和丰富数据文本挖掘的研究挑战
- 批准号:
RGPIN-2016-03913 - 财政年份:2016
- 资助金额:
$ 24万 - 项目类别:
Discovery Grants Program - Individual
Data mining and knowledge discovery from unstructured text using cooperative and distributed algorithms
使用协作和分布式算法从非结构化文本中进行数据挖掘和知识发现
- 批准号:
1005-2010 - 财政年份:2014
- 资助金额:
$ 24万 - 项目类别:
Discovery Grants Program - Individual