SBIR Phase I: Statistical Inference for Advanced Entity Resolution
SBIR 第一阶段:高级实体解析的统计推断
基本信息
- 批准号:1143373
- 负责人:
- 金额:$ 15万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2012
- 资助国家:美国
- 起止时间:2012-01-01 至 2012-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This Small Business Innovation Research (SBIR) Phase I project addresses the problem of integrating information about named entities, such as people, companies, and products, from numerous data sources. Integrating information about entities from multiple sources can be difficult because sources may use different formats and terminology to describe the same entity, a problem referred to as "entity resolution". Most existing commercial enterprise systems rely on rule-based matching techniques for entity resolution. This project investigates statistical learning techniques that allow a system to estimate the probability of a match, rather than computing a score based on ad-hoc rules or weights. Because the approach is based on sound statistical principles and uses evidence compiled from large datasets, it can produce more accurate results than existing methods. Moreover, these advantages are amplified when handling data that that has highly variable, missing or noisy attributes, such as data extracted from Web sites. The broader impact/commercial potential of this project lies in enabling enterprises to perform more accurate and reliable data integration. The are many potential target markets that need better technology for integrating information about businesses, products, people, locations, and other entities. This capability is critical for some of the nation's largest companies and institutions, from search engines, to the U.S. Intelligence and law enforcement community, to financial institutions. In particular, large enterprises often have difficulty utilizing data extracted from news, foreign language data sources, and social media, because the extracted data is noisy and not-well structured. The technology developed in this project will help enterprises make use of the growing amount of information on the Web, so that they can take advantage of the network of relationships that link people, companies, and other entities to serve their customers better.
该小型企业创新研究(SBIR)第一阶段项目解决了从大量数据源集成有关命名实体的信息的问题,例如人员、公司和产品。整合来自多个来源的有关实体的信息可能很困难,因为来源可能使用不同的格式和术语来描述同一实体,这一问题称为“实体解析”。大多数现有的商业企业系统依赖于基于规则的匹配技术来进行实体解析。这个项目研究的是统计学习技术,它允许系统估计匹配的概率,而不是基于特别规则或权重计算分数。由于该方法基于可靠的统计原理,并使用了从大数据集中汇编的证据,因此它可以比现有方法产生更准确的结果。此外,当处理具有高度可变、缺失或噪声属性的数据时,这些优势被放大,例如从网站提取的数据。该项目更广泛的影响/商业潜力在于使企业能够进行更准确、更可靠的数据集成。有许多潜在的目标市场需要更好的技术来集成有关企业、产品、人员、地点和其他实体的信息。这一能力对美国一些最大的公司和机构至关重要,从搜索引擎到美国情报和执法部门,再到金融机构。特别是,大型企业往往难以利用从新闻、外语数据源和社交媒体提取的数据,因为提取的数据噪声大,结构不好。该项目开发的技术将帮助企业利用Web上日益增长的信息量,以便它们能够利用将人员、公司和其他实体联系在一起的关系网络,以更好地为客户服务。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Steven Minton其他文献
The Impact of Environmental Stressors on Human Trafficking
环境压力因素对人口贩运的影响
- DOI:
10.1109/icdm.2018.00066 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Sabina Tomkins;G. Farnadi;Brian Amanatullah;L. Getoor;Steven Minton - 通讯作者:
Steven Minton
Automatically configuring constraint satisfaction programs: A case study
- DOI:
10.1007/bf00143877 - 发表时间:
1996-09 - 期刊:
- 影响因子:1.6
- 作者:
Steven Minton - 通讯作者:
Steven Minton
The Journal of artificial intelligence research : July 1996-December 1996
- DOI:
- 发表时间:
1997 - 期刊:
- 影响因子:0
- 作者:
Steven Minton - 通讯作者:
Steven Minton
Plan Optimization by Plan Rewriting
通过计划重写来优化计划
- DOI:
10.4018/978-1-59140-450-7.ch004 - 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
J. Ambite;Craig A. Knoblock;Steven Minton - 通讯作者:
Steven Minton
Information Integration for the Masses
大众信息整合
- DOI:
10.3217/jucs-014-11-1811 - 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
J. Blythe;Dipsy Kapoor;Craig A. Knoblock;Kristina Lerman;Steven Minton - 通讯作者:
Steven Minton
Steven Minton的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Steven Minton', 18)}}的其他基金
SBIR Phase II:Statistical Inference for Advanced Entity Resolution
SBIR 第二阶段:高级实体解析的统计推断
- 批准号:
1330223 - 财政年份:2013
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase II: Unsupervised Extraction of Relational Data from the Web
SBIR 第二阶段:无监督地从网络中提取关系数据
- 批准号:
0548699 - 财政年份:2006
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase I: Unsupervised Extraction of Relational Data from the Web
SBIR 第一阶段:无监督地从网络中提取关系数据
- 批准号:
0441563 - 财政年份:2005
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SGER: Open Source System for Free Electronic Publishing of Scientific Journals
SGER:科学期刊免费电子出版的开源系统
- 批准号:
0423197 - 财政年份:2004
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase II: Semi-Automatically Constructing Wrappers to Access Internet-Based Information Sources
SBIR 第二阶段:半自动构建包装器以访问基于互联网的信息源
- 批准号:
0090978 - 财政年份:2001
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase I: Semi-Automatically Constructing Wrappers to Access Internet-Based Information Sources
SBIR 第一阶段:半自动构建包装器以访问基于互联网的信息源
- 批准号:
9960536 - 财政年份:2000
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
Symposium on Learning Methods for Planning and Scheduling
计划与调度学习方法研讨会
- 批准号:
9022478 - 财政年份:1991
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
相似国自然基金
Baryogenesis, Dark Matter and Nanohertz Gravitational Waves from a Dark
Supercooled Phase Transition
- 批准号:24ZR1429700
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
ATLAS实验探测器Phase 2升级
- 批准号:11961141014
- 批准年份:2019
- 资助金额:3350 万元
- 项目类别:国际(地区)合作与交流项目
地幔含水相Phase E的温度压力稳定区域与晶体结构研究
- 批准号:41802035
- 批准年份:2018
- 资助金额:12.0 万元
- 项目类别:青年科学基金项目
基于数字增强干涉的Phase-OTDR高灵敏度定量测量技术研究
- 批准号:61675216
- 批准年份:2016
- 资助金额:60.0 万元
- 项目类别:面上项目
基于Phase-type分布的多状态系统可靠性模型研究
- 批准号:71501183
- 批准年份:2015
- 资助金额:17.4 万元
- 项目类别:青年科学基金项目
纳米(I-Phase+α-Mg)准共晶的临界半固态形成条件及生长机制
- 批准号:51201142
- 批准年份:2012
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
连续Phase-Type分布数据拟合方法及其应用研究
- 批准号:11101428
- 批准年份:2011
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
D-Phase准晶体的电子行为各向异性的研究
- 批准号:19374069
- 批准年份:1993
- 资助金额:6.4 万元
- 项目类别:面上项目
相似海外基金
SBIR Phase I: Operational Seasonal Forecasting of Environmental Data using Machine Learning and Statistical Methods
SBIR 第一阶段:使用机器学习和统计方法对环境数据进行业务季节性预测
- 批准号:
2042853 - 财政年份:2021
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase I: A Physics Guided Statistical Model for Weather Extremes Under Climate Change
SBIR 第一阶段:气候变化下极端天气的物理引导统计模型
- 批准号:
1621576 - 财政年份:2016
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase I: Correlating Opinions with Outcomes in Business and Industry: Statistical Modelling of Natural Language Data
SBIR 第一阶段:将意见与商业和工业成果相关联:自然语言数据的统计建模
- 批准号:
0839368 - 财政年份:2009
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase II: Incorporation of Knowledge Base into Statistical Machine Translation
SBIR 第二阶段:将知识库纳入统计机器翻译
- 批准号:
0548763 - 财政年份:2006
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase I: Incorporation of Knowledge Base into Statistical Machine Translation
SBIR 第一阶段:将知识库纳入统计机器翻译
- 批准号:
0441891 - 财政年份:2005
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase I: Bio-molecular Sequence Recovery Using Statistical Signal Processing
SBIR 第一阶段:使用统计信号处理恢复生物分子序列
- 批准号:
0320167 - 财政年份:2003
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase II: NUMBERS: Bringing Statistical Machine Translation into the Real World
SBIR 第二阶段:数字:将统计机器翻译带入现实世界
- 批准号:
0239290 - 财政年份:2003
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase I: Statistical Text Categorization with Task-Specific Constraints
SBIR 第一阶段:具有特定任务约束的统计文本分类
- 批准号:
0232828 - 财政年份:2003
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase II: Computational Tool for Plasma Equipment Design Using a Non-Statistical Boltzmann Solver
SBIR 第二阶段:使用非统计玻尔兹曼求解器进行等离子体设备设计的计算工具
- 批准号:
0091572 - 财政年份:2001
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SBIR Phase II: Web-Based Urn Sampler and Statistical Authoring Environment
SBIR 第二阶段:基于 Web 的 Urn 采样器和统计创作环境
- 批准号:
0091412 - 财政年份:2001
- 资助金额:
$ 15万 - 项目类别:
Standard Grant