SBIR Phase I: Unsupervised Extraction of Relational Data from the Web

SBIR 第一阶段:无监督地从网络中提取关系数据

基本信息

  • 批准号:
    0441563
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2005
  • 资助国家:
    美国
  • 起止时间:
    2005-01-01 至 2005-06-30
  • 项目状态:
    已结题

项目摘要

This Small Business Innovation Research (SBIR) Phase I research project will enable software systems to make use of data on the Web. The semantic web is intended to allow data to be shared and used by software applications. Unfortunately, in the present world, data on the Web is generally inaccessible to most applications because it is presented in a format intended to be usable by humans, as opposed to computers. The ultimate goal is to create a relational view of data on the web, so that applications can access Web data based on entities and their relations. This project proposes to achieve this with an unsupervised machine learning approach that extracts data from web sites and converts it into relational form. It will develop and implement an unsupervised algorithm that takes advantage of multiple heterogeneous types patterns found on web sites, including the link structure, formatting conventions, and content regularities. This project will result in a powerful new generation of Web harvesting technology that has clear commercial value. In addition moreover, it will enable the vision of the semantic web to become a reality. Web harvesting is an area of growing commercial interest for a variety of vertical markets, including Sales Intelligence, Market Intelligence, News Aggregation, and Background Search. However, web-harvesting technology is limited today, since the collection of rich, detailed data must be done on a site-by-site basis. The approach described here, if successful, will enable a new generation of intelligent Web harvesting technology that can scale to the entire Web. Ultimately, our approach will enable applications to query the entire Web as if it were a relational database. This has tremendous commercial value, and moreover, will enable many new types of web applications to be developed. In addition to the commercial value, the technical approach is novel and has significant merits on its own. If it is successful, the proposed method should generalize to other complex domains (such as scene understanding and natural language processing) where multiple heterogeneous types of structure must be analyzed to discover underlying meaning
小企业创新研究(SBIR)第一阶段研究项目将使软件系统能够利用网络上的数据。语义网旨在允许软件应用程序共享和使用数据。不幸的是,在当今世界中,Web上的数据通常无法被大多数应用程序访问,因为它是以旨在供人类使用的格式呈现的,而不是计算机。最终目标是在Web上创建数据的关系视图,以便应用程序可以基于实体及其关系访问Web数据。该项目提出了一种无监督的机器学习方法来实现这一目标,该方法从网站中提取数据并将其转换为关系形式。它将开发和实现一种无监督算法,该算法利用网站上发现的多种异构类型模式,包括链接结构,格式约定和内容转换。这个项目将产生一个强大的新一代网络收集技术,具有明显的商业价值。此外,它将使语义网的愿景成为现实。Web收获是一个越来越受各种垂直市场关注的商业领域,包括销售情报,市场情报,新闻聚合和背景搜索。然而,今天的网络收集技术是有限的,因为收集丰富,详细的数据必须在一个网站一个网站的基础上完成。这里描述的方法,如果成功的话,将使新一代的智能网络收集技术,可以扩展到整个网络。最终,我们的方法将使应用程序能够查询整个Web,就好像它是一个关系数据库。这具有巨大的商业价值,而且将使许多新类型的Web应用程序得以开发。除了商业价值之外,该技术方法是新颖的,并且具有其自身的显著优点。如果它是成功的,所提出的方法应该推广到其他复杂的领域(如场景理解和自然语言处理),其中必须分析多种异构类型的结构以发现潜在的含义

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Steven Minton其他文献

The Impact of Environmental Stressors on Human Trafficking
环境压力因素对人口贩运的影响
Automatically configuring constraint satisfaction programs: A case study
  • DOI:
    10.1007/bf00143877
  • 发表时间:
    1996-09
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Steven Minton
  • 通讯作者:
    Steven Minton
The Journal of artificial intelligence research : July 1996-December 1996
  • DOI:
  • 发表时间:
    1997
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Steven Minton
  • 通讯作者:
    Steven Minton
Plan Optimization by Plan Rewriting
通过计划重写来优化计划
  • DOI:
    10.4018/978-1-59140-450-7.ch004
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Ambite;Craig A. Knoblock;Steven Minton
  • 通讯作者:
    Steven Minton
Information Integration for the Masses
大众信息整合
  • DOI:
    10.3217/jucs-014-11-1811
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Blythe;Dipsy Kapoor;Craig A. Knoblock;Kristina Lerman;Steven Minton
  • 通讯作者:
    Steven Minton

Steven Minton的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Steven Minton', 18)}}的其他基金

SBIR Phase II:Statistical Inference for Advanced Entity Resolution
SBIR 第二阶段:高级实体解析的统计推断
  • 批准号:
    1330223
  • 财政年份:
    2013
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase I: Statistical Inference for Advanced Entity Resolution
SBIR 第一阶段:高级实体解析的统计推断
  • 批准号:
    1143373
  • 财政年份:
    2012
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase II: Unsupervised Extraction of Relational Data from the Web
SBIR 第二阶段:无监督地从网络中提取关系数据
  • 批准号:
    0548699
  • 财政年份:
    2006
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SGER: Open Source System for Free Electronic Publishing of Scientific Journals
SGER:科学期刊免费电子出版的开源系统
  • 批准号:
    0423197
  • 财政年份:
    2004
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase II: Semi-Automatically Constructing Wrappers to Access Internet-Based Information Sources
SBIR 第二阶段:半自动构建包装器以访问基于互联网的信息源
  • 批准号:
    0090978
  • 财政年份:
    2001
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase I: Semi-Automatically Constructing Wrappers to Access Internet-Based Information Sources
SBIR 第一阶段:半自动构建包装器以访问基于互联网的信息源
  • 批准号:
    9960536
  • 财政年份:
    2000
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Symposium on Learning Methods for Planning and Scheduling
计划与调度学习方法研讨会
  • 批准号:
    9022478
  • 财政年份:
    1991
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant

相似国自然基金

Baryogenesis, Dark Matter and Nanohertz Gravitational Waves from a Dark Supercooled Phase Transition
  • 批准号:
    24ZR1429700
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
ATLAS实验探测器Phase 2升级
  • 批准号:
    11961141014
  • 批准年份:
    2019
  • 资助金额:
    3350 万元
  • 项目类别:
    国际(地区)合作与交流项目
地幔含水相Phase E的温度压力稳定区域与晶体结构研究
  • 批准号:
    41802035
  • 批准年份:
    2018
  • 资助金额:
    12.0 万元
  • 项目类别:
    青年科学基金项目
基于数字增强干涉的Phase-OTDR高灵敏度定量测量技术研究
  • 批准号:
    61675216
  • 批准年份:
    2016
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于Phase-type分布的多状态系统可靠性模型研究
  • 批准号:
    71501183
  • 批准年份:
    2015
  • 资助金额:
    17.4 万元
  • 项目类别:
    青年科学基金项目
纳米(I-Phase+α-Mg)准共晶的临界半固态形成条件及生长机制
  • 批准号:
    51201142
  • 批准年份:
    2012
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
连续Phase-Type分布数据拟合方法及其应用研究
  • 批准号:
    11101428
  • 批准年份:
    2011
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
D-Phase准晶体的电子行为各向异性的研究
  • 批准号:
    19374069
  • 批准年份:
    1993
  • 资助金额:
    6.4 万元
  • 项目类别:
    面上项目

相似海外基金

UK involvement in LSST: Phase C (Imperial component)
英国参与 LSST:C 阶段(帝国部分)
  • 批准号:
    ST/X001326/1
  • 财政年份:
    2025
  • 资助金额:
    $ 10万
  • 项目类别:
    Research Grant
Phase 2 - Effective and Integrated Chemical Free Robotic Milking
第 2 阶段 - 有效且集成的无化学品机器人挤奶
  • 批准号:
    10093094
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Collaborative R&D
Net Zero Pathfinder - Phase 2 Manchester
净零探路者 - 第二阶段曼彻斯特
  • 批准号:
    10095254
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Demonstrator
Phase Averaged Deferred Correction for Multi-Timescale Systems
多时间尺度系统的相位平均延迟校正
  • 批准号:
    EP/Y032624/1
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Research Grant
Model order reduction for fast phase-field fracture simulations
快速相场断裂模拟的模型降阶
  • 批准号:
    EP/Y002474/1
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Research Grant
IUCRC Phase I University of Wisconsin-Milwaukee: Center for Concrete Advancement Network (CAN), Lead Site
IUCRC 第一阶段威斯康星大学密尔沃基分校:混凝土进步网络中心 (CAN),主要站点
  • 批准号:
    2310861
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
IUCRC Phase III University of Colorado Boulder: Center for Membrane Applications, Science and Technology (MAST)
IUCRC 第三阶段科罗拉多大学博尔德分校:膜应用、科学与技术中心 (MAST)
  • 批准号:
    2310937
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
SBIR Phase II: Innovative Two-Phase Cooling with Micro Closed Loop Pulsating Heat Pipes for High Power Density Electronics
SBIR 第二阶段:用于高功率密度电子产品的创新两相冷却微闭环脉动热管
  • 批准号:
    2321862
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Cooperative Agreement
SBIR Phase I: Industrial-Scale Technology for Drug Development in Mature Human Fat Cells
SBIR 第一阶段:成熟人类脂肪细胞药物开发的工业规模技术
  • 批准号:
    2322443
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
STTR Phase II: Fabrication and Structural Testing of a 3D Concrete Printed Anchor for Floating Offshore Wind
STTR 第二阶段:用于浮动海上风电的 3D 混凝土打印锚的制造和结构测试
  • 批准号:
    2333306
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Cooperative Agreement
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了