III: Small: Active Learning of Language Models for Information Extraction
三:小:用于信息提取的语言模型的主动学习
基本信息
- 批准号:1016754
- 负责人:
- 金额:$ 18.37万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-08-15 至 2013-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project studies methods for extracting accurate knowledge bases from the Web. Fully-automated Web information extraction techniques are massively scalable, but have accuracy and coverage limitations. This proposal investigates how to improve automated extraction techniques by introducing carefully-selected human guidance. The proposed system continually extracts knowledge from the Web, along the way dynamically synthesizing and issuing queries to humans to increase the accuracy of the system's knowledge base and extractors.The approach extends the PI's previous work utilizing statistical language models (SLMs) for information extraction. Novel SLMs are investigated for unifying the extraction of relational data expressed in Web tables with extraction from free text. New active learning techniques utilize the models to identify "high-leverage" queries -- requesting, for example, textual extraction patterns that when retrieved from the Web yield thousands of novel extractions. The queries investigated are mostly amenable to non-experts, meaning that much of the human input can be acquired at scale via online mass-collaboration.The broader impact of this project lies in the potential for accurate Web extraction to radically improve Web search, allowing users to answer complicated questions by synthesizing information across multiple Web pages. In domains like medicine and biology, mining extracted knowledge bases could lead to important discoveries and novel therapies.Further information may be found at the project web page:http://wail.eecs.northwestern.edu/projects/activelms/index.html
本项目研究从Web中提取准确知识库的方法。 全自动Web信息提取技术具有很大的可扩展性,但具有准确性和覆盖范围的局限性。 该提案研究了如何通过引入精心选择的人类指导来改进自动提取技术。 所提出的系统不断地从Web上提取知识,沿着的方式动态地合成和发出查询人类,以增加系统的知识库和extractors.The方法的准确性扩展PI的以前的工作,利用统计语言模型(SLM)的信息提取。 研究了新的SLM,用于统一Web表中表示的关系数据的提取与从自由文本中提取。 新的主动学习技术利用模型来识别“高杠杆”查询-例如,请求文本提取模式,当从Web检索时,会产生数千个新的提取。 调查的查询大多是服从于非专家,这意味着大部分的人类输入可以通过在线大规模collaboration.The更广泛的影响,这个项目在于准确的Web提取,从根本上改善Web搜索的潜力,允许用户回答复杂的问题,通过综合多个网页上的信息。 在医学和生物学等领域,挖掘提取的知识库可能会导致重要的发现和新的疗法。http://wail.eecs.northwestern.edu/projects/activelms/index.html
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Douglas Downey其他文献
Douglas Downey的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Douglas Downey', 18)}}的其他基金
RI: Small: Extracting and Representing Commonsense Knowledge Using Language Models
RI:小:使用语言模型提取和表示常识知识
- 批准号:
2006851 - 财政年份:2020
- 资助金额:
$ 18.37万 - 项目类别:
Standard Grant
CAREER: Web Information Extraction: Integration and Scaling
职业:Web 信息提取:集成和扩展
- 批准号:
1351029 - 财政年份:2014
- 资助金额:
$ 18.37万 - 项目类别:
Continuing Grant
RI: Medium: Collaborative Research: Learning Representations of Language for Domain Adaptation
RI:媒介:协作研究:学习领域适应的语言表示
- 批准号:
1065270 - 财政年份:2011
- 资助金额:
$ 18.37万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313131 - 财政年份:2023
- 资助金额:
$ 18.37万 - 项目类别:
Standard Grant
Collaborative manufacturing and small scale automation in the Active Food Cluster
活性食品集群中的协作制造和小规模自动化
- 批准号:
10075402 - 财政年份:2023
- 资助金额:
$ 18.37万 - 项目类别:
Grant for R&D
Size-selective synthesis of small metal clusters in redox-active porous ionic crystals
氧化还原活性多孔离子晶体中小金属簇的尺寸选择性合成
- 批准号:
22KJ1159 - 财政年份:2023
- 资助金额:
$ 18.37万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313130 - 财政年份:2023
- 资助金额:
$ 18.37万 - 项目类别:
Standard Grant
RI: Small: SM-An Active Approach for Data Engineering to Improve Vision-Language Tasks
RI:小型:SM - 一种改进视觉语言任务的数据工程主动方法
- 批准号:
2132724 - 财政年份:2022
- 资助金额:
$ 18.37万 - 项目类别:
Continuing Grant
Creation of ordered multinuclear active site structures from mononuclear metalates and development of highly difficult reactions using small molecules
从单核金属盐创建有序多核活性位点结构并使用小分子开发高难度反应
- 批准号:
22H04971 - 财政年份:2022
- 资助金额:
$ 18.37万 - 项目类别:
Grant-in-Aid for Scientific Research (S)
Leveraging Technology: Providing a Comprehensive, Active Learning, Online Support Network for STEM Students Attending a Small, Rural, and Remote Community College
利用技术:为就读小型、农村和偏远社区学院的 STEM 学生提供全面、主动学习的在线支持网络
- 批准号:
2130277 - 财政年份:2022
- 资助金额:
$ 18.37万 - 项目类别:
Standard Grant
Development of a small-size and light-weight active inerter damper for seismic protection
小型轻量抗震主动惯性阻尼器的研制
- 批准号:
22F32060 - 财政年份:2022
- 资助金额:
$ 18.37万 - 项目类别:
Grant-in-Aid for JSPS Fellows
SWIFT: SMALL: Interference Canceling for Improved Coexistence Between Passive and Active Radio Systems
SWIFT:SMALL:干扰消除可改善无源和有源无线电系统之间的共存
- 批准号:
2029948 - 财政年份:2021
- 资助金额:
$ 18.37万 - 项目类别:
Standard Grant
Small Molecules as Dual-Active Components in Aqueous Organic Batteries
小分子作为水性有机电池的双活性成分
- 批准号:
534425-2019 - 财政年份:2021
- 资助金额:
$ 18.37万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral