III: Small: Towards Agile Information Integration for Large Scale-- Data Aware Indexing and Search over Unstructured Data
III:小:迈向大规模敏捷信息集成——非结构化数据的数据感知索引和搜索
基本信息
- 批准号:1018723
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-09-01 至 2014-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This proposal aims to enable scalable and adaptable information integration over unstructured data at a large scale. There is a need to be able to do structured queries with unstructured data, for example in executing SQL queries over Web pages. This project will develop a new approach of "query push-down," distinctive from the conventional "data pull-up" techniques, as a promising direction for accomplishing agility in integration. The technical objectives will be driven by two application domains: Army land planning and the Illinois digital library. The team will develop query translation techniques that "pushes down" queries to a format that can be executed over unstructured document and feature indexes. This approach will eliminate expensive, inflexible, and often fragile extraction of unstructured data, enabling scalable and adaptable information integration through "best effort" semantics. In the query push-down approach, queries are no longer executed by the SQL-like Boolean semantics, but would rather take a maximum likelihood interpretation-- i.e., what are the most likely answers, by properly translating a given query, under the presence of uncertainty and lack of preciseness in data? The team will study the formalism that governs the principles of such probabilistic query execution, for achieving "best effort" with probabilities as a formal quality metric. Researchers will build the Data-oriented Content Query System , which will support users of Web data not only keywords but also data types to query for relevant values of their desired data in the contents of the corpus, by specifying flexible patterns and customizing scoring functions. Structured queries will be translated for executing in the system to access and integrate the unstructured contents in the corpus.The successful results in this proposed research will have significant impacts in two areas. The research community has observed the scalability limitation of the current integration schemes. These observations highlight the urgency of the proposed study for developing large-scale, agile integration techniques. This will formally advance the understanding of large-scale best-effort integration and develop a set of general techniques. Second, the development of the query system engine will provide access to the data-rich Web, with practical deployment at the Illinois Gateway of the UIUC digital library, which will improve students and faculty?s access to online scholarly and open information. Students will be directly involved in the research effort and new curricula are planned.
该提案旨在实现大规模非结构化数据的可扩展和适应性强的信息集成。需要能够对非结构化数据进行结构化查询,例如在Web页面上执行SQL查询。 本项目将开发一种新的方法“查询下推”,区别于传统的“数据上拉”技术,作为一个有前途的方向,实现敏捷的集成。 技术目标将由两个应用领域驱动:陆军土地规划和伊利诺伊州数字图书馆。该团队将开发查询翻译技术,将查询“下推”到可以在非结构化文档和特征索引上执行的格式。 这种方法将消除对非结构化数据的昂贵、不灵活且通常脆弱的提取,从而通过“尽力而为”语义实现可伸缩和可适应的信息集成。 在查询下推方法中,查询不再由类似SQL的布尔语义执行,而是采用最大似然解释-即,在存在不确定性和缺乏数据精确性的情况下,通过正确翻译给定的查询,最可能的答案是什么? 该团队将研究管理这种概率查询执行的原则的形式主义,以实现“最大努力”的概率作为正式的质量度量。 研究人员将建立面向数据的内容查询系统,该系统将支持Web数据的用户不仅关键字,而且数据类型,以查询他们想要的数据在语料库的内容中的相关值,通过指定灵活的模式和定制的评分功能。 结构化查询将在系统中被翻译执行,以访问和集成语料库中的非结构化内容。研究界已经观察到当前集成方案的可扩展性限制。这些观察结果突出了开发大规模敏捷集成技术的紧迫性。 这将正式推进对大规模尽力而为集成的理解,并开发一套通用技术。第二,查询系统引擎的开发将提供对数据丰富的Web的访问,并在UIUC数字图书馆的伊利诺伊门户进行实际部署,这将提高学生和教师的素质。我们可以访问在线学术和开放信息。 学生将直接参与研究工作,并计划新的课程。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kevin Chang其他文献
Limited Relevance of the Very Low Risk Prostate Cancer Classification in the Modern Era: Results from a Large Institutional Active Surveillance Cohort.
现代极低风险前列腺癌分类的相关性有限:大型机构主动监测队列的结果。
- DOI:
10.1016/j.eururo.2023.02.013 - 发表时间:
2023 - 期刊:
- 影响因子:23.4
- 作者:
K. Shee;J. Cowan;A. Balakrishnan;D. Escobar;Kevin Chang;S. Washington;Hao G Nguyen;K. Shinohara;M. Cooperberg;Peter R. Carroll - 通讯作者:
Peter R. Carroll
Hypnosedative Use and Predictors of Successful Withdrawal in New Patients Attending a Falls Clinic
- DOI:
10.2165/11584480-000000000-00000 - 发表时间:
2012-09-22 - 期刊:
- 影响因子:3.800
- 作者:
Jenna Joester;Constance M. Vogler;Kevin Chang;Sarah N. Hilmer - 通讯作者:
Sarah N. Hilmer
Management of dialysis access in the post-transplantation patient
移植后患者透析通路的管理
- DOI:
10.1053/j.semvascsurg.2024.10.005 - 发表时间:
2024-12-01 - 期刊:
- 影响因子:2.400
- 作者:
Lindsay Lynch;Kevin Chang;Ashlee Stutsrim;Maureen Sheehan;Matthew Edwards - 通讯作者:
Matthew Edwards
Refinement and Dissemination of a Digital Platform for Sharing Transportation Education Materials
交通教育材料共享数字平台的完善和传播
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Kevin Chang;Shane A. Brown;R. Perkins;L. Boyle;W. Cofer - 通讯作者:
W. Cofer
Hazard assessment of airborne and foodborne biodegradable polyhydroxyalkanoates microplastics and non-biodegradable polypropylene microplastics
空气传播和食源生物可降解聚羟基链烷酸酯微塑料以及不可生物降解聚丙烯微塑料的危害评估
- DOI:
10.1016/j.envint.2025.109311 - 发表时间:
2025-02-01 - 期刊:
- 影响因子:9.700
- 作者:
Hua Zha;Shengjie Li;Aoxiang Zhuge;Jian Shen;Yuanyuan Yao;Kevin Chang;Lanjuan Li - 通讯作者:
Lanjuan Li
Kevin Chang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kevin Chang', 18)}}的其他基金
III: Small: Social Discovery of Users and Content in Social Media Through Similarity-Based and Graph-Based Inference of Attributes and Queries
III:小:通过基于相似性和基于图的属性和查询推断来社交发现社交媒体中的用户和内容
- 批准号:
1619302 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
BIGDATA: F: Bringing Interactive Data Management to Scientists, Analysts, and the Masses: A Holistic Unification of Spreadsheets and Databases
BIGDATA:F:为科学家、分析师和大众带来交互式数据管理:电子表格和数据库的全面统一
- 批准号:
1633755 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
ITR: Shallow Integration over the Deep Web: A Holistic Approach
ITR:深网浅层集成:整体方法
- 批准号:
0313260 - 财政年份:2003
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: MetaQuerier: Dynamic Ad Hoc Information Integration Across the Internet
职业:MetaQuerier:跨互联网的动态临时信息集成
- 批准号:
0133199 - 财政年份:2002
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: IIS-III: Small Towards Fair Outlier Detection
协作研究:IIS-III:小到公平的异常值检测
- 批准号:
2310481 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
- 批准号:
2321504 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Towards Highly Accurate Map Services
III:小:迈向高精度地图服务
- 批准号:
2203553 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Towards Explainable Personalization
III:小:迈向可解释的个性化
- 批准号:
2007492 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
III: Small: Towards the Foundations of Training Deep Neural Networks: New Theory and Algorithms
III:小:迈向训练深度神经网络的基础:新理论和算法
- 批准号:
2008981 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
III: Small: Towards Explainable Recommendation Systems
III:小:迈向可解释的推荐系统
- 批准号:
1910154 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Towards a Theoretical Foundation for Diffusion Source Localization
III:小:迈向扩散源定位的理论基础
- 批准号:
2003924 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Towards Speech-Driven Multimodal Querying
III:小型:迈向语音驱动的多模式查询
- 批准号:
1816701 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Towards Resolving Ad-hoc Concept Queries with Table Answers via Multi-source Data Mining
III:小:通过多源数据挖掘解决带有表答案的临时概念查询
- 批准号:
1815674 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Towards a Theoretical Foundation for Diffusion Source Localization
III:小:迈向扩散源定位的理论基础
- 批准号:
1715385 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant