Link Mining and Discovery

链接挖掘和发现

基本信息

  • 批准号:
    0308030
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2003
  • 资助国家:
    美国
  • 起止时间:
    2003-08-15 至 2008-07-31
  • 项目状态:
    已结题

项目摘要

This project examines several statistical inference tasks for data best described as a collection of heterogeneous linked objects. For each task, models are proposed, algorithms for both learning and making inferences using the models are developed and extensive empirical evaluation is performed. New approaches to mining linked data are needed because traditional statistical learning algorithms often make independence assumptions that are inappropriate for linked data.The first task studied is predicting the classification of an object based on attributes of the object and on a description of the objects to which it is linked. We are developing efficient collective classification algorithms that take into account the dependence between the object classifications. The next task examined is the use of labeled and unlabeled data for link-based classification. The use of unlabeled data to improve classification performance in propositional domains has received considerable attention in recent years; the use of unlabeled data for prediction in linked data is even more interesting, as it gives information about both the object distributions and the link distributions. The third task examined is link-based cluster analysis, i.e. finding similar objects based on both the object attributes and link properties. Results from this work will provide insight into effective statistical analysis for large linked heterogeneous domains. This has applications for discovering patterns in social networks, including criminal and terrorist networks, biological data such as epidemiological studies and a wide range of other collections of heterogeneous linked data.
这个项目研究了几个统计推断任务,以最好地将数据描述为异类链接对象的集合。对于每个任务,提出了模型,开发了使用这些模型进行学习和推理的算法,并进行了广泛的经验评估。挖掘关联数据需要新的方法,因为传统的统计学习算法经常做出不适用于关联数据的独立假设。研究的第一个任务是根据对象的属性和对对象的描述来预测对象的分类。我们正在开发高效的集合分类算法,该算法考虑了对象分类之间的依赖关系。研究的下一个任务是使用标记数据和未标记数据进行基于链接的分类。近年来,使用无标签数据来提高命题领域的分类性能受到了相当大的关注;使用无标签数据在关联数据中进行预测更加有趣,因为它提供了关于对象分布和链接分布的信息。研究的第三个任务是基于链接的聚类分析,即基于对象属性和链接属性来查找相似对象。这项工作的结果将为大型链接异构域的有效统计分析提供洞察力。这可应用于发现社交网络中的模式,包括犯罪和恐怖分子网络、流行病学研究等生物数据以及其他各种不同关联数据的广泛收集。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lise Getoor其他文献

Collective Grounding: Applying Database Techniques to Grounding Templated Models
集体接地:将数据库技术应用于接地模板模型
Soft quantification in statistical relational learning
  • DOI:
    10.1007/s10994-017-5647-3
  • 发表时间:
    2017-07-12
  • 期刊:
  • 影响因子:
    2.900
  • 作者:
    Golnoosh Farnadi;Stephen H. Bach;Marie-Francine Moens;Lise Getoor;Martine De Cock
  • 通讯作者:
    Martine De Cock
Research Challenges and Opportunities in Knowledge Representation
知识表示的研究挑战和机遇
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Natasha Noy;Deborah L. McGuinness;Eyal Amir;Chitta Baral;Michael Beetz;S. Bechhofer;C. Boutilier;Anthony Cohn;J. Kleer;Michel Dumontier;Tim Finin;Kenneth D. Forbus;Lise Getoor;Yolanda Gil;J. Heflin;P. Hitzler;Craig A. Knoblock;Henry Kautz;Yuliya Lierler;Vladimir Lifschitz;Peter F. Patel;C. Piatko;D. Riecken;M. Schildhauer
  • 通讯作者:
    M. Schildhauer

Lise Getoor的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lise Getoor', 18)}}的其他基金

TRIPODS: Institute for Foundations of Data Science
TRIPODS:数据科学研究所
  • 批准号:
    2023495
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
  • 批准号:
    1703331
  • 财政年份:
    2017
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
TRIPODS: Towards a Unified Theory of Structure, Incompleteness & Uncertainty in Heterogeneous Graphs
TRIPODS:迈向结构、不完备性的统一理论
  • 批准号:
    1740850
  • 财政年份:
    2017
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
III: Small: A Theoretical Framework for Practical Entity Resolution in Network Data
III:小:网络数据中实际实体解析的理论框架
  • 批准号:
    1218488
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
FODAVA: Collaborative Research: Foundations of Comparative Analytics for Uncertainty in Graphs
FODAVA:协作研究:图形不确定性比较分析的基础
  • 批准号:
    0937094
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Student Poster Program and Travel Scholarships for International Conference on Machine Learning (ICML) 2009
2009 年国际机器学习会议 (ICML) 学生海报计划和旅行奖学金
  • 批准号:
    0935087
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
CAREER: Graph Identification
职业:图形识别
  • 批准号:
    0746930
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Student Poster Program and Travel Scholarships for ICML 2008
ICML 2008 学生海报计划和旅行奖学金
  • 批准号:
    0830962
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
SoD: Data and Meta-Data Integration Maintenance
SoD:数据和元数据集成维护
  • 批准号:
    0438866
  • 财政年份:
    2005
  • 资助金额:
    --
  • 项目类别:
    Standard Grant

相似国自然基金

基于Genome mining技术研究抑制表皮葡萄球菌生物膜形成的次级代谢产物
  • 批准号:
    21242003
  • 批准年份:
    2012
  • 资助金额:
    10.0 万元
  • 项目类别:
    专项基金项目

相似海外基金

Travel: Student Support for the 2023 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2023)
旅行:2023 年 ACM SIGKDD 知识发现和数据挖掘会议 (KDD 2023) 的学生支持
  • 批准号:
    2323492
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
HIGH THROUGHPUT METAGENOME MINING FOR ENZYME DISCOVERY, LARGE-SCALE LIBRARY CREATION AND ASSAY
用于酶发现、大规模文库创建和分析的高通量宏基因组挖掘
  • 批准号:
    2868695
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Studentship
Next generation Text Mining in Drug Discovery
药物发现中的下一代文本挖掘
  • 批准号:
    BB/X511833/1
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Training Grant
Next generation Text Mining in Drug Discovery
药物发现中的下一代文本挖掘
  • 批准号:
    2760490
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Studentship
Data Mining and Machine Learning for System Model Discovery and Applications
用于系统模型发现和应用的数据挖掘和机器学习
  • 批准号:
    RGPIN-2019-05163
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
NSF Student Travel Grant for the 2022 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2022)
NSF 学生旅费资助 2022 年 ACM SIGKDD 知识发现和数据挖掘会议 (KDD 2022)
  • 批准号:
    2223561
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Novel antifungal discovery from mining unexplored microbes
通过挖掘未开发的微生物发现了新的抗真菌药物
  • 批准号:
    10039579
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Collaborative R&D
Data Mining and Machine Learning for System Model Discovery and Applications
用于系统模型发现和应用的数据挖掘和机器学习
  • 批准号:
    RGPIN-2019-05163
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Natural product discovery by a combination of genome mining and biosynthetic enzyme inhibitor
基因组挖掘与生物合成酶抑制剂相结合的天然产物发现
  • 批准号:
    20K05872
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Mining Actinomycetal Genomes for Natural Product Discovery and Biosynthesis
挖掘放线菌基因组用于天然产物发现和生物合成
  • 批准号:
    10640298
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了