CAREER: Knowledge Enhanced Clustering Using Constraints
职业:使用约束进行知识增强聚类
基本信息
- 批准号:0801528
- 负责人:
- 金额:$ 45.85万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2007
- 资助国家:美国
- 起止时间:2007-08-17 至 2014-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project addresses the development of general principled methodsto efficiently include domain knowledge expressed as constraints into clustering algorithms. This not only allows improved clustering quality and algorithm performance but also finding insights that are novel and useful with respect to existing domain expertise. For example, phylogenetic trees built using hierarchical clustering should be consistent with existing domain knowledge such as that several species could not have evolved from one another. Existing clustering under constraints work has focused on non-hierarchical clustering with conjunctions of must-link and cannot-link constraints that assert that two objects must or must not be in the same cluster. This work can be interpreted as expressing knowledge using a limited logic comprised of instances as objects, two binary relations (must-link and cannot-link) and a single connector (and).This project will make three primary contributions. Firstly, it will examine a more complete logic to represent knowledge by adding in new relations, a complete set of connectives (not, and, or, implication), universal and existential quantifiers and new objects. This logic can express a large variety of knowledge such as minimum/maximum cluster separation, cluster width and even forcing distributions of certain objects across clusters. Secondly, it will investigate incorporating constraints beyond non-hierarchical clustering algorithms into algorithms for hierarchical agglomerative clustering, graph and social network clustering, and feature selection for clustering. Lastly, it will explore the computational challenges of using constraints by identifying easy to satisfy sets of constraints and developing a framework to explain why some constraint sets are more useful than others. This project will demonstrate and validate its technical contributions on two core application domains: analysis of pandemic micro-simulations results to aid in disaster preparation and image mining. The long term vision is to incorporate knowledge efficiently in a principled manner into other data mining tasks such as classification, anomaly detection and association rules. Project outreach for high school and undergraduates students will be in the form of hands-on discovery learning courses with emphasis on the two core application domains. For graduate students and researchers the tutorial slides, papers, datasets and software generated from the project will be freely available. Further information on this project may be found at the URLs http://www.constrained-clustering.org and http://www.cs.albany.edu/~davidson.
这个项目解决了一般原则性方法的发展,有效地将领域知识表示为聚类算法的约束。这不仅可以提高聚类质量和算法性能,而且还可以找到关于现有领域专业知识的新颖和有用的见解。例如,使用层次聚类构建的系统发育树应该与现有的领域知识一致,例如几个物种不能相互进化。现有的约束下的聚类工作集中在非层次聚类与连接的必须链接和不能链接的约束,断言两个对象必须或不能在同一个集群。这项工作可以被解释为使用有限的逻辑来表达知识,该逻辑由作为对象的实例、两个二元关系(must-link和cannot-link)和一个连接符(and)组成。首先,它将检查一个更完整的逻辑来表示知识,通过添加新的关系,一套完整的连接词(not,and,or,implications),全称和存在量词和新的对象。这种逻辑可以表达各种各样的知识,例如最小/最大聚类分离,聚类宽度,甚至强制某些对象跨聚类的分布。其次,它将研究将非层次聚类算法之外的约束纳入层次凝聚聚类算法,图和社会网络聚类,以及聚类的特征选择。最后,它将探索使用约束的计算挑战,确定容易满足的约束集,并开发一个框架来解释为什么一些约束集比其他约束集更有用。 该项目将展示和验证其在两个核心应用领域的技术贡献:分析流行病微观模拟结果,以帮助备灾和图像挖掘。长期愿景是将知识有效地以原则性的方式纳入其他数据挖掘任务,如分类,异常检测和关联规则。 高中生和本科生的项目推广将以实践发现学习课程的形式进行,重点是两个核心应用领域。对于研究生和研究人员,该项目生成的教程幻灯片,论文,数据集和软件将免费提供。有关该项目的更多信息,请访问网址http://www.constrained-clustering.org和http://www.cs.albany.edu/~davidson。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ian Davidson其他文献
Seasonal synchrony between vessel arrivals and larval production may influence the likelihood of biofouling introductions
- DOI:
10.1007/s10530-025-03609-1 - 发表时间:
2025-06-01 - 期刊:
- 影响因子:2.600
- 作者:
Simone L. Stevenson;Ian Davidson;Julio Botero;Kay Critchell;Cal Faubel;Kyle Hilliam;Oliver Floerl;Melissa Welsh;Eric A. Treml - 通讯作者:
Eric A. Treml
Charging for NHSPlus: an inferential study based on the internal provision of occupational health services within the National Health Service.
NHSPlus 收费:一项基于国家卫生服务内部职业健康服务提供的推断研究。
- DOI:
10.1093/occmed/kqg138 - 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Ian Davidson;P. Shuttleworth - 通讯作者:
P. Shuttleworth
Genetic structure and diversity of a rare woodland bat, Myotis bechsteinii: comparison of continental Europe and Britain
稀有林地蝙蝠 Myotis bechsteinii 的遗传结构和多样性:欧洲大陆和英国的比较
- DOI:
10.1007/s10592-018-1053-z - 发表时间:
2018 - 期刊:
- 影响因子:2.2
- 作者:
P. Wright;P. Hamilton;H. Schofield;A. Glover;Christopher Damant;Ian Davidson;F. Mathews - 通讯作者:
F. Mathews
Endoparasite communities of New Zealand Penguins differ over time and among species
- DOI:
10.1007/s00227-025-04651-2 - 发表时间:
2025-05-29 - 期刊:
- 影响因子:2.100
- 作者:
Jerusha Bennett;Bronwen Presswell;Mikey Little;Clement Lagrue;Trudi Webster;Ludovic Dutoit;Robert Poulin;Ian Davidson;Patrick Cahill;Kate S. Hutson - 通讯作者:
Kate S. Hutson
Identification and Uses of Deep Learning Backbones via Pattern Mining
通过模式挖掘识别和使用深度学习主干
- DOI:
10.48550/arxiv.2403.18278 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Michael Livanos;Ian Davidson - 通讯作者:
Ian Davidson
Ian Davidson的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ian Davidson', 18)}}的其他基金
Collaborative Research: IIS-III: Small Towards Fair Outlier Detection
协作研究:IIS-III:小到公平的异常值检测
- 批准号:
2310481 - 财政年份:2023
- 资助金额:
$ 45.85万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Explaining Unsupervised Learning: Combinatorial Optimization Formulations, Methods and Applications
III:小:协作研究:解释无监督学习:组合优化公式、方法和应用
- 批准号:
1910306 - 财政年份:2019
- 资助金额:
$ 45.85万 - 项目类别:
Continuing Grant
III: Small: Collaborative Research: Functional Network Discovery for Brain Connectivity
III:小:协作研究:大脑连接的功能网络发现
- 批准号:
1422218 - 财政年份:2014
- 资助金额:
$ 45.85万 - 项目类别:
Standard Grant
CAREER: Knowledge Enhanced Clustering Using Constraints
职业:使用约束进行知识增强聚类
- 批准号:
0643668 - 财政年份:2007
- 资助金额:
$ 45.85万 - 项目类别:
Continuing Grant
相似国自然基金
眼底影像筛查场景中基于先验知识的自
适应图像增强方法研究
- 批准号:
- 批准年份:2025
- 资助金额:10.0 万元
- 项目类别:省市级项目
基于检索增强生成的流动人口乙肝防控护理 AIGC 大模型的构建
- 批准号:GDHLYJYQ202407
- 批准年份:2025
- 资助金额:0.5 万元
- 项目类别:省市级项目
基于语义知识增强的产品视觉缺陷检测模型轻量化设计及应用研究
- 批准号:2025JJ70639
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
物理知识增强的天然产物药物跨尺度智能生成与可解释调控研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
知识增强大模型驱动的数字孪生的危重症医师岗位胜任力个性化教育平台构建与验证
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
知识图谱增强的生成式智能化ICU谵妄决策支持系统
- 批准号:
- 批准年份:2024
- 资助金额:0 万元
- 项目类别:面上项目
知识图谱增强的生成式智能化ICU 谵妄决策支持系统行为
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:面上项目
基于知识图谱增强的个性化联邦推荐方法研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
注意力增强的大模型知识汇聚方法研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于大语言模型增强漏洞影响库识别与修复的研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
CAP: Semi-supervised Fairness-Enhanced Knowledge Graph Construction on Social Media for AI-Enhanced Juvenile Justice
CAP:社交媒体上的半监督公平增强知识图谱构建,用于人工智能增强少年司法
- 批准号:
2323419 - 财政年份:2023
- 资助金额:
$ 45.85万 - 项目类别:
Standard Grant
Bridging Indigenous and Western Knowledge for Enhanced Brain Health: Synthesizing and Mobilizing Findings on Strengths-based Psychological Support and Psilocybin in Lifestyle Approaches for Age-related Cognitive Impairment Reduction
连接本土和西方知识以增强大脑健康:综合和动员基于优势的心理支持和裸盖菇素在减少与年龄相关的认知障碍的生活方式中的研究结果
- 批准号:
485588 - 财政年份:2023
- 资助金额:
$ 45.85万 - 项目类别:
Operating Grants
CAREER: Knowledge-enhanced and interpretable radiology report generation
职业:知识增强和可解释的放射学报告生成
- 批准号:
2145640 - 财政年份:2022
- 资助金额:
$ 45.85万 - 项目类别:
Continuing Grant
Knowledge Enhanced Software Repository Search
知识增强软件存储库搜索
- 批准号:
RGPIN-2019-05403 - 财政年份:2022
- 资助金额:
$ 45.85万 - 项目类别:
Discovery Grants Program - Individual
Knowledge Enhanced Software Library Documentation
知识增强软件库文档
- 批准号:
RGPIN-2021-02575 - 财政年份:2022
- 资助金额:
$ 45.85万 - 项目类别:
Discovery Grants Program - Individual
Knowledge Enhanced Software Repository Search
知识增强软件存储库搜索
- 批准号:
RGPIN-2019-05403 - 财政年份:2021
- 资助金额:
$ 45.85万 - 项目类别:
Discovery Grants Program - Individual
Knowledge Enhanced Software Library Documentation
知识增强软件库文档
- 批准号:
RGPIN-2021-02575 - 财政年份:2021
- 资助金额:
$ 45.85万 - 项目类别:
Discovery Grants Program - Individual
Knowledge Enhanced Software Library Documentation
知识增强软件库文档
- 批准号:
DGECR-2021-00051 - 财政年份:2021
- 资助金额:
$ 45.85万 - 项目类别:
Discovery Launch Supplement
Knowledge Enhanced Software Repository Search
知识增强软件存储库搜索
- 批准号:
RGPAS-2019-00078 - 财政年份:2020
- 资助金额:
$ 45.85万 - 项目类别:
Discovery Grants Program - Accelerator Supplements
Knowledge Enhanced Software Repository Search
知识增强软件存储库搜索
- 批准号:
RGPIN-2019-05403 - 财政年份:2020
- 资助金额:
$ 45.85万 - 项目类别:
Discovery Grants Program - Individual