DC: Small: Stream Clustering Algorithms in Mixed Domains with Soft Two-way Semi-Supervision
DC:Small:具有软双向半监督的混合域流聚类算法
基本信息
- 批准号:0916489
- 负责人:
- 金额:$ 45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-01 至 2013-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
One way to form a model of massive data sets is to use clustering techniques that summarize the data by several cluster representatives. However, clustering huge data sets is a very challenging problem whose difficulty increases further when the data is dynamic. We are developing scalable and robust stream summarization methods to provide a concise summary of huge multi-dimensional data streams that keep track of each discovered cluster or component of the summary through time, and that store only milestones corresponding to the occurrence of significant changes in these cluster representatives. Moreover to handle possibly diverse data formats and different sources of data, we are using a semi-supervised framework for (i) combining diverse representations of the data, in particular where data comes from different sources, some of which may be unreliable or uncertain; and (ii) exploiting optional external concept set labels to guide the clustering of the main data set in its original domain.Our methods have tremendous impact on applications that deal with streaming data in general, and more specifically on monitoring data streams in real-life dynamic settings. For example, as more and more everyday activities move online, network and Web data has been increasing at a rapid pace that precludes standard and classical data analysis methods, and call instead for real time analysis. The same can be said about the deluge of data that is being or about to be generated by new and future sensor networks, astronomical observatories, and missions in space. Thus, new research efforts and paradigms are needed and will have a strong impact on our ability to digest and make sense of this data.
形成大规模数据集模型的一种方法是使用聚类技术,通过几个聚类代表来汇总数据。然而,聚类巨大的数据集是一个非常具有挑战性的问题,其难度进一步增加时,数据是动态的。我们正在开发可扩展的和强大的流摘要方法,以提供一个简洁的摘要,巨大的多维数据流,跟踪每个发现的集群或组件的摘要通过时间,并存储只对应于这些集群代表发生重大变化的里程碑。此外,为了处理可能不同的数据格式和不同的数据来源,我们正在使用半监督框架来(i)组合数据的不同表示,特别是当数据来自不同来源时,其中一些可能不可靠或不确定;以及(ii)利用可选的外部概念集标签来引导主数据集在其原始域中的聚类。我们的方法对一般来说,这些应用程序处理流数据,更具体地说,是在现实生活中的动态设置中监视数据流。例如,随着越来越多的日常活动移动到网上,网络和Web数据已经以快速的速度增长,这排除了标准和经典的数据分析方法,而是要求真实的时间分析。同样的道理也适用于新的和未来的传感器网络、天文观测台和太空任务正在或即将产生的大量数据。因此,需要新的研究努力和范式,这将对我们消化和理解这些数据的能力产生重大影响。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Olfa Nasraoui其他文献
Automated Discovery, Categorization and Retrieval of Personalized Semantically Enriched E-learning Resources
自动发现、分类和检索个性化语义丰富的电子学习资源
- DOI:
10.1109/icsc.2009.107 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Leyla Zhuhadar;Olfa Nasraoui;R. Wyatt;Elizabeth Romero - 通讯作者:
Elizabeth Romero
ChatGPT for Conversational Recommendation: Refining Recommendations by Reprompting with Feedback
用于对话式推荐的 ChatGPT:通过反馈重新提示来完善推荐
- DOI:
10.48550/arxiv.2401.03605 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
K. Spurlock;Cagla Acun;Esin Saka;Olfa Nasraoui - 通讯作者:
Olfa Nasraoui
Enhancing Explainable Matrix Factorization with Tags for Multi-Style Explanations
使用多风格解释的标签增强可解释的矩阵分解
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Olurotimi Seton;P. Haghighi;Mohammad Alshammari;Olfa Nasraoui - 通讯作者:
Olfa Nasraoui
Robot failure mode prediction with deep learning sequence models
- DOI:
10.1007/s00521-024-10856-1 - 发表时间:
2024-12-19 - 期刊:
- 影响因子:4.500
- 作者:
Khalil Damak;Mariem Boujelbene;Cagla Acun;Aneseh Alvanpour;Sumit K. Das;Dan O. Popa;Olfa Nasraoui - 通讯作者:
Olfa Nasraoui
Guest editorial: special issue on a decade of mining the Web
- DOI:
10.1007/s10618-012-0257-y - 发表时间:
2012-03-03 - 期刊:
- 影响因子:4.300
- 作者:
Myra Spiliopoulou;Bamshad Mobasher;Olfa Nasraoui;Osmar Zaiane - 通讯作者:
Osmar Zaiane
Olfa Nasraoui的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Olfa Nasraoui', 18)}}的其他基金
ADVANCE Adaptation: Advancement through Healthy Empowerment, Networking and Awareness (ATHENA) at University of Louisville
路易斯维尔大学的高级适应:通过健康赋权、网络和意识取得进步(ATHENA)
- 批准号:
1936125 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RET Site: Research Experiences for Teachers in Big Data and Data Science
RET 网站:大数据和数据科学教师的研究经验
- 批准号:
1801513 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
INSPIRE: Not Unbiased: The Implications of Human-Algorithm Interaction on Training Data and Algorithm Performance
INSPIRE:并非公正:人机交互对训练数据和算法性能的影响
- 批准号:
1549981 - 财政年份:2015
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
SEI: Mining Solar Images to Support Astrophysics Research
SEI:挖掘太阳图像以支持天体物理学研究
- 批准号:
0431128 - 财政年份:2004
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
CAREER: New Clustering Algorithms Based on Robust Estimation and Genetic Niches with Applications to Web Usage Mining
职业:基于鲁棒估计和遗传利基的新聚类算法及其在网络使用挖掘中的应用
- 批准号:
0533317 - 财政年份:2004
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
SEI: Mining Solar Images to Support Astrophysics Research
SEI:挖掘太阳图像以支持天体物理学研究
- 批准号:
0532443 - 财政年份:2004
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
CAREER: New Clustering Algorithms Based on Robust Estimation and Genetic Niches with Applications to Web Usage Mining
职业:基于鲁棒估计和遗传利基的新聚类算法及其在网络使用挖掘中的应用
- 批准号:
0133948 - 财政年份:2002
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
CNS Core: Small: Toward Real-Time Stream Processing in Edge Devices
CNS 核心:小型:迈向边缘设备中的实时流处理
- 批准号:
2007854 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Stream-Based Active Mining at Scale: Non-Linear Non-Submodular Maximization
III:小型:协作研究:基于流的大规模主动挖掘:非线性非子模最大化
- 批准号:
1907472 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
AF: Small: Collaborative Research: New Challenges in Graph Stream Algorithms and Related Communication Games
AF:小:协作研究:图流算法和相关通信游戏的新挑战
- 批准号:
1907738 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Stream-Based Active Mining at Scale: Non-Linear Non-Submodular Maximization
III:小型:协作研究:基于流的大规模主动挖掘:非线性非子模最大化
- 批准号:
1908594 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
AF: Small: Collaborative Research: New Challenges in Graph Stream Algorithms and Related Communication Games
AF:小:协作研究:图流算法和相关通信游戏的新挑战
- 批准号:
1908849 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
III: Small: Scalable Event Trend Analytics For Data Stream Inquiry
III:小型:用于数据流查询的可扩展事件趋势分析
- 批准号:
1815866 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
AF: Small: Data Stream Algorithms with Application to Linear Algebra
AF:小:数据流算法及其在线性代数中的应用
- 批准号:
1815840 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
III: Small: Real-Time Detection of Structures from a Massive Graph Stream
III:小:从海量图流中实时检测结构
- 批准号:
1527541 - 财政年份:2015
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Realization of regional regeneration by small hydroelectric power generator attached to the agriculture irrigation canal applied by tidal stream generator
潮汐流发电机应用于农灌渠附设小型水轮发电机实现区域再生
- 批准号:
15K07656 - 财政年份:2015
- 资助金额:
$ 45万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Assessing fish colonization and use of a small Arctic tundra stream modified for habitat improvement
评估鱼类的殖民化和为改善栖息地而改造的北极苔原小溪的使用
- 批准号:
460837-2013 - 财政年份:2015
- 资助金额:
$ 45万 - 项目类别:
Industrial Postgraduate Scholarships