CAREER: A novel framework for mining graph patterns in large biological and social networks

职业:在大型生物和社交网络中挖掘图形模式的新颖框架

基本信息

  • 批准号:
    1149851
  • 负责人:
  • 金额:
    $ 54.74万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-03-01 至 2017-02-28
  • 项目状态:
    已结题

项目摘要

Frequent subgraph mining is a core task in data mining which can be applied to various real-life problems related to graphs and networks. Presently, the research value of this task has been heightened by the increased availability of massive network data in the domains of life and social sciences. However, existing algorithms for subgraph mining suffer from various limitations; noteworthy among these are lack of scalability, lack of user interaction and the absence of a mechanism to mine dynamic graphs. This research aims to overcome the above limitations by accomplishing the following three related tasks: (1) use of Monte Carlo sampling mechanisms for designing scalable graph mining algorithms; (2) develop real-time interactive graph mining systems using subgraph sampling approaches; and (3) discover models for graph evolution that are based on sampling and driven by the principles of game theory and economics.This research builds a novel paradigm for subgraph mining that is based on Monte Carlo sampling. This allows the development of algorithms that are scalable, by avoiding the need to enumerate all subgraph patterns. The resulting algorithms will be applied to subgraph mining problems in systems biology, e.g., predicting disease pathways by mining graphs from genomics and proteomics co-expression networks. A second outcome of this research is an interactive pattern mining framework using subgraph sampling where user feedback guides updates of the sampling distribution such that subsequent sampling prioritizes patterns that are considered "interesting" to the user. A third outcome is a subgraph sampling method that uses a game theoretic mechanism to design a subgraph evolution model for prediction tasks (such as link prediction) in dynamic networks. Broader Impacts: Availability of tools for mining large graphs enables the opportunity to build network biomarkers, which are novel signatures for disease diagnosis and risk factor analysis. A sampling based interactive pattern system is instrumental to mine "interesting" associations between diseases and medicines from numerous hidden datasets that are currently unexplored in many hospitals and health clinics. Scalable graph mining algorithms are also likely to find use in search, e-commerce and social networks based industry. The educational goal of this research is to leverage the PI's industrial experience to develop a "Large-scale data analysis" course on methods needed to build data mining systems that work on industry-scale data.Additional information about the project, including the findings, methods, open source implementations of algorithms, publications and data can be accessed through the project website at http://www.cs.iupui.edu/~alhasan/graph_mining.
频繁子图挖掘是数据挖掘中的一项核心任务,可以应用于各种与图和网络相关的实际问题。目前,随着生命科学和社会科学领域海量网络数据可用性的增加,这一任务的研究价值得到了提高。然而,现有的子图挖掘算法受到各种限制,其中值得注意的是缺乏可扩展性,缺乏用户交互和缺乏一个机制来挖掘动态图。本研究旨在克服上述局限性,完成以下三个相关的任务:(1)使用蒙特卡罗抽样机制设计可扩展的图挖掘算法:(2)开发实时交互式图挖掘系统,使用子图抽样方法;以及(3)发现基于抽样的图进化模型,并由博弈论和经济学原理驱动。这项研究建立了一个新的范式基于蒙特卡罗抽样的子图挖掘。这允许开发可扩展的算法,避免了枚举所有子图模式的需要。所得到的算法将被应用于系统生物学中的子图挖掘问题,例如,通过从基因组学和蛋白质组学共表达网络中挖掘图表来预测疾病途径。本研究的第二个成果是一个交互式的模式挖掘框架,使用子图采样,用户反馈指导更新的采样分布,使随后的采样优先模式,被认为是“有趣的”用户。第三个成果是子图采样方法,该方法使用博弈论机制来设计用于动态网络中的预测任务(例如链接预测)的子图演化模型。更广泛的影响:用于挖掘大型图的工具的可用性使得有机会构建网络生物标志物,这是用于疾病诊断和风险因素分析的新签名。基于采样的交互式模式系统有助于从许多医院和诊所目前未探索的隐藏数据集中挖掘疾病和药物之间的“有趣”关联。可扩展的图挖掘算法也可能在搜索、电子商务和基于社交网络的行业中找到用途。这项研究的教育目标是利用PI的行业经验开发一个“大规模数据分析”课程,该课程介绍了构建适用于行业规模数据的数据挖掘系统所需的方法。有关该项目的其他信息,包括研究结果、方法、算法的开源实现、出版物和数据,可以通过项目网站http://www.cs.iupui.edu/~alhasan/graph_mining访问。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mohammad Hasan其他文献

A New Approach to Solve Quadratic Equation Using Genetic Algorithm
遗传算法求解二次方程的新方法
  • DOI:
    10.1007/978-3-030-52856-0_15
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bibhas Roy Chowdhury;Md. Sabir Hossain;A. Ahmad;Mohammad Hasan;Md. Al
  • 通讯作者:
    Md. Al
On-farm feeding and feed management in aquaculture
水产养殖中的农场饲养和饲料管理
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M. Hasan;Mohammad Hasan
  • 通讯作者:
    Mohammad Hasan
New evidence from an alternative methodological approach to the defence spending‐economic growth causality issue in the case of mainland China
中国大陆国防开支与经济增长因果关系问题的替代方法论的新证据
  • DOI:
    10.1108/01443589710167347
  • 发表时间:
    1997
  • 期刊:
  • 影响因子:
    1.7
  • 作者:
    A. M. Masih;Rumi Masih;Mohammad Hasan
  • 通讯作者:
    Mohammad Hasan
SEAWEED CULTURE, POST-HARVEST PROCESSING, AND MARKET GENERATION FOR EMPLOYMENT OF COASTAL POOR COMMUNITIES IN COX'S BAZAR
海藻养殖、收获后加工和为考克斯巴扎尔沿海贫困社区创造就业机会
  • DOI:
    10.46909/alse-562098
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Farhaduzzaman;Suzan Khan;Mohammad Hasan;Rashedul Islam;Mahadi Hasan Osman;Neamul Hasan Shovon;Sayeed Mahmood Belal Haider;M. Kunda;Tarikul Islam;Md. Simul Bhuyan
  • 通讯作者:
    Md. Simul Bhuyan
Importance of mutual relations on customer satisfaction in industries with no/low direct contact with customers
在与客户没有/很少直接接触的行业中,相互关系对客户满意度的重要性
  • DOI:
    10.5897/ajbm11.2984
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    F. S. Ardabili;S. Daryani;M. Molaie;E. Rasooli;Mohammad Hasan;Kheiravar
  • 通讯作者:
    Kheiravar

Mohammad Hasan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mohammad Hasan', 18)}}的其他基金

Using Artificial Intelligence to Generate Interventions for Enhancing Student Performance in College STEM Courses
使用人工智能生成干预措施以提高学生在大学 STEM 课程中的表现
  • 批准号:
    2142558
  • 财政年份:
    2022
  • 资助金额:
    $ 54.74万
  • 项目类别:
    Standard Grant
Unravelling interfacial dynamics at the plasma-liquid boundary
揭示等离子体-液体边界处的界面动力学
  • 批准号:
    EP/T000104/1
  • 财政年份:
    2019
  • 资助金额:
    $ 54.74万
  • 项目类别:
    Research Grant
III: Small: Geometric Constraint based Concept Keyword Embedding for Domain-neutral Knowledge Graph Construction
III:小:基于几何约束的概念关键词嵌入,用于领域中立的知识图谱构建
  • 批准号:
    1909916
  • 财政年份:
    2019
  • 资助金额:
    $ 54.74万
  • 项目类别:
    Standard Grant

相似国自然基金

Novel-miR-1134调控LHCGR的表达介导拟 穴青蟹卵巢发育的机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
novel-miR75靶向OPR2,CA2和STK基因调控人参真菌胁迫响应的分子机制研究
  • 批准号:
    82304677
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
海南广藿香Novel17-GSO1响应p-HBA调控连作障碍的分子机制
  • 批准号:
    82304658
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
白术多糖通过novel-mir2双靶向TRADD/MLKL缓解免疫抑制雏鹅的胸腺程序性坏死
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
novel-miR-59靶向HMGAs介导儿童早衰症细胞衰老的作用及机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
novel_circ_008138/rno-miR-374-3p/SFRP4调控Wnt信号通路参与先天性肛门直肠畸形发生的分子机制研究
  • 批准号:
    82070530
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
miRNA-novel-272通过靶向半乳糖凝集素3调控牙鲆肠道上皮细胞炎症反应的机制研究
  • 批准号:
    32002421
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
m6A修饰介导的lncRNA WEE2-AS1转录后novel-pri-miRNA剪切机制在胶质瘤恶性进展中的作用研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
miRNA/novel_167靶向抑制Dmrt1的表达在红鳍东方鲀性别分化过程中的功能研究
  • 批准号:
    31902347
  • 批准年份:
    2019
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: Identifying the Role of Tandem Repeats in Great Ape Adaptation through Undergraduate Team Research Using a Novel Statistical Framework
职业:通过本科团队研究使用新颖的统计框架确定串联重复在类人猿适应中的作用
  • 批准号:
    2325466
  • 财政年份:
    2023
  • 资助金额:
    $ 54.74万
  • 项目类别:
    Continuing Grant
CAREER: A Novel Framework for Measuring and Engineering Twisting and Writhing in DNA
职业生涯:测量和工程 DNA 扭曲的新框架
  • 批准号:
    2240176
  • 财政年份:
    2023
  • 资助金额:
    $ 54.74万
  • 项目类别:
    Continuing Grant
A Career Development Award in Global Postpartum Health
全球产后健康职业发展奖
  • 批准号:
    10706338
  • 财政年份:
    2022
  • 资助金额:
    $ 54.74万
  • 项目类别:
CAREER: Identifying the Role of Tandem Repeats in Great Ape Adaptation through Undergraduate Team Research Using a Novel Statistical Framework
职业:通过本科团队研究使用新颖的统计框架确定串联重复在类人猿适应中的作用
  • 批准号:
    2144878
  • 财政年份:
    2022
  • 资助金额:
    $ 54.74万
  • 项目类别:
    Continuing Grant
A Career Development Award in Global Postpartum Health
全球产后健康职业发展奖
  • 批准号:
    10589611
  • 财政年份:
    2022
  • 资助金额:
    $ 54.74万
  • 项目类别:
Senior Research Career Scientist
高级研究职业科学家
  • 批准号:
    10672971
  • 财政年份:
    2021
  • 资助金额:
    $ 54.74万
  • 项目类别:
Senior Research Career Scientist
高级研究职业科学家
  • 批准号:
    10315818
  • 财政年份:
    2021
  • 资助金额:
    $ 54.74万
  • 项目类别:
Senior Research Career Scientist
高级研究职业科学家
  • 批准号:
    10507773
  • 财政年份:
    2021
  • 资助金额:
    $ 54.74万
  • 项目类别:
CAREER: A Novel Computational Thermodynamics Framework with Intrinsic Chemical Short-Range Order
职业:具有本征化学短程有序的新型计算热力学框架
  • 批准号:
    2042284
  • 财政年份:
    2021
  • 资助金额:
    $ 54.74万
  • 项目类别:
    Continuing Grant
CAREER: A Novel Framework for Knowledge Discovery from Time Series Data in Biology and Climate Science
职业:从生物学和气候科学的时间序列数据中发现知识的新框架
  • 批准号:
    1254206
  • 财政年份:
    2013
  • 资助金额:
    $ 54.74万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了