BIGDATA: DA: Interpreting massive genomic data sets via summarization

BIGDATA:DA:通过汇总解释海量基因组数据集

基本信息

  • 批准号:
    8642168
  • 负责人:
  • 金额:
    $ 20.78万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-04-01 至 2016-03-31
  • 项目状态:
    已结题

项目摘要

Genomic data is big and getting ever bigger, but current analysis methods will not scale to the analysis of thousands or millions of genomes. Consequently, a critical technical challenge is to develop new methods that can analyze these enormous data sets. In this proposal, we describe a new computational framework for drawing inferences from massive genomic data sets. Our approach leverages submodular summarization methods that have been developed for analyzing text corpora. We will apply these methods to five big data problems in genomics: 1) identifying functional elements characteristic o f a given human cell type; 2) identifying genomic features associated with a particular subclass of cancer; 3-4) identifying genomic variants representative of ancestrally or phenotypically defined human populations; and 5) finding a set of microbial genes that characterize a given site on the human body. This project will advance discovery and understanding on two fronts. First, we will develop novel methods for summarizing genomic, epigenomic and metagenomic data sets. Indeed, to our knowledge, this grant proposes the first application of summarization methods to genomic data of any kind. The proposed research will significantly advance our ability to apply submodularity to these summarization tasks, particularly with respect to identifying and creating a library of distance functions that have bee validated with respect to the five tasks outlined in the proposal. Second, we will apply our novel methods to problems of profound importance. Indeed, significant progress toward any one of our five tasks would represent an important advance in our scientific understanding of human history, biology or disease. The impact of this project will grow as the big data problem grows, even after the project is complete. The results of this project, both the software that we develop and the summaries that we produce, will be useful for answering a wide array of questions in any field that must cope with big data.
基因组数据很大,而且越来越大,但目前的分析方法无法扩展到数千或数百万个基因组的分析。因此,一个关键的技术挑战是开发新的方法来分析这些巨大的数据集。在这个建议中,我们描述了一个新的计算框架,从大量的基因组数据集的推断。我们的方法利用子模块化的摘要方法,已开发用于分析文本语料库。我们将这些方法应用于基因组学中的五个大数据问题:1)识别给定人类细胞类型的功能元件特征; 2)识别与特定癌症亚类相关的基因组特征; 3-4)识别代表祖先或表型定义的人类群体的基因组变异; 5)找到一组表征人体给定部位的微生物基因。该项目将在两个方面推进发现和理解。首先,我们将开发新的方法来总结基因组,表观基因组和宏基因组数据集。事实上,据我们所知,这项资助首次将摘要方法应用于任何类型的基因组数据。拟议的研究将大大提高我们将子模块化应用于这些汇总任务的能力,特别是在识别和创建距离函数库方面,这些距离函数已被验证,并与提案中概述的五项任务相关。第二,我们将把我们的新方法应用于具有深远意义的问题。事实上,在我们的五项任务中的任何一项上取得重大进展都将代表我们对人类历史、生物学或疾病的科学理解的重要进步。这个项目的影响将随着大数据问题的增长而增长,即使在项目完成之后。这个项目的结果,包括我们开发的软件和我们制作的摘要,将有助于回答任何必须科普大数据的领域中的各种问题。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

William Stafford Noble其他文献

Learning a latent representation of human genomics using Avocado
使用鳄梨学习人类基因组学的潜在表示
  • DOI:
    10.1101/2020.06.18.159756
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jacob M. Schreiber;William Stafford Noble
  • 通讯作者:
    William Stafford Noble
Cohesin interacts with a panoply of splicing factors required for cell cycle progression and genomic organization
粘连蛋白与细胞周期进程和基因组组织所需的一系列剪接因子相互作用
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jung‐Sik Kim;Xiaoyuan He;Jie Liu;Z. Duan;Taeyeon Kim;J. Gerard;Brian S. Kim;William Arbuthnot Sir Lane;William Stafford Noble;B. Budnik;T. Waldman
  • 通讯作者:
    T. Waldman
Self‐Reports about Tinnitus and about Cochlear Implants
关于耳鸣和人工耳蜗的自我报告
  • DOI:
    10.1097/00003446-200008001-00007
  • 发表时间:
    2000
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    William Stafford Noble
  • 通讯作者:
    William Stafford Noble
A COMPARATIVE ANALYSIS OF THE CLINICAL AND FUNCTIONAL OUTCOME OF HIGH FLEXION AND STANDARD TOTAL KNEE REPLACEMENT PROSTHESIS
高屈度与标准全膝关节置换假肢临床及功能结果的比较分析
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Pramila;Wei Wu;William Stafford Noble;L. Breeden
  • 通讯作者:
    L. Breeden
A biologist ’ s introduction to support vector machines
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    William Stafford Noble
  • 通讯作者:
    William Stafford Noble

William Stafford Noble的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('William Stafford Noble', 18)}}的其他基金

Deep tensor genomic imputation
深度张量基因组插补
  • 批准号:
    10557916
  • 财政年份:
    2021
  • 资助金额:
    $ 20.78万
  • 项目类别:
Deep tensor genomic imputation
深度张量基因组插补
  • 批准号:
    10096947
  • 财政年份:
    2021
  • 资助金额:
    $ 20.78万
  • 项目类别:
Optimization and joint modeling for peptide detection by tandem mass spectrometry
串联质谱肽检测的优化和联合建模
  • 批准号:
    9214942
  • 财政年份:
    2017
  • 资助金额:
    $ 20.78万
  • 项目类别:
Project 2: UW-CNOF Data Analysis and Modeling
项目 2:UW-CNOF 数据分析和建模
  • 批准号:
    9021413
  • 财政年份:
    2015
  • 资助金额:
    $ 20.78万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9983850
  • 财政年份:
    2015
  • 资助金额:
    $ 20.78万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9353379
  • 财政年份:
    2015
  • 资助金额:
    $ 20.78万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9916567
  • 财政年份:
    2015
  • 资助金额:
    $ 20.78万
  • 项目类别:
Machine learning methods to impute and annotate epigenomic maps
用于估算和注释表观基因组图谱的机器学习方法
  • 批准号:
    8814095
  • 财政年份:
    2014
  • 资助金额:
    $ 20.78万
  • 项目类别:
Machine learning methods to impute and annotate epigenomic maps
用于估算和注释表观基因组图谱的机器学习方法
  • 批准号:
    8925082
  • 财政年份:
    2014
  • 资助金额:
    $ 20.78万
  • 项目类别:
BIGDATA: DA: Interpreting massive genomic data sets via summarization
BIGDATA:DA:通过汇总解释海量基因组数据集
  • 批准号:
    8840551
  • 财政年份:
    2013
  • 资助金额:
    $ 20.78万
  • 项目类别:

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队

相似海外基金

Conference: Theory and Foundations of Statistics in the Era of Big Data
会议:大数据时代的统计学理论与基础
  • 批准号:
    2403813
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Standard Grant
FightAMR: Novel global One Health surveillance approach to fight AMR using Artificial Intelligence and big data mining
FightAMR:利用人工智能和大数据挖掘对抗 AMR 的新型全球统一健康监测方法
  • 批准号:
    MR/Y034422/1
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Research Grant
Exploring Hotel Customer Experiences in Japan via Big Data and Large Language Model Analysis
通过大数据和大语言模型分析探索日本酒店客户体验
  • 批准号:
    24K21025
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Big Data-based Distributed Control using a Behavioural Systems Framework
使用行为系统框架的基于大数据的分布式控制
  • 批准号:
    DP240100300
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Discovery Projects
CC* Networking Infrastructure: Enabling Big Science and Big Data Projects at the University of Massachusetts
CC* 网络基础设施:支持马萨诸塞大学的大科学和大数据项目
  • 批准号:
    2346286
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Standard Grant
REU Site: Online Interdisciplinary Big Data Analytics in Science and Engineering
REU 网站:科学与工程领域的在线跨学科大数据分析
  • 批准号:
    2348755
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Standard Grant
Market Orientation, Big Data Analysis Capability, and Business Performance: The Moderating Role of Supplier Relationship, Big data Analysis Outscoring
市场导向、大数据分析能力与经营绩效:供应商关系的调节作用、大数据分析得分
  • 批准号:
    24K05127
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Generative Visual Pre-training on Unlabelled Big Data
未标记大数据的生成视觉预训练
  • 批准号:
    DP240101848
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Discovery Projects
OAC Core: A Scalable and Deployable Container Orchestration Cyber Infrastructure Toolkit for Deploying Big Data Analytics Applications in Public Cloud
OAC Core:用于在公共云中部署大数据分析应用程序的可扩展和可部署的容器编排网络基础设施工具包
  • 批准号:
    2313738
  • 财政年份:
    2023
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Standard Grant
IUCRC Planning Grant New Mexico State University: Center for Aviation Big Data Analytics [ABDA]
IUCRC 规划拨款 新墨西哥州立大学:航空大数据分析中心 [ABDA]
  • 批准号:
    2231654
  • 财政年份:
    2023
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了