BIGDATA: DA: Interpreting massive genomic data sets via summarization

BIGDATA:DA:通过汇总解释海量基因组数据集

基本信息

  • 批准号:
    8642168
  • 负责人:
  • 金额:
    $ 20.78万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-04-01 至 2016-03-31
  • 项目状态:
    已结题

项目摘要

Genomic data is big and getting ever bigger, but current analysis methods will not scale to the analysis of thousands or millions of genomes. Consequently, a critical technical challenge is to develop new methods that can analyze these enormous data sets. In this proposal, we describe a new computational framework for drawing inferences from massive genomic data sets. Our approach leverages submodular summarization methods that have been developed for analyzing text corpora. We will apply these methods to five big data problems in genomics: 1) identifying functional elements characteristic o f a given human cell type; 2) identifying genomic features associated with a particular subclass of cancer; 3-4) identifying genomic variants representative of ancestrally or phenotypically defined human populations; and 5) finding a set of microbial genes that characterize a given site on the human body. This project will advance discovery and understanding on two fronts. First, we will develop novel methods for summarizing genomic, epigenomic and metagenomic data sets. Indeed, to our knowledge, this grant proposes the first application of summarization methods to genomic data of any kind. The proposed research will significantly advance our ability to apply submodularity to these summarization tasks, particularly with respect to identifying and creating a library of distance functions that have bee validated with respect to the five tasks outlined in the proposal. Second, we will apply our novel methods to problems of profound importance. Indeed, significant progress toward any one of our five tasks would represent an important advance in our scientific understanding of human history, biology or disease. The impact of this project will grow as the big data problem grows, even after the project is complete. The results of this project, both the software that we develop and the summaries that we produce, will be useful for answering a wide array of questions in any field that must cope with big data.
基因组数据很大,而且越来越大,但当前的分析方法无法扩展到数千或数百万个基因组的分析。因此,一个关键的技术挑战是开发可以分析这些巨大数据集的新方法。在本提案中,我们描述了一种新的计算框架,用于从大量基因组数据集中得出推论。我们的方法利用了为分析文本语料库而开发的子模块摘要方法。我们将把这些方法应用于基因组学中的五个大数据问题:1)识别给定人类细胞类型的功能元件特征; 2) 识别与特定癌症亚类相关的基因组特征; 3-4) 鉴定代表祖先或表型定义的人群的基因组变异; 5) 寻找一组表征人体特定部位的微生物基因。该项目将促进两个方面的发现和理解。首先,我们将开发总结基因组、表观基因组和宏基因组数据集的新方法。事实上,据我们所知,这项资助首次提出将汇总方法应用于任何类型的基因组数据。拟议的研究将显着提高我们将子模块性应用于这些摘要任务的能力,特别是在识别和创建距离函数库方面,这些距离函数已针对提案中概述的五个任务进行了验证。其次,我们将把我们的新颖方法应用于具有深远意义的问题。事实上,我们五项任务中任何一项的重大进展都将代表我们对人类历史、生物学或疾病的科学理解的重要进步。即使在项目完成后,该项目的影响也会随着大数据问题的增长而增长。该项目的结果,无论是我们开发的软件还是我们生成的摘要,都将有助于回答任何必须处理大数据的领域中的各种问题。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

William Stafford Noble其他文献

Learning a latent representation of human genomics using Avocado
使用鳄梨学习人类基因组学的潜在表示
  • DOI:
    10.1101/2020.06.18.159756
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jacob M. Schreiber;William Stafford Noble
  • 通讯作者:
    William Stafford Noble
Cohesin interacts with a panoply of splicing factors required for cell cycle progression and genomic organization
粘连蛋白与细胞周期进程和基因组组织所需的一系列剪接因子相互作用
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jung‐Sik Kim;Xiaoyuan He;Jie Liu;Z. Duan;Taeyeon Kim;J. Gerard;Brian S. Kim;William Arbuthnot Sir Lane;William Stafford Noble;B. Budnik;T. Waldman
  • 通讯作者:
    T. Waldman
Self‐Reports about Tinnitus and about Cochlear Implants
关于耳鸣和人工耳蜗的自我报告
  • DOI:
    10.1097/00003446-200008001-00007
  • 发表时间:
    2000
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    William Stafford Noble
  • 通讯作者:
    William Stafford Noble
A COMPARATIVE ANALYSIS OF THE CLINICAL AND FUNCTIONAL OUTCOME OF HIGH FLEXION AND STANDARD TOTAL KNEE REPLACEMENT PROSTHESIS
高屈度与标准全膝关节置换假肢临床及功能结果的比较分析
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Pramila;Wei Wu;William Stafford Noble;L. Breeden
  • 通讯作者:
    L. Breeden
A biologist ’ s introduction to support vector machines
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    William Stafford Noble
  • 通讯作者:
    William Stafford Noble

William Stafford Noble的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('William Stafford Noble', 18)}}的其他基金

Deep tensor genomic imputation
深度张量基因组插补
  • 批准号:
    10557916
  • 财政年份:
    2021
  • 资助金额:
    $ 20.78万
  • 项目类别:
Deep tensor genomic imputation
深度张量基因组插补
  • 批准号:
    10096947
  • 财政年份:
    2021
  • 资助金额:
    $ 20.78万
  • 项目类别:
Optimization and joint modeling for peptide detection by tandem mass spectrometry
串联质谱肽检测的优化和联合建模
  • 批准号:
    9214942
  • 财政年份:
    2017
  • 资助金额:
    $ 20.78万
  • 项目类别:
Project 2: UW-CNOF Data Analysis and Modeling
项目 2:UW-CNOF 数据分析和建模
  • 批准号:
    9021413
  • 财政年份:
    2015
  • 资助金额:
    $ 20.78万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9983850
  • 财政年份:
    2015
  • 资助金额:
    $ 20.78万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9353379
  • 财政年份:
    2015
  • 资助金额:
    $ 20.78万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9916567
  • 财政年份:
    2015
  • 资助金额:
    $ 20.78万
  • 项目类别:
Machine learning methods to impute and annotate epigenomic maps
用于估算和注释表观基因组图谱的机器学习方法
  • 批准号:
    8814095
  • 财政年份:
    2014
  • 资助金额:
    $ 20.78万
  • 项目类别:
Machine learning methods to impute and annotate epigenomic maps
用于估算和注释表观基因组图谱的机器学习方法
  • 批准号:
    8925082
  • 财政年份:
    2014
  • 资助金额:
    $ 20.78万
  • 项目类别:
BIGDATA: DA: Interpreting massive genomic data sets via summarization
BIGDATA:DA:通过汇总解释海量基因组数据集
  • 批准号:
    8840551
  • 财政年份:
    2013
  • 资助金额:
    $ 20.78万
  • 项目类别:

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队

相似海外基金

Conference: Theory and Foundations of Statistics in the Era of Big Data
会议:大数据时代的统计学理论与基础
  • 批准号:
    2403813
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Standard Grant
FightAMR: Novel global One Health surveillance approach to fight AMR using Artificial Intelligence and big data mining
FightAMR:利用人工智能和大数据挖掘对抗 AMR 的新型全球统一健康监测方法
  • 批准号:
    MR/Y034422/1
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Research Grant
Exploring Hotel Customer Experiences in Japan via Big Data and Large Language Model Analysis
通过大数据和大语言模型分析探索日本酒店客户体验
  • 批准号:
    24K21025
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Big Data-based Distributed Control using a Behavioural Systems Framework
使用行为系统框架的基于大数据的分布式控制
  • 批准号:
    DP240100300
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Discovery Projects
CC* Networking Infrastructure: Enabling Big Science and Big Data Projects at the University of Massachusetts
CC* 网络基础设施:支持马萨诸塞大学的大科学和大数据项目
  • 批准号:
    2346286
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Standard Grant
REU Site: Online Interdisciplinary Big Data Analytics in Science and Engineering
REU 网站:科学与工程领域的在线跨学科大数据分析
  • 批准号:
    2348755
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Standard Grant
Market Orientation, Big Data Analysis Capability, and Business Performance: The Moderating Role of Supplier Relationship, Big data Analysis Outscoring
市场导向、大数据分析能力与经营绩效:供应商关系的调节作用、大数据分析得分
  • 批准号:
    24K05127
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Generative Visual Pre-training on Unlabelled Big Data
未标记大数据的生成视觉预训练
  • 批准号:
    DP240101848
  • 财政年份:
    2024
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Discovery Projects
MEGASKILLS [MEthodology of Psycho-pedagogical, Big Data and Commercial Video GAmes procedures for the European SKILLS Agenda Implementation]
MEGASKILLS [欧洲技能议程实施的心理教育学、大数据和商业视频游戏程序的方法]
  • 批准号:
    10069843
  • 财政年份:
    2023
  • 资助金额:
    $ 20.78万
  • 项目类别:
    EU-Funded
Improving NHS perimenopausal diagnosis and HRT prescription through AI, machine learning and big data
通过人工智能、机器学习和大数据改善 NHS 围绝经期诊断和 HRT 处方
  • 批准号:
    10053966
  • 财政年份:
    2023
  • 资助金额:
    $ 20.78万
  • 项目类别:
    Collaborative R&D
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了