BIGDATA: Mid-Scale: DA: Distribution-based machine learning for high dimensional datasets
BIGDATA:中规模:DA:针对高维数据集的基于分布的机器学习
基本信息
- 批准号:1247658
- 负责人:
- 金额:$ 100万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-01-01 至 2016-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Many applications call for representation and analysis of 'distributional' data sets where each data point is a collection of samples from a high dimensional distribution (as opposed to valuations of a typically vector valued random variable). In this setting, each data point can be modeled by a collection of distributions, one for each measured attribute. A concrete example of distributional data arises in the context of brain connectivity mapping.  The human brain contains around a hundred billion neurons with several hundred trillion physical connections. Neuroimaging approaches, like Diffusion Spectrum Imaging attempt to visualize the underlying anatomical architecture of neural pathways by creating 3D probability distributions of water diffusion along nerve fiber bundles, called orientation distribution functions. The project aims to develop new statistical and algorithmic approaches to natural generalizations of a class of standard machine learning problems (where multi-dimensional vector valued data points are replaced by distributions), including techniques for measuring distances and inner products between distributional data points, estimating variants of entropy, mutual information, conditional mutual information, clustering distributional data, constructing low-dimensional embeddings of distributional data, and learning classifiers and function approximators from distributional data. The resulting methods will be evaluated on large diffusion scan imaging data sets (where the data point for each patient  consists of 500,000 distributions). The novel machine learning approaches for descriptive and predictive modeling of distributional data resulting from this project are expected to benefit other scientific fields where data points can be naturally modeled by sets of distributions, which is a common situation in physics, psychology, economics, epidemiology, medicine, and social network-analysis.  New distributional data set to be obtained at CMU to augment the data available from NTU are likely to allow other research groups to engage in research on big data analytics from distributional data. Release of open source software,  video tutorials, research-training of graduate students contribute to the broader impacts of the project. Additional information about the project can be found at: http://www.autonlab.org/autonweb/20928.html.
许多应用程序要求对“分布”数据集进行表示和分析,其中每个数据点都是来自高维分布的样本集合(与典型的向量值随机变量的估值相反)。在此设置中,每个数据点都可以通过分布的集合来建模,每个分布对应一个测量属性。分布式数据的一个具体例子出现在大脑连接映射的背景下。人类大脑包含大约一千亿个神经元和几百万亿个物理连接。神经成像方法,如扩散光谱成像,试图通过创建水沿神经纤维束扩散的三维概率分布,即方向分布函数,来可视化神经通路的潜在解剖结构。该项目旨在开发新的统计和算法方法来自然概括一类标准机器学习问题(其中多维向量值数据点被分布所取代),包括测量分布数据点之间的距离和内积的技术,估计熵的变量,互信息,条件互信息,聚类分布数据,构造分布数据的低维嵌入,并从分布数据中学习分类器和函数逼近器。结果方法将在大型扩散扫描成像数据集上进行评估(其中每个患者的数据点由500,000个分布组成)。该项目产生的用于描述和预测分布数据建模的新型机器学习方法有望使其他科学领域受益,其中数据点可以通过分布集自然地建模,这是物理学,心理学,经济学,流行病学,医学和社会网络分析中的常见情况。CMU将获得新的分布式数据集,以增加南洋理工大学提供的数据,这可能使其他研究小组能够参与从分布式数据进行大数据分析的研究。开源软件的发布、视频教程、研究生的研究培训都有助于这个项目产生更广泛的影响。有关该项目的更多信息可以在http://www.autonlab.org/autonweb/20928.html上找到。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
                item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi }} 
- 发表时间:{{ item.publish_year }} 
- 期刊:
- 影响因子:{{ item.factor }}
- 作者:{{ item.authors }} 
- 通讯作者:{{ item.author }} 
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ patent.updateTime }}
Aarti Singh其他文献
Noise-Adaptive Margin-Based Active Learning and Lower Bounds under Tsybakov Noise Condition
Tsybakov 噪声条件下基于噪声自适应裕度的主动学习和下界
- DOI:
- 发表时间:2014 
- 期刊:
- 影响因子:0
- 作者:Yining Wang;Aarti Singh 
- 通讯作者:Aarti Singh 
A closer look at jobless recoveries
仔细观察失业复苏
- DOI:
- 发表时间:2003 
- 期刊:
- 影响因子:0
- 作者:Stacey L. Schreft;Aarti Singh 
- 通讯作者:Aarti Singh 
Design of an Intelligent and Adaptive Mapping Mechanism for Multiagent Interface
一种智能自适应多智能体接口映射机制设计
- DOI:10.1007/978-3-642-22577-2_51 
- 发表时间:2011 
- 期刊:
- 影响因子:0
- 作者:Aarti Singh;Dimple Juneja;A. Sharma 
- 通讯作者:A. Sharma 
Provably Correct Active Sampling Algorithms for Matrix Column Subset Selection with Missing Data
用于缺失数据的矩阵列子集选择的可证明正确的主动采样算法
- DOI:
- 发表时间:2015 
- 期刊:
- 影响因子:0
- 作者:Yining Wang;Aarti Singh 
- 通讯作者:Aarti Singh 
An empirical comparison of sampling techniques for matrix column subset selection
矩阵列子集选择采样技术的实证比较
- DOI:
- 发表时间:2015 
- 期刊:
- 影响因子:0
- 作者:Yining Wang;Aarti Singh 
- 通讯作者:Aarti Singh 
Aarti Singh的其他文献
{{
              item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi }} 
- 发表时间:{{ item.publish_year }} 
- 期刊:
- 影响因子:{{ item.factor }}
- 作者:{{ item.authors }} 
- 通讯作者:{{ item.author }} 
{{ truncateString('Aarti Singh', 18)}}的其他基金
AI Institute for Societal Decision Making (AI-SDM)
人工智能社会决策研究所 (AI-SDM)
- 批准号:2229881 
- 财政年份:2023
- 资助金额:$ 100万 
- 项目类别:Cooperative Agreement 
Collaborative Research: New Perspectives on Deep Learning: Bridging Approximation, Statistical, and Algorithmic Theories
合作研究:深度学习的新视角:桥接近似、统计和算法理论
- 批准号:2134133 
- 财政年份:2021
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
QuBBD: Collaborative Research: Personalized Predictive Neuromarkers for Stress-Related Health Risks
QuBBD:合作研究:压力相关健康风险的个性化预测神经标志物
- 批准号:1557572 
- 财政年份:2015
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
15th IMS New Researchers Conference
第15届IMS新研究员大会
- 批准号:1301845 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
CAREER: Distilling information structure from big and dirty data: Efficient learning of clusters and graphs in modern datasets
职业:从大数据和脏数据中提取信息结构:现代数据集中集群和图的高效学习
- 批准号:1252412 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:Continuing Grant 
III: Small: Spectral Methods for Active Clustering and Bi-Clustering
III:小:主动聚类和双聚类的谱方法
- 批准号:1116458 
- 财政年份:2011
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
相似国自然基金
肝细胞Mid 1活化加重脓毒症病理进程的分子机制研究及干预策略优化
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
MID1调控肿瘤相关巨噬细胞细胞中IRF8-STING通路在胶质瘤微环境中的作用机制研究
- 批准号:2025JJ70385
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
E3泛素连接酶Mid1调控Treg细胞影响GVHD 的作用及机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
线粒体动力蛋白MiD51在IL-27诱导类风湿关节炎DN2-B细胞分化扩增中的作用及机制研究
- 批准号:82302047
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
MID1调控糖稳态的分子机制
- 批准号:32000815
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
MID1基因缺陷对颅神经嵴细胞的影响及唇腭裂形成的分子病理
- 批准号:2020A151501160
- 批准年份:2020
- 资助金额:10.0 万元
- 项目类别:省市级项目
水稻MID1和赤霉素互作调控缺水条件下花粉发育的机制研究
- 批准号:31770352
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于最小重要差异值(MID)的冠心病病证结合疗效评价量表中医临床疗效判定阈值研究
- 批准号:81603504
- 批准年份:2016
- 资助金额:17.0 万元
- 项目类别:青年科学基金项目
层级稀疏化的Mid-Level特征空间下高分辨率遥感影像检索方法研究
- 批准号:41401376
- 批准年份:2014
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
MID器件机电集成数字化设计关键问题的研究
- 批准号:50975241
- 批准年份:2009
- 资助金额:20.0 万元
- 项目类别:面上项目
相似海外基金
BIGDATA: Mid-Scale: ESCE: DCM: Collaborative Research: DataBridge - A Sociometric System for Long-Tail Science Data Collections
BIGDATA:中型:ESCE:DCM:协作研究:DataBridge - 长尾科学数据收集的社会计量系统
- 批准号:1560625 
- 财政年份:2015
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
- 批准号:1502780 
- 财政年份:2014
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
- 批准号:8840914 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
- 批准号:1247469 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:Continuing Grant 
BIGDATA: Mid-Scale: DCM: Collaborative Research: Eliminating the Data Ingestion Bottleneck in Big Data Applications
BIGDATA:中型:DCM:协作研究:消除大数据应用中的数据摄取瓶颈
- 批准号:1247726 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
BIGDATA: Mid-Scale: DA: Collaborative Research: Genomes Galore - Core Techniques, Libraries, and Domain Specific Languages for High-Throughput DNA Sequencing
大数据:中规模:DA:协作研究:基因组丰富 - 高通量 DNA 测序的核心技术、库和领域特定语言
- 批准号:1416259 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
BIGDATA: Mid-Scale: DA : Collaborative Research Big Tensor Mining Theory
BIGDATA:中型:DA:协作研究大张量挖掘理论
- 批准号:8599832 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
- 批准号:8599838 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature.
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析。
- 批准号:1247696 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:Standard Grant 
BIGDATA: Mid-Scale: DA: ESCE: Collaborative Research: Scalable Statistical Computing for Emerging Omics Data Streams
BIGDATA:中型:DA:ESCE:协作研究:新兴组学数据流的可扩展统计计算
- 批准号:1247813 
- 财政年份:2013
- 资助金额:$ 100万 
- 项目类别:Standard Grant 

 刷新
              刷新
            
















 {{item.name}}会员
              {{item.name}}会员
            



