BIGDATA: Mid-Scale: DA: Distribution-based machine learning for high dimensional datasets
BIGDATA:中规模:DA:针对高维数据集的基于分布的机器学习
基本信息
- 批准号:1247658
- 负责人:
- 金额:$ 100万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-01-01 至 2016-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Many applications call for representation and analysis of 'distributional' data sets where each data point is a collection of samples from a high dimensional distribution (as opposed to valuations of a typically vector valued random variable). In this setting, each data point can be modeled by a collection of distributions, one for each measured attribute. A concrete example of distributional data arises in the context of brain connectivity mapping. The human brain contains around a hundred billion neurons with several hundred trillion physical connections. Neuroimaging approaches, like Diffusion Spectrum Imaging attempt to visualize the underlying anatomical architecture of neural pathways by creating 3D probability distributions of water diffusion along nerve fiber bundles, called orientation distribution functions. The project aims to develop new statistical and algorithmic approaches to natural generalizations of a class of standard machine learning problems (where multi-dimensional vector valued data points are replaced by distributions), including techniques for measuring distances and inner products between distributional data points, estimating variants of entropy, mutual information, conditional mutual information, clustering distributional data, constructing low-dimensional embeddings of distributional data, and learning classifiers and function approximators from distributional data. The resulting methods will be evaluated on large diffusion scan imaging data sets (where the data point for each patient consists of 500,000 distributions). The novel machine learning approaches for descriptive and predictive modeling of distributional data resulting from this project are expected to benefit other scientific fields where data points can be naturally modeled by sets of distributions, which is a common situation in physics, psychology, economics, epidemiology, medicine, and social network-analysis. New distributional data set to be obtained at CMU to augment the data available from NTU are likely to allow other research groups to engage in research on big data analytics from distributional data. Release of open source software, video tutorials, research-training of graduate students contribute to the broader impacts of the project. Additional information about the project can be found at: http://www.autonlab.org/autonweb/20928.html.
许多应用程序都要求对“分布”数据集的表示和分析,其中每个数据点是来自高维分布的样本集合(与典型矢量有价值的随机变量的估值相反)。在这种情况下,每个数据点可以通过分布集合来建模,每个分布都适用于每个测量属性。分布数据的具体示例是在大脑连接映射的背景下出现的。 人脑包含大约一亿神经元,并具有数百万个身体连接。神经影像学方法,例如扩散光谱成像尝试通过创建沿神经纤维束的水扩散的3D概率分布(称为方向分布函数)来可视化神经途径的基本解剖结构。该项目旨在开发新的统计和算法方法来对一系列标准的机器学习问题进行自然概括(其中多维矢量值的数据点被分布替换),包括用于测量分布数据点之间距离和内部产品之间的技术,并估算了入学信息,估算互动的分布数据,构建分布数据,构建分布数据,构建数据,构建数据,构建数据,构建数据,构造数据,构建范围,构建数据,构建范围,构建数据,构建范围,构建范围,建立了分布数据,建立了分布数据,建立了分布数据,构建了分布数据。和分布数据的功能近似值。最终的方法将在大型扩散扫描成像数据集上进行评估(其中每个患者的数据点由500,000个分布组成)。预计由该项目产生的分布数据的描述性和预测性建模的新型机器学习方法有望使其他科学领域受益,在这些领域中,可以通过一组分布来自然建模数据点,这是物理学,心理学,经济学,流行病学,医学,医学和社会网络分析中的常见情况。 新的分销数据集将在CMU获得,以增强NTU可用的数据可能允许其他研究小组从分销数据中从事大数据分析的研究。发布开源软件,视频教程,研究生的研究培训为项目的更广泛影响做出了贡献。有关该项目的其他信息,请访问:http://www.autonlab.org/autonweb/20928.html。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Aarti Singh其他文献
Computationally Feasible Near-Optimal Subset Selection for Linear Regression under Measurement Constraints
测量约束下线性回归的计算可行的近最优子集选择
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Yining Wang;Adams Wei Yu;Aarti Singh - 通讯作者:
Aarti Singh
Scope of Automation in Semantics-Driven Multimedia Information Retrieval From Web
语义驱动的网络多媒体信息检索的自动化范围
- DOI:
10.4018/978-1-5225-2483-0.ch001 - 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Aarti Singh;N. Dey;A. Ashour - 通讯作者:
A. Ashour
Supercritical carbon dioxide extraction of essential oils from leaves of Eucalyptus globulus L., their analysis and application
超临界二氧化碳萃取蓝桉叶精油及其分析与应用
- DOI:
10.1039/c5ay02009c - 发表时间:
2016 - 期刊:
- 影响因子:3.1
- 作者:
Aarti Singh;Anees Ahmad;R. Bushra - 通讯作者:
R. Bushra
Minimax rates for homology inference
同源推理的极小极大率
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Sivaraman Balakrishnan;A. Rinaldo;Don Sheehy;Aarti Singh;L. Wasserman - 通讯作者:
L. Wasserman
Worldwide Macroeconomic Stability and Monetary Policy Rules
全球宏观经济稳定和货币政策规则
- DOI:
10.2139/ssrn.906863 - 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
J. Bullard;Aarti Singh - 通讯作者:
Aarti Singh
Aarti Singh的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Aarti Singh', 18)}}的其他基金
AI Institute for Societal Decision Making (AI-SDM)
人工智能社会决策研究所 (AI-SDM)
- 批准号:
2229881 - 财政年份:2023
- 资助金额:
$ 100万 - 项目类别:
Cooperative Agreement
Collaborative Research: New Perspectives on Deep Learning: Bridging Approximation, Statistical, and Algorithmic Theories
合作研究:深度学习的新视角:桥接近似、统计和算法理论
- 批准号:
2134133 - 财政年份:2021
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
QuBBD: Collaborative Research: Personalized Predictive Neuromarkers for Stress-Related Health Risks
QuBBD:合作研究:压力相关健康风险的个性化预测神经标志物
- 批准号:
1557572 - 财政年份:2015
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
15th IMS New Researchers Conference
第15届IMS新研究员大会
- 批准号:
1301845 - 财政年份:2013
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
CAREER: Distilling information structure from big and dirty data: Efficient learning of clusters and graphs in modern datasets
职业:从大数据和脏数据中提取信息结构:现代数据集中集群和图的高效学习
- 批准号:
1252412 - 财政年份:2013
- 资助金额:
$ 100万 - 项目类别:
Continuing Grant
III: Small: Spectral Methods for Active Clustering and Bi-Clustering
III:小:主动聚类和双聚类的谱方法
- 批准号:
1116458 - 财政年份:2011
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
相似国自然基金
大规模网络数据中邻接矩阵特征根与特征向量的研究
- 批准号:12371278
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
非凸随机优化在大规模学习任务中的关键参数探究
- 批准号:62302325
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
大规模检验中的经验贝叶斯方法
- 批准号:12371282
- 批准年份:2023
- 资助金额:44.00 万元
- 项目类别:面上项目
面向超级计算机的改进粒子群算法在大规模WSN中的应用研究
- 批准号:62372495
- 批准年份:2023
- 资助金额:50.00 万元
- 项目类别:面上项目
新型电力系统中可再生能源大规模利用的建模及激励机制研究
- 批准号:72304114
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
BIGDATA: Mid-Scale: ESCE: DCM: Collaborative Research: DataBridge - A Sociometric System for Long-Tail Science Data Collections
BIGDATA:中型:ESCE:DCM:协作研究:DataBridge - 长尾科学数据收集的社会计量系统
- 批准号:
1560625 - 财政年份:2015
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
- 批准号:
1502780 - 财政年份:2014
- 资助金额:
$ 100万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
- 批准号:
8840914 - 财政年份:2013
- 资助金额:
$ 100万 - 项目类别:
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
- 批准号:
1247469 - 财政年份:2013
- 资助金额:
$ 100万 - 项目类别:
Continuing Grant
BIGDATA: Mid-Scale: DCM: Collaborative Research: Eliminating the Data Ingestion Bottleneck in Big Data Applications
BIGDATA:中型:DCM:协作研究:消除大数据应用中的数据摄取瓶颈
- 批准号:
1247726 - 财政年份:2013
- 资助金额:
$ 100万 - 项目类别:
Standard Grant