Manifold Learning from Unorganized High-dimensional Data Points
从无组织的高维数据点进行流形学习
基本信息
- 批准号:0701825
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2006
- 资助国家:美国
- 起止时间:2006-08-15 至 2008-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The investigator and his colleagues use spectral methods toinvestigate a challenging problem in unsupervised learning anddata visualization: given a set of unorganized data pointssampled possibly with noise from an underlying manifold, computea set of global coordinates of the data points with respect tothe underlying manifold. The approach is guided by the generalprinciple that global structures can emerge from careful analysisof local interactions. The central idea is the exploration oftangent spaces as representations of local geometry on anonlinear manifold using weighted PCA, and the global alignmentof those local tangent spaces to obtain the global structure ofthe manifold by way of computing a partial eigendecomposition ofthe neighborhood connection matrix. The study focuses on thefollowing areas: 1) effective local geometric and topologicalstructures for manifold learning; 2) the interaction of the localsampling density, noise level, the regularity of the manifold andthe local curvature structure, and their effects on the accuracyof manifold learning; 3) local smoothing methods to make manifoldlearning more robust to noise and outliers; 4) connections withinfinite mixture models, one-class support vector machines andlevel set methods; 5) efficient and scalable algorithms forlarge-scale manifold learning problems. With the advancement in modern computing technology, we arefaced with the challenging problems of extracting usefulinformation from vast amounts of data. The data generated in avariety of applications tend to have tens of thousands ofattributes, leading to the problem characterized by "curse ofdimensionality." In many applications, however, high-dimensionaldata points are governed by a few intrinsic degrees of freedom.Think of the set of images depicting a horizontally rotatingface: the images are high-dimensional but the intrinsic degree offreedom of the image set is simply one, representing the rotationangle of the face. The focus of this proposal is the developmentof geometric, statistical, and computational methods forextracting those latent intrinsic degrees of freedom by modelingthe set of data points as samples from nonlinear manifolds, andthe discovery of the global structure of the manifolds fromcareful analysis of local interactions. The results, algorithms,and techniques developed have immediate applications inbioinformatics, especially for gene expression analysis fordetecting and distinguishing diseases and disease types; inappearance-based modeling for people detection using videosequences generated from surveillance cameras; in helpingintelligence analysts to sift through large amount of textualinformation by more efficient modeling of text documentcollections; and in enhancing computer-supported collaborativelearning and performance measurement in second language learning.
研究者和他的同事们使用谱方法来研究无监督学习和数据可视化中的一个具有挑战性的问题:给定一组无组织的数据点,可能带有来自底层流形的噪声,计算一组数据点相对于底层流形的全局坐标。 该方法的指导原则是,全球结构可以从仔细分析当地的相互作用。 其核心思想是利用加权PCA方法来探索非线性流形上的切空间作为局部几何的表示,并通过计算邻域连接矩阵的部分特征分解来对这些局部切空间进行全局分解,从而获得流形的全局结构. 本文主要研究了以下几个方面:1)流形学习中有效的局部几何和拓扑结构; 2)局部采样密度、噪声水平、流形的正则性和局部曲率结构之间的相互作用及其对流形学习精度的影响; 3)局部光滑方法使流形学习对噪声和离群点具有更强的鲁棒性; 4)与无限混合模型、单类支持向量机和水平集方法的联系; 5)大规模流形学习问题的高效可扩展算法。 随着现代计算技术的发展,如何从海量数据中提取有用的信息是一个具有挑战性的问题。 在各种应用程序中产生的数据往往有成千上万的属性,导致了以“维数灾难”为特征的问题。“然而,在许多应用中,高维数据点是由几个固有的自由度控制的。想想一组描绘一张水平倾斜的脸的图像:这些图像是高维的,但图像集的固有自由度只是一个,代表了脸的旋转角度。 这个建议的重点是几何,统计和计算方法的发展,提取那些潜在的内在自由度,通过modelingthe数据点集作为样本从非线性流形,并发现全局结构的流形从仔细分析当地的相互作用。 研究结果、算法和技术在生物信息学中有着直接的应用,特别是用于检测和区分疾病和疾病类型的基因表达分析;用于基于外观的建模,用于使用监控摄像机生成的视频序列进行人员检测;帮助情报分析人员通过更有效的文本文档集建模来筛选大量的文本信息;以及在第二语言学习中加强计算机支持的协作学习和绩效评估。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Hongyuan Zha其他文献
A note on constructing a symmetric matrix with specified diagonal entries and eigenvalues
- DOI:
10.1007/bf01732616 - 发表时间:
1995-09-01 - 期刊:
- 影响因子:1.700
- 作者:
Hongyuan Zha;Zhenyue Zhang - 通讯作者:
Zhenyue Zhang
A Cubically Convergent Parallelizable Method for the Hermitian Eigenvalue Problem
厄米特征值问题的三次收敛并行化方法
- DOI:
10.1137/s0895479896302035 - 发表时间:
1998-04 - 期刊:
- 影响因子:0
- 作者:
Hongyuan Zha;Zhenyue Zhang - 通讯作者:
Zhenyue Zhang
Modifying the Generalized Singular Value Decomposition with Application in Direction-of-Arrival Finding
修正广义奇异值分解及其在波达方向查找中的应用
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Hongyuan Zha;Zhenyue Zhang - 通讯作者:
Zhenyue Zhang
Structure and Perturbation Analysis of Truncated SVD for Column-Partitioned Matrices
列划分矩阵截断SVD的结构和摄动分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Zhenyue Zhang;Hongyuan Zha - 通讯作者:
Hongyuan Zha
Boundary-Eliminated Pseudoinverse Linear Discriminant for Imbalanced Problems
不平衡问题的边界消除伪逆线性判别式
- DOI:
10.1109/tnnls.2017.2676239 - 发表时间:
2018-06 - 期刊:
- 影响因子:10.4
- 作者:
Yujin Zhu;Zhe Wang;Hongyuan Zha;Daqi Gao - 通讯作者:
Daqi Gao
Hongyuan Zha的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Hongyuan Zha', 18)}}的其他基金
Collaborative Research: CDS&E-MSS: Robust Algorithms for Interpolation and Extrapolation in Manifold Learning
合作研究:CDS
- 批准号:
1317372 - 财政年份:2013
- 资助金额:
-- - 项目类别:
Standard Grant
III: Small: Exploring Social and Behavioral Contexts for Information Retrieval
III:小:探索信息检索的社会和行为背景
- 批准号:
1116886 - 财政年份:2011
- 资助金额:
-- - 项目类别:
Continuing Grant
III: EAGER: Learning Evaluation Metrics for Information Retrieval
III:EAGER:信息检索的学习评估指标
- 批准号:
1049694 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Standard Grant
Computational Methods for Nonlinear Dimension Reduction
非线性降维的计算方法
- 批准号:
0736328 - 财政年份:2007
- 资助金额:
-- - 项目类别:
Standard Grant
Matrix Algorithms for Data Clustering and Nonlinear Dimension Reduction
用于数据聚类和非线性降维的矩阵算法
- 批准号:
0701796 - 财政年份:2006
- 资助金额:
-- - 项目类别:
Continuing Grant
Matrix Algorithms for Data Clustering and Nonlinear Dimension Reduction
用于数据聚类和非线性降维的矩阵算法
- 批准号:
0305879 - 财政年份:2003
- 资助金额:
-- - 项目类别:
Continuing Grant
Manifold Learning from Unorganized High-dimensional Data Points
从无组织的高维数据点进行流形学习
- 批准号:
0311800 - 财政年份:2003
- 资助金额:
-- - 项目类别:
Standard Grant
Large-Scale Matrix Computation Problems in Information Retrieval and Datamining
信息检索和数据挖掘中的大规模矩阵计算问题
- 批准号:
9901986 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Standard Grant
Numerical Methods for large Eigenvalue Problems: Parallizable Fast Algorithms and Inner-Outer iterations
大特征值问题的数值方法:可并行快速算法和内外迭代
- 批准号:
9619452 - 财政年份:1997
- 资助金额:
-- - 项目类别:
Standard Grant
RIA: The Canonical Correlations: Numerical Algorithms and Extensions
RIA:规范相关性:数值算法和扩展
- 批准号:
9308399 - 财政年份:1993
- 资助金额:
-- - 项目类别:
Continuing Grant
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
- 批准号:61572533
- 批准年份:2015
- 资助金额:66.0 万元
- 项目类别:面上项目
E-Learning中学习者情感补偿方法的研究
- 批准号:61402392
- 批准年份:2014
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Understanding the Impact of Outdoor Science and Environmental Learning Experiences Through Community-Driven Outcomes
通过社区驱动的成果了解户外科学和环境学习体验的影响
- 批准号:
2314075 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
Integrating Self-Regulated Learning Into STEM Courses: Maximizing Learning Outcomes With The Success Through Self-Regulated Learning Framework
将自我调节学习融入 STEM 课程:通过自我调节学习框架取得成功,最大化学习成果
- 批准号:
2337176 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Blessing of Nonconvexity in Machine Learning - Landscape Analysis and Efficient Algorithms
职业:机器学习中非凸性的祝福 - 景观分析和高效算法
- 批准号:
2337776 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
CAREER: Closing the Loop between Learning and Communication for Assistive Robot Arms
职业:关闭辅助机器人手臂的学习和交流之间的循环
- 批准号:
2337884 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Adaptive Deep Learning Systems Towards Edge Intelligence
职业:迈向边缘智能的自适应深度学习系统
- 批准号:
2338512 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
CAREER: Data-Enabled Neural Multi-Step Predictive Control (DeMuSPc): a Learning-Based Predictive and Adaptive Control Approach for Complex Nonlinear Systems
职业:数据支持的神经多步预测控制(DeMuSPc):一种用于复杂非线性系统的基于学习的预测和自适应控制方法
- 批准号:
2338749 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Structured Minimax Optimization: Theory, Algorithms, and Applications in Robust Learning
职业:结构化极小极大优化:稳健学习中的理论、算法和应用
- 批准号:
2338846 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
RII Track-4:NSF: HEAL: Heterogeneity-aware Efficient and Adaptive Learning at Clusters and Edges
RII Track-4:NSF:HEAL:集群和边缘的异质性感知高效自适应学习
- 批准号:
2327452 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
RII Track-4:NSF: Physics-Informed Machine Learning with Organ-on-a-Chip Data for an In-Depth Understanding of Disease Progression and Drug Delivery Dynamics
RII Track-4:NSF:利用器官芯片数据进行物理信息机器学习,深入了解疾病进展和药物输送动力学
- 批准号:
2327473 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: NCS-FR: Individual variability in auditory learning characterized using multi-scale and multi-modal physiology and neuromodulation
合作研究:NCS-FR:利用多尺度、多模式生理学和神经调节表征听觉学习的个体差异
- 批准号:
2409652 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant