Matrix Algorithms for Data Clustering and Nonlinear Dimension Reduction
用于数据聚类和非线性降维的矩阵算法
基本信息
- 批准号:0701796
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2006
- 资助国家:美国
- 起止时间:2006-08-15 至 2008-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This research is to investigate statistical and computational methods for simultaneous clustering of data matrices and their extensions to handle data hypercubes using spectral techniques. It uses techniques of cluster analysis, which is method of extracting information from large data sets. Many existing methods rely on clustering the data objects using all the attributes for similarity measurement. However, often the natural groupings of the data objects do not involve all attributes. For example, in gene expression analysis, for data generated by DNA chips under various conditions (tissue types, individuals, external stimuli etc.), it is unlikely that biologically related genes will behave similarly across all conditions, nor related set of conditions will involve all the genes. The focus of this project is to develop clustering algorithms that can, for example, find subsets of genes that behave similarly across subsets of conditions. The techniques are based on spectral methods for simultaneous clustering of data matrices. The results, algorithms, and techniques developed will have applications in bioinformatics and text analysis applications.The focus of the research is on identifying classes of cluster patterns in a data matrix that can be recovered by the spectral information of the data matrix. The research explores various objective functions that characterize desirable grouping patterns, and develops algorithms for cluster membership assignment from the spectral information. The methodology is being extended to the case of multi-way data hypercubes and to exploring connection of clustering and dimension reduction.
这项研究是为了研究数据矩阵的同时聚类的统计和计算方法,以及它们使用谱技术处理数据超立方体的扩展。它使用了聚类分析技术,这是一种从大数据集中提取信息的方法。许多现有的方法依赖于使用所有属性对数据对象进行聚类来进行相似性度量。然而,数据对象的自然分组通常不涉及所有属性。例如,在基因表达分析中,对于DNA芯片在各种条件(组织类型、个体、外部刺激等)下产生的数据,生物相关的基因不太可能在所有条件下都表现得相似,也不可能相关的一组条件涉及所有基因。该项目的重点是开发聚类算法,例如,可以找到在不同条件子集之间行为相似的基因子集。这些技术基于用于同时对数据矩阵进行聚类的谱方法。所开发的结果、算法和技术将在生物信息学和文本分析应用中得到应用。研究的重点是识别数据矩阵中可以通过数据矩阵的光谱信息恢复的聚类模式的类别。该研究探索了表征理想分组模式的各种目标函数,并开发了基于光谱信息的聚类成员分配算法。该方法正在扩展到多路数据超立方体的情况,并探索聚类和降维之间的联系。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Hongyuan Zha其他文献
A note on constructing a symmetric matrix with specified diagonal entries and eigenvalues
- DOI:
10.1007/bf01732616 - 发表时间:
1995-09-01 - 期刊:
- 影响因子:1.700
- 作者:
Hongyuan Zha;Zhenyue Zhang - 通讯作者:
Zhenyue Zhang
A Cubically Convergent Parallelizable Method for the Hermitian Eigenvalue Problem
厄米特征值问题的三次收敛并行化方法
- DOI:
10.1137/s0895479896302035 - 发表时间:
1998-04 - 期刊:
- 影响因子:0
- 作者:
Hongyuan Zha;Zhenyue Zhang - 通讯作者:
Zhenyue Zhang
Modifying the Generalized Singular Value Decomposition with Application in Direction-of-Arrival Finding
修正广义奇异值分解及其在波达方向查找中的应用
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Hongyuan Zha;Zhenyue Zhang - 通讯作者:
Zhenyue Zhang
Structure and Perturbation Analysis of Truncated SVD for Column-Partitioned Matrices
列划分矩阵截断SVD的结构和摄动分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Zhenyue Zhang;Hongyuan Zha - 通讯作者:
Hongyuan Zha
Boundary-Eliminated Pseudoinverse Linear Discriminant for Imbalanced Problems
不平衡问题的边界消除伪逆线性判别式
- DOI:
10.1109/tnnls.2017.2676239 - 发表时间:
2018-06 - 期刊:
- 影响因子:10.4
- 作者:
Yujin Zhu;Zhe Wang;Hongyuan Zha;Daqi Gao - 通讯作者:
Daqi Gao
Hongyuan Zha的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Hongyuan Zha', 18)}}的其他基金
Collaborative Research: CDS&E-MSS: Robust Algorithms for Interpolation and Extrapolation in Manifold Learning
合作研究:CDS
- 批准号:
1317372 - 财政年份:2013
- 资助金额:
-- - 项目类别:
Standard Grant
III: Small: Exploring Social and Behavioral Contexts for Information Retrieval
III:小:探索信息检索的社会和行为背景
- 批准号:
1116886 - 财政年份:2011
- 资助金额:
-- - 项目类别:
Continuing Grant
III: EAGER: Learning Evaluation Metrics for Information Retrieval
III:EAGER:信息检索的学习评估指标
- 批准号:
1049694 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Standard Grant
Computational Methods for Nonlinear Dimension Reduction
非线性降维的计算方法
- 批准号:
0736328 - 财政年份:2007
- 资助金额:
-- - 项目类别:
Standard Grant
Manifold Learning from Unorganized High-dimensional Data Points
从无组织的高维数据点进行流形学习
- 批准号:
0701825 - 财政年份:2006
- 资助金额:
-- - 项目类别:
Standard Grant
Matrix Algorithms for Data Clustering and Nonlinear Dimension Reduction
用于数据聚类和非线性降维的矩阵算法
- 批准号:
0305879 - 财政年份:2003
- 资助金额:
-- - 项目类别:
Continuing Grant
Manifold Learning from Unorganized High-dimensional Data Points
从无组织的高维数据点进行流形学习
- 批准号:
0311800 - 财政年份:2003
- 资助金额:
-- - 项目类别:
Standard Grant
Large-Scale Matrix Computation Problems in Information Retrieval and Datamining
信息检索和数据挖掘中的大规模矩阵计算问题
- 批准号:
9901986 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Standard Grant
Numerical Methods for large Eigenvalue Problems: Parallizable Fast Algorithms and Inner-Outer iterations
大特征值问题的数值方法:可并行快速算法和内外迭代
- 批准号:
9619452 - 财政年份:1997
- 资助金额:
-- - 项目类别:
Standard Grant
RIA: The Canonical Correlations: Numerical Algorithms and Extensions
RIA:规范相关性:数值算法和扩展
- 批准号:
9308399 - 财政年份:1993
- 资助金额:
-- - 项目类别:
Continuing Grant
相似海外基金
Development and implementation of algorithms to process the full-matrix data captured using ultrasonic phased arrays for non destructive testing
开发和实施算法来处理使用超声波相控阵捕获的全矩阵数据进行无损检测
- 批准号:
411252-2010 - 财政年份:2012
- 资助金额:
-- - 项目类别:
Industrial R&D Fellowships (IRDF)
Development and implementation of algorithms to process the full-matrix data captured using ultrasonic phased arrays for non destructive testing
开发和实施算法来处理使用超声波相控阵捕获的全矩阵数据进行无损检测
- 批准号:
411252-2010 - 财政年份:2011
- 资助金额:
-- - 项目类别:
Industrial R&D Fellowships (IRDF)
Collaborative Research: Non-negative Matrix Factorizations for Data Mining: Foundations, Capabilities, and Algorithms
协作研究:数据挖掘的非负矩阵分解:基础、功能和算法
- 批准号:
0915110 - 财政年份:2009
- 资助金额:
-- - 项目类别:
Standard Grant
SGER: Collaborative Research: Non-negative Matrix Factorizations for Data Mining: Algorithms and Applications
SGER:协作研究:数据挖掘的非负矩阵分解:算法和应用
- 批准号:
0844513 - 财政年份:2008
- 资助金额:
-- - 项目类别:
Standard Grant
SGER: Collaborative Research: Non-negative Matrix Factorizations for Data Mining: Algorithms and Applications
SGER:协作研究:数据挖掘的非负矩阵分解:算法和应用
- 批准号:
0844497 - 财政年份:2008
- 资助金额:
-- - 项目类别:
Standard Grant
ACT/SGER: Algorithms for Large-Scale Approximate Nonnegative Matrix Factorization in Data Analysis
ACT/SGER:数据分析中大规模近似非负矩阵分解的算法
- 批准号:
0442065 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Standard Grant
Matrix Algorithms for Data Clustering and Nonlinear Dimension Reduction
用于数据聚类和非线性降维的矩阵算法
- 批准号:
0305879 - 财政年份:2003
- 资助金额:
-- - 项目类别:
Continuing Grant
Collaborative Research: Large-Scale Optimization: Matrix-free Algorithms, Data Parallelism, and Applications in Seismic Inversion
合作研究:大规模优化:无矩阵算法、数据并行性及其在地震反演中的应用
- 批准号:
9973308 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Continuing Grant
Collaborative Research: Large-scale Optimization: Matrix-free Algorithms, Data Parallelism, and Applications in Seismic Inversion
合作研究:大规模优化:无矩阵算法、数据并行性及其在地震反演中的应用
- 批准号:
9973310 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: Large Scale Optimization: Matrix Free Algorithms, Data Parallelism, and Applications in Seismic Inversion
合作研究:大规模优化:无矩阵算法、数据并行性及其在地震反演中的应用
- 批准号:
9973423 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Standard Grant