CRII: III: Scaling up Distance Metric Learning for Large-scale Ultrahigh-dimensional Data
CRII:III:扩大大规模超高维数据的距离度量学习
基本信息
- 批准号:1463988
- 负责人:
- 金额:$ 17.46万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-03-01 至 2018-02-28
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project is to research and develop highly scalable stochastic optimization algorithms for distance metric learning (DML) for large-scale ultrahigh-dimensional (LSUD) data. DML is a fundamental problem in machine learning aiming to learn a distance metric such that intra-class variation is small and inter-class variation is large. When the scale and dimensionality of data is very large, the computational cost of DML is prohibitive. Domains utilizing machine learning techniques such as computer vision, natural language processing and bioinformatics will be directly impacted by this research. For example, one application is fine-grained image classification, e.g., categorizing different types of flowers or models of vehicles from pictures (this application will be used as one criteria to evaluate success of the research.) The research will enable data scientists to extract more knowledge from massive high-dimensional data complementing the White House BIG DATA Initiative to analyze large and complex data sets. Beyond its research impact, this project will facilitate the development of a new machine learning course at the University of Iowa (UI), and contribute to training future professionals in big data analytics. Broader impact will be further affected by dissemination of results through publications, open-sourced software, etc.This project addresses the computational challenges of LSUD-DML by scaling up the state of the art stochastic gradient descent (SGD) methods. A key computational bottleneck in applying SGD to DML is to project the updated solution into a complicated feasible domain at each iteration. The innovative proposed ideas lie at reducing the total cost of projections by (i) constructing and exploring a low-rank structured stochastic gradient to reduce the cost of projection, and (ii) dividing iterations into epochs and performing a projection-efficient SGD at each epoch to reduce the number of projections. Investigating data-dependent sampling strategies (i.e., selective sampling, importance sampling, and a combination of both) for LSUD-DML will further scale up the proposed methods. This research will provide experimental evidence regarding the scalability of the proposed algorithms while revealing insights into the proposed techniques and various analytical tradeoffs.For further information see the project web site at: http://homepage.cs.uiowa.edu/~tyng/dml.html.
本项目旨在研究和开发高度可扩展的随机优化算法,用于大规模超高维(LSUD)数据的距离度量学习(DML)。DML是机器学习中的一个基本问题,旨在学习一种类内变化小而类间变化大的距离度量。当数据的规模和维数非常大时,DML的计算成本令人望而却步。利用机器学习技术的领域,如计算机视觉、自然语言处理和生物信息学,将直接受到这项研究的影响。例如,一个应用程序是细粒度图像分类,例如,从图片中分类不同类型的花或车辆模型(该应用程序将被用作评估研究成功的标准之一)。该研究将使数据科学家能够从大量高维数据中提取更多知识,补充白宫大数据计划分析大型复杂数据集的能力。除了其研究影响外,该项目还将促进爱荷华大学(UI)新机器学习课程的开发,并有助于培养未来的大数据分析专业人员。通过出版物、开源软件等传播结果将进一步影响更广泛的影响。该项目通过扩大最先进的随机梯度下降(SGD)方法来解决LSUD-DML的计算挑战。将SGD应用于DML的一个关键计算瓶颈是在每次迭代中将更新后的解投影到一个复杂的可行域中。提出的创新思想在于通过(i)构造和探索低秩结构化随机梯度来降低投影的总成本,以及(ii)将迭代划分为多个epoch并在每个epoch执行一个投影效率高的SGD来减少投影的数量。研究LSUD-DML的数据依赖抽样策略(即,选择性抽样、重要性抽样以及两者的组合)将进一步扩展所提出的方法。本研究将提供关于所提出算法的可扩展性的实验证据,同时揭示对所提出的技术和各种分析权衡的见解。欲了解更多信息,请参阅该项目的网站:http://homepage.cs.uiowa.edu/~tyng/dml.html。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Tianbao Yang其他文献
Evolution of the morphological, structural, and molecular properties of gluten protein in dough with different hydration levels during mixing.
- DOI:
10.1016/j.fochx.2022.100448 - 发表时间:
2022-10-30 - 期刊:
- 影响因子:6.1
- 作者:
Ruobing Jia;Mengli Zhang;Tianbao Yang;Meng Ma;Qingjie Sun;Man Li - 通讯作者:
Man Li
Improved bounds for the Nystrm method with application to kernel classification
改进 Nystr 的界限
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:2.5
- 作者:
Rong Jin;Tianbao Yang;Mehrdad Mahdavi;Yu-Feng Li;Zhi-Hua Zhou - 通讯作者:
Zhi-Hua Zhou
Deep AUC Maximization for Medical Image Classification: Challenges and Opportunities
- DOI:
- 发表时间:
2021-11 - 期刊:
- 影响因子:0
- 作者:
Tianbao Yang - 通讯作者:
Tianbao Yang
Optimizing microgreen cultivation through post-crosslinked alginate-gellan gum hydrogel substrates with enhanced porosity and structural integrity
通过具有增强孔隙率和结构完整性的后交联海藻酸钠 - 结冷胶复合水凝胶基质优化微型蔬菜种植
- DOI:
10.1016/j.ijbiomac.2025.142905 - 发表时间:
2025-05-01 - 期刊:
- 影响因子:8.500
- 作者:
Ella Evensen;Zi Teng;Yimin Mao;Po-Yen Chen;Irma Ortiz;Yang Li;Tianbao Yang;Jorge M. Fonseca;Qin Wang;Yaguang Luo - 通讯作者:
Yaguang Luo
A Robust Zero-Sum Game Framework for Pool-based Active Learning
基于池的主动学习的鲁棒零和博弈框架
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Dixian Zhu;Zhe Li;Xiaoyu Wang;Boqing Gong;Tianbao Yang - 通讯作者:
Tianbao Yang
Tianbao Yang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Tianbao Yang', 18)}}的其他基金
Collaborative Research:SCH:Bimodal Interpretable Multi-Instance Medical-Image Classification
合作研究:SCH:双峰可解释多实例医学图像分类
- 批准号:
2306572 - 财政年份:2023
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
FAI: Advancing Optimization for Threshold-Agnostic Fair AI Systems
FAI:推进与阈值无关的公平人工智能系统的优化
- 批准号:
2147253 - 财政年份:2022
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Robust Deep Learning with Big Imbalanced Data
合作研究:RI:小型:具有大不平衡数据的鲁棒深度学习
- 批准号:
2246756 - 财政年份:2022
- 资助金额:
$ 17.46万 - 项目类别:
Continuing Grant
CAREER: Advancing Constrained and Non-Convex Learning
职业:推进约束和非凸学习
- 批准号:
2246753 - 财政年份:2022
- 资助金额:
$ 17.46万 - 项目类别:
Continuing Grant
FAI: Advancing Optimization for Threshold-Agnostic Fair AI Systems
FAI:推进与阈值无关的公平人工智能系统的优化
- 批准号:
2246757 - 财政年份:2022
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Robust Deep Learning with Big Imbalanced Data
合作研究:RI:小型:具有大不平衡数据的鲁棒深度学习
- 批准号:
2110545 - 财政年份:2021
- 资助金额:
$ 17.46万 - 项目类别:
Continuing Grant
CAREER: Advancing Constrained and Non-Convex Learning
职业:推进约束和非凸学习
- 批准号:
1844403 - 财政年份:2019
- 资助金额:
$ 17.46万 - 项目类别:
Continuing Grant
Collaborative Research: Online Data Stream Fusion and Deep Learning for Virtual Meter in Smart Power Distribution Systems
合作研究:智能配电系统中虚拟电表的在线数据流融合和深度学习
- 批准号:
1933212 - 财政年份:2019
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
BIGDATA: F: New Algorithms of Online Machine Learning for Big Data
BIGDATA:F:大数据在线机器学习的新算法
- 批准号:
1545995 - 财政年份:2015
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
相似国自然基金
全钒液流电池负极V(II)/V(III)电化学氧化还原的催化机理研究
- 批准号:2025JJ50094
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
硅基III-V族亚微米线激光器的光场模式调控与耦合机理研究
- 批准号:JCZRQN202501004
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
吡咯烷生物碱所致肝窦阻塞综合征III区肝损伤的新机制——局部氨代谢紊乱
- 批准号:JCZRYB202500652
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
MXene/nZVI@FH材料微域层界面调控水中砷(III)氧化迁移机制
- 批准号:2025JJ50319
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
HOXC8/OPN/CD44/EGFR轴介导的奥沙利铂耐药性在III期右半结肠癌耐药进展中的研究
- 批准号:2025JJ50694
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
AI结合超声原始射频信号评估Bethesda III/IV类甲状腺肿瘤包膜和血管侵犯研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
硫化砷靶向VPS4B-ESCRT-III调控自噬溶酶体通路逆转三阴性乳腺癌顺铂耐药性的研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
ASPGR与MRC2双受体介导铱(III)配合物
脂质体抗肝肿瘤研究
- 批准号:
- 批准年份:2025
- 资助金额:10.0 万元
- 项目类别:省市级项目
Ap-Exo III 联合模式识别构建降尿酸药
物筛选新方法的研究
- 批准号:
- 批准年份:2025
- 资助金额:10.0 万元
- 项目类别:省市级项目
经关节突截骨矫治III期Kummell病临床有效性分析
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
NEPhos_Phosphoregulation of ESCRT-III during nuclear envelope reformation
NEPhos_ESCRT-III 核膜重构过程中的磷酸调节
- 批准号:
EP/Z00098X/1 - 财政年份:2025
- 资助金额:
$ 17.46万 - 项目类别:
Fellowship
IUCRC Phase III University of Colorado Boulder: Center for Membrane Applications, Science and Technology (MAST)
IUCRC 第三阶段科罗拉多大学博尔德分校:膜应用、科学与技术中心 (MAST)
- 批准号:
2310937 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Continuing Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342498 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
III型分泌装置に依存しない類鼻疽菌の病原性に関与する因子の同定とその機能解析
不依赖于III型分泌器的类鼻疽杆菌致病因子的鉴定及其功能分析
- 批准号:
24K10200 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
III属窒化物半導体のイオン注入不純物活性化機構の解明と点欠陥制御
阐明III族氮化物半导体中的离子注入杂质激活机制和点缺陷控制
- 批准号:
23K21082 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322973 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322974 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
糖転移酵素GnT-IIIによるがんの薬剤耐性の制御とその分子機序の解明
糖基转移酶GnT-III控制癌症耐药性及其分子机制的阐明
- 批准号:
23K27133 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Carrier recombination dynamics in III-N photodetectors
III-N 光电探测器中的载流子复合动力学
- 批准号:
2341747 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342497 - 财政年份:2024
- 资助金额:
$ 17.46万 - 项目类别:
Standard Grant














{{item.name}}会员




