CRII: III: Scaling up Distance Metric Learning for Large-scale Ultrahigh-dimensional Data

CRII:III:扩大大规模超高维数据的距离度量学习

基本信息

  • 批准号:
    1463988
  • 负责人:
  • 金额:
    $ 17.46万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-03-01 至 2018-02-28
  • 项目状态:
    已结题

项目摘要

This project is to research and develop highly scalable stochastic optimization algorithms for distance metric learning (DML) for large-scale ultrahigh-dimensional (LSUD) data. DML is a fundamental problem in machine learning aiming to learn a distance metric such that intra-class variation is small and inter-class variation is large. When the scale and dimensionality of data is very large, the computational cost of DML is prohibitive. Domains utilizing machine learning techniques such as computer vision, natural language processing and bioinformatics will be directly impacted by this research. For example, one application is fine-grained image classification, e.g., categorizing different types of flowers or models of vehicles from pictures (this application will be used as one criteria to evaluate success of the research.) The research will enable data scientists to extract more knowledge from massive high-dimensional data complementing the White House BIG DATA Initiative to analyze large and complex data sets. Beyond its research impact, this project will facilitate the development of a new machine learning course at the University of Iowa (UI), and contribute to training future professionals in big data analytics. Broader impact will be further affected by dissemination of results through publications, open-sourced software, etc.This project addresses the computational challenges of LSUD-DML by scaling up the state of the art stochastic gradient descent (SGD) methods. A key computational bottleneck in applying SGD to DML is to project the updated solution into a complicated feasible domain at each iteration. The innovative proposed ideas lie at reducing the total cost of projections by (i) constructing and exploring a low-rank structured stochastic gradient to reduce the cost of projection, and (ii) dividing iterations into epochs and performing a projection-efficient SGD at each epoch to reduce the number of projections. Investigating data-dependent sampling strategies (i.e., selective sampling, importance sampling, and a combination of both) for LSUD-DML will further scale up the proposed methods. This research will provide experimental evidence regarding the scalability of the proposed algorithms while revealing insights into the proposed techniques and various analytical tradeoffs.For further information see the project web site at: http://homepage.cs.uiowa.edu/~tyng/dml.html.
本项目旨在研究和开发用于大规模超高维(LSUD)数据的距离度量学习(DML)的高度可扩展的随机优化算法。DML是机器学习中的一个基本问题,旨在学习一个距离度量,使得类内变化很小,类间变化很大。 当数据的规模和维数非常大时,DML的计算成本是令人望而却步的。利用机器学习技术的领域,如计算机视觉、自然语言处理和生物信息学,将直接受到这项研究的影响。例如,一个应用是细粒度图像分类,例如,从图片中分类不同类型的花或车辆模型(此应用程序将用作评估研究成功的标准之一)。该研究将使数据科学家能够从大量高维数据中提取更多知识,补充白宫大数据计划,以分析大型复杂的数据集。除了研究影响外,该项目还将促进爱荷华州大学(UI)新机器学习课程的开发,并有助于培训未来的大数据分析专业人员。通过出版物、开源软件等传播结果将进一步影响更广泛的影响。该项目通过扩大最先进的随机梯度下降(SGD)方法来解决LSUD-DML的计算挑战。SGD应用于DML的一个关键计算瓶颈是在每次迭代时将更新的解投影到一个复杂的可行域中。提出的创新思想在于通过以下方式降低投影的总成本:(i)构建和探索低秩结构化随机梯度以降低投影成本,以及(ii)将迭代划分为历元并在每个历元执行投影有效的SGD以减少投影的数量。调查依赖数据的抽样策略(即,选择性采样、重要性采样以及两者的组合)将进一步扩展所提出的方法。这项研究将提供有关所提出的算法的可扩展性的实验证据,同时揭示对所提出的技术和各种分析权衡的见解。http://homepage.cs.uiowa.edu/~tyng/dml.html

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Tianbao Yang其他文献

Evolution of the morphological, structural, and molecular properties of gluten protein in dough with different hydration levels during mixing.
  • DOI:
    10.1016/j.fochx.2022.100448
  • 发表时间:
    2022-10-30
  • 期刊:
  • 影响因子:
    6.1
  • 作者:
    Ruobing Jia;Mengli Zhang;Tianbao Yang;Meng Ma;Qingjie Sun;Man Li
  • 通讯作者:
    Man Li
Improved bounds for the Nystrm method with application to kernel classification
改进 Nystr 的界限
Deep AUC Maximization for Medical Image Classification: Challenges and Opportunities
  • DOI:
  • 发表时间:
    2021-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tianbao Yang
  • 通讯作者:
    Tianbao Yang
Optimizing microgreen cultivation through post-crosslinked alginate-gellan gum hydrogel substrates with enhanced porosity and structural integrity
通过具有增强孔隙率和结构完整性的后交联海藻酸钠 - 结冷胶复合水凝胶基质优化微型蔬菜种植
  • DOI:
    10.1016/j.ijbiomac.2025.142905
  • 发表时间:
    2025-05-01
  • 期刊:
  • 影响因子:
    8.500
  • 作者:
    Ella Evensen;Zi Teng;Yimin Mao;Po-Yen Chen;Irma Ortiz;Yang Li;Tianbao Yang;Jorge M. Fonseca;Qin Wang;Yaguang Luo
  • 通讯作者:
    Yaguang Luo
A Robust Zero-Sum Game Framework for Pool-based Active Learning
基于池的主动学习的鲁棒零和博弈框架

Tianbao Yang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Tianbao Yang', 18)}}的其他基金

Collaborative Research:SCH:Bimodal Interpretable Multi-Instance Medical-Image Classification
合作研究:SCH:双峰可解释多实例医学图像分类
  • 批准号:
    2306572
  • 财政年份:
    2023
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
FAI: Advancing Optimization for Threshold-Agnostic Fair AI Systems
FAI:推进与阈值无关的公平人工智能系统的优化
  • 批准号:
    2147253
  • 财政年份:
    2022
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Robust Deep Learning with Big Imbalanced Data
合作研究:RI:小型:具有大不平衡数据的鲁棒深度学习
  • 批准号:
    2246756
  • 财政年份:
    2022
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Continuing Grant
CAREER: Advancing Constrained and Non-Convex Learning
职业:推进约束和非凸学习
  • 批准号:
    2246753
  • 财政年份:
    2022
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Continuing Grant
FAI: Advancing Optimization for Threshold-Agnostic Fair AI Systems
FAI:推进与阈值无关的公平人工智能系统的优化
  • 批准号:
    2246757
  • 财政年份:
    2022
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Robust Deep Learning with Big Imbalanced Data
合作研究:RI:小型:具有大不平衡数据的鲁棒深度学习
  • 批准号:
    2110545
  • 财政年份:
    2021
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Continuing Grant
CAREER: Advancing Constrained and Non-Convex Learning
职业:推进约束和非凸学习
  • 批准号:
    1844403
  • 财政年份:
    2019
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Continuing Grant
Collaborative Research: Online Data Stream Fusion and Deep Learning for Virtual Meter in Smart Power Distribution Systems
合作研究:智能配电系统中虚拟电表的在线数据流融合和深度学习
  • 批准号:
    1933212
  • 财政年份:
    2019
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
BIGDATA: F: New Algorithms of Online Machine Learning for Big Data
BIGDATA:F:大数据在线机器学习的新算法
  • 批准号:
    1545995
  • 财政年份:
    2015
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant

相似国自然基金

全钒液流电池负极V(II)/V(III)电化学氧化还原的催化机理研究
  • 批准号:
    2025JJ50094
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
吡咯烷生物碱所致肝窦阻塞综合征III区肝损伤的新机制——局部氨代谢紊乱
  • 批准号:
    JCZRYB202500652
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
硅基III-V族亚微米线激光器的光场模式调控与耦合机理研究
  • 批准号:
    JCZRQN202501004
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
MXene/nZVI@FH材料微域层界面调控水中砷(III)氧化迁移机制
  • 批准号:
    2025JJ50319
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
HOXC8/OPN/CD44/EGFR轴介导的奥沙利铂耐药性在III期右半结肠癌耐药进展中的研究
  • 批准号:
    2025JJ50694
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
AI结合超声原始射频信号评估Bethesda III/IV类甲状腺肿瘤包膜和血管侵犯研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
硫化砷靶向VPS4B-ESCRT-III调控自噬溶酶体通路逆转三阴性乳腺癌顺铂耐药性的研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
ASPGR与MRC2双受体介导铱(III)配合物 脂质体抗肝肿瘤研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Ap-Exo III 联合模式识别构建降尿酸药 物筛选新方法的研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
经关节突截骨矫治III期Kummell病临床有效性分析
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

NEPhos_Phosphoregulation of ESCRT-III during nuclear envelope reformation
NEPhos_ESCRT-III 核膜重构过程中的磷酸调节
  • 批准号:
    EP/Z00098X/1
  • 财政年份:
    2025
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Fellowship
IUCRC Phase III University of Colorado Boulder: Center for Membrane Applications, Science and Technology (MAST)
IUCRC 第三阶段科罗拉多大学博尔德分校:膜应用、科学与技术中心 (MAST)
  • 批准号:
    2310937
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Continuing Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
  • 批准号:
    2342498
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
III属窒化物半導体のイオン注入不純物活性化機構の解明と点欠陥制御
阐明III族氮化物半导体中的离子注入杂质激活机制和点缺陷控制
  • 批准号:
    23K21082
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
III型分泌装置に依存しない類鼻疽菌の病原性に関与する因子の同定とその機能解析
不依赖于III型分泌器的类鼻疽杆菌致病因子的鉴定及其功能分析
  • 批准号:
    24K10200
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Carrier recombination dynamics in III-N photodetectors
III-N 光电探测器中的载流子复合动力学
  • 批准号:
    2341747
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
  • 批准号:
    2342497
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
IUCRC Phase III Virginia Institute of Marine Science for Science Center for Marine Fisheries (SCEMFIS)
IUCRC 第三阶段 弗吉尼亚海洋科学研究所海洋渔业科学中心 (SCEMFIS)
  • 批准号:
    2332984
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Continuing Grant
III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
  • 批准号:
    2420691
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
III: Small: Query-By-Sketch: Simplifying Video Clip Retrieval Through A Visual Query Paradigm
III:小:按草图查询:通过可视化查询范式简化视频剪辑检索
  • 批准号:
    2335881
  • 财政年份:
    2024
  • 资助金额:
    $ 17.46万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了