III: Small: Go Beyond Short-term Dependency and Homogeneity: A General-Purpose Transformer Recipe for Multi-Domain Heterogeneous Sequential Data Analysis

III:小:超越短期依赖性和同质性:用于多域异构顺序数据分析的通用 Transformer 配方

基本信息

  • 批准号:
    2008334
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Sequential data are ubiquitous in domains including healthcare, cyber security, social science, and online search and recommendation systems. Deep learning techniques have recently demonstrated tremendous successes in sequential data analysis tasks, such as sequential prediction, and text understanding, and times series classification and clustering. However, modern sequential data created from many domains are becoming ever more massive, complex, and domain-specific. When handling such complex and multi-domain sequential data, existing deep learning methods are limited in capturing long-term dependency and generalizing to multiple domains. To bridge such a gap, this project will develop principled algorithms and methodologies that can handle data heterogeneity and long-term dependencies for analyzing complex and multi-domain sequential data. The proposed framework will be generic to various types of sequential data including human language, time series, and trajectory data. It will open new possibilities of enabling deep learning techniques for more challenging sequential data analysis applications in social network analysis, clinical care, smart transportation, text mining, and natural language processing.The proposed framework leverages the popular transformer architecture and incorporates multi-domain adaptation to handle the data heterogeneity. Specifically, this project aims to develop (i) unsupervised learning techniques for transformer-based multi-domain point process analysis, (ii) transformer-based metric learning techniques that enable large-scale and multi-domain time series analysis, and (iii) techniques for robust and efficient domain transfer learning over pre-trained transformers. The developed techniques will enjoy both computational efficiency and modeling flexibility of capturing long-term dependency and data heterogeneity, by addressing the computational and statistical challenges for these problems. The proposed research will also deliver open-source software in the form of easy-to-use libraries, which facilitate researchers and practitioners in related fields to analyze complex sequential data.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
序列数据在医疗保健、网络安全、社会科学以及在线搜索和推荐系统等领域无处不在。最近,深度学习技术在序列数据分析任务中取得了巨大的成功,例如序列预测、文本理解以及时间序列分类和聚类。然而,从许多领域创建的现代顺序数据正变得越来越海量、复杂和特定于领域。在处理这种复杂的、多领域的时序数据时,现有的深度学习方法在捕捉长期依赖关系和推广到多领域方面存在局限性。为了弥补这一差距,该项目将开发能够处理数据异构性和长期依赖关系的原则性算法和方法,以分析复杂和多领域的顺序数据。所提出的框架将适用于各种类型的序列数据,包括人类语言、时间序列和轨迹数据。它将为社交网络分析、临床护理、智能交通、文本挖掘和自然语言处理中更具挑战性的序列数据分析应用提供深度学习技术的新可能性。具体地说,该项目旨在开发(I)用于基于变压器的多域点过程分析的无监督学习技术,(Ii)基于变压器的度量学习技术,以实现大规模和多域时间序列分析,以及(Iii)用于对预先训练的变压器进行稳健和高效的域转移学习的技术。通过解决这些问题的计算和统计挑战,所开发的技术将享受捕捉长期相关性和数据异构性的计算效率和建模灵活性。这项拟议的研究还将以易于使用的库的形式提供开源软件,以方便相关领域的研究人员和从业者分析复杂的序列数据。这一奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(22)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Differentiable Top-k Operator with Optimal Transport
  • DOI:
  • 发表时间:
    2020-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yujia Xie;H. Dai;Minshuo Chen;Bo Dai;T. Zhao;H. Zha;Wei Wei-Wei;Tomas Pfister
  • 通讯作者:
    Yujia Xie;H. Dai;Minshuo Chen;Bo Dai;T. Zhao;H. Zha;Wei Wei-Wei;Tomas Pfister
DyGen: Learning from Noisy Labels via Dynamics-Enhanced Generative Modeling
Why Do Deep Residual Networks Generalize Better than Deep Feedforward Networks? - A Neural Tangent Kernel Perspective
  • DOI:
  • 发表时间:
    2020-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kaixuan Huang;Yuqing Wang-;Molei Tao;T. Zhao
  • 通讯作者:
    Kaixuan Huang;Yuqing Wang-;Molei Tao;T. Zhao
Transfer Learning of Graph Neural Networks with Ego-graph Information Maximization
  • DOI:
  • 发表时间:
    2020-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Qi Zhu;Yidan Xu;Haonan Wang-;Chao Zhang;Jiawei Han;Carl Yang
  • 通讯作者:
    Qi Zhu;Yidan Xu;Haonan Wang-;Chao Zhang;Jiawei Han;Carl Yang
BERTifying Hidden Markov Models for Multi-Source Weakly Supervised Named Entity Recognition
BERT 化隐马尔可夫模型以实现多源弱监督命名实体识别
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Tuo Zhao其他文献

Learning explainable task-relevant state representation for model-free deep reinforcement learning
  • DOI:
    10.1016/j.neunet.2024.106741
  • 发表时间:
    2024-12-01
  • 期刊:
  • 影响因子:
  • 作者:
    Tingting Zhao;Guixi Li;Tuo Zhao;Yarui Chen;Ning Xie;Gang Niu;Masashi Sugiyama
  • 通讯作者:
    Masashi Sugiyama
Effects of different mixed ratio of maize straw and cabbage wastes on silage quality
Ensemble Acoustic Modeling for CD-DNN-HMM Using Random Forests of Phonetic Decision Trees
使用语音决策树随机森林的 CD-DNN-HMM 集成声学建模
TDOA Estimation of Speech Source in Noisy Reverberant Environments
噪声混响环境中语音源的 TDOA 估计
Methodology for optimal parametrization of the Polymer Membrane Fuel Cell based on Elman Neural Network method and Quantum Water Strider Algorithm
  • DOI:
    10.1016/j.egyr.2021.04.058
  • 发表时间:
    2021-11-01
  • 期刊:
  • 影响因子:
  • 作者:
    Kai Sun;Tuo Zhao;Zhaolin Li;Lu Wang;Ruichen Wang;Xijie Chen;Qing Yang;Ehsan Ramezani
  • 通讯作者:
    Ehsan Ramezani

Tuo Zhao的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Tuo Zhao', 18)}}的其他基金

RI: Small: Taming Massive Pre-trained Models under Label Scarcity via an Optimization Lens
RI:小型:通过优化镜头在标签稀缺的情况下驯服大量预训练模型
  • 批准号:
    2226152
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Topics in Temporal Marked Point Processes: Granger Causality, Imperfect Observations and Intervention
III:小:时间标记点过程的主题:格兰杰因果关系、不完美观察和干预
  • 批准号:
    1717916
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
  • 批准号:
    2342833
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
  • 批准号:
    2343062
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
  • 批准号:
    24K13443
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了