Collaborative Research: RI:Medium:MoDL:Mathematical and Conceptual Understanding of Large Language Models

合作研究:RI:Medium:MoDL:大型语言模型的数学和概念理解

基本信息

  • 批准号:
    2211779
  • 负责人:
  • 金额:
    $ 80万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-10-01 至 2025-09-30
  • 项目状态:
    未结题

项目摘要

Large language models (LLMs) have achieved unprecedented success in natural language processing (NLP). Since language models are being seen as a cornerstone of artificial intelligence in the near future, there is a need to be able to understand them, and to convey that understanding to regulators as well as the general public. These models are based on deep neural networks that are trained from vast quantities of text and have been demonstrated to be highly useful in performing tasks such as question answering, text classification, machine translation and summarization. Despite the huge empirical success, there is little understanding about their inner workings. This project seeks to bridge the gap by developing conceptual and mathematical understanding about training and using LLMs. The project will advance such understanding. The project will also seek to develop and disseminate instructional materials and draw on ideas from the project to impact ongoing programs at their institution to help increase participation in computing by individuals from underrepresented groups. The project has three components. (1) We will first build simplified generative models that capture the intrinsic structures of text, and analyze language models that are trained on texts from such generative models. (2) We then analyze why the learned language models can encode useful information that helps a wide range of downstream tasks. (3) Finally, we analyze and design new adaptation methods for downstream tasks with quantitative sample and computational efficiency guarantees. Education and outreach plans are integrated into this project: the investigators will develop a new introductory course in machine learning and disseminate instructional materials, mentor graduate and undergraduate students from underrepresented groups (through Princeton Freshman Scholars Institute, Stanford Summer Teacher Research Program, REU’s) and organize research workshops to promote conversations between the theoretical machine learning and NLP community.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
大型语言模型(LLM)在自然语言处理(NLP)中取得了前所未有的成功。由于语言模型在不久的将来被视为人工智能的基石,因此需要能够理解它们,并将这种理解传达给监管机构和公众。这些模型基于深度神经网络,这些网络是从大量文本中训练出来的,并且已经被证明在执行问答、文本分类、机器翻译和摘要等任务时非常有用。尽管在经验上取得了巨大的成功,但人们对它们的内部运作却知之甚少。该项目旨在通过发展有关培训和使用LLM的概念和数学理解来弥合差距。该项目将促进这种理解。该项目还将寻求开发和传播教学材料,并利用该项目的想法来影响其机构正在进行的项目,以帮助提高代表性不足群体的个人对计算的参与。该项目有三个组成部分。(1)我们将首先构建简化的生成模型,以捕获文本的内在结构,并分析在这些生成模型的文本上训练的语言模型。(2)然后,我们分析了为什么学习的语言模型可以编码有用的信息,帮助广泛的下游任务。(3)最后,我们分析和设计了新的适应方法的下游任务的定量样本和计算效率的保证。教育和外联计划被纳入该项目:研究人员将开发一门新的机器学习入门课程,分发教学材料,指导来自代表性不足群体的研究生和本科生(通过普林斯顿大学新生学者研究所、斯坦福大学暑期教师研究项目、REU's)并组织研究研讨会,以促进理论机器学习和NLP社区之间的对话。该奖项反映了NSF的法定基金会的使命是履行其使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评价,被认为值得支持。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Kernel-Based View of Language Model Fine-Tuning
  • DOI:
    10.48550/arxiv.2210.05643
  • 发表时间:
    2022-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sadhika Malladi;Alexander Wettig;Dingli Yu;Danqi Chen;Sanjeev Arora
  • 通讯作者:
    Sadhika Malladi;Alexander Wettig;Dingli Yu;Danqi Chen;Sanjeev Arora
What In-Context Learning “Learns” In-Context: Disentangling Task Recognition and Task Learning
情境学习——学习什么——情境中:解开任务识别和任务学习
  • DOI:
    10.18653/v1/2023.findings-acl.527
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Pan, Jane;Gao, Tianyu;Chen, Howard;Chen, Danqi
  • 通讯作者:
    Chen, Danqi
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sanjeev Arora其他文献

Acceso a la asistencia: Manejo de la infección por el virus de la hepatitis C en lugares remotos
获取帮助: 丙型肝炎病毒感染的说明
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sanjeev Arora;Karla Thornton;Andrea Bradford
  • 通讯作者:
    Andrea Bradford
Project ECHO for Cancer Care: a Scoping Review of Provider Outcome Evaluations
癌症护理 ECHO 项目:对提供者结果评估的范围审查
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Sanjeev Arora;Heidi Rishel Brakey;Jessica L Jones;Nancy Hood;Jesus E. Fuentes;Lucca Cirolia
  • 通讯作者:
    Lucca Cirolia
Polynomial time approximation schemes for Euclidean TSP and other geometric problems
Computational Complexity and Information Asymmetry in Financial Products (Extended Abstract)
金融产品中的计算复杂性和信息不对称(扩展摘要)
Keeping LLMs Aligned After Fine-tuning: The Crucial Role of Prompt Templates
微调后保持法学硕士的一致性:提示模板的关键作用
  • DOI:
    10.48550/arxiv.2402.18540
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kaifeng Lyu;Haoyu Zhao;Xinran Gu;Dingli Yu;Anirudh Goyal;Sanjeev Arora
  • 通讯作者:
    Sanjeev Arora

Sanjeev Arora的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sanjeev Arora', 18)}}的其他基金

AF: Large: Collaborative Research: Nonconvex Methods and Models for Learning: Toward Algorithms with Provable and Interpretable Guarantees
AF:大型:协作研究:非凸学习方法和模型:具有可证明和可解释保证的算法
  • 批准号:
    1704860
  • 财政年份:
    2017
  • 资助金额:
    $ 80万
  • 项目类别:
    Continuing Grant
AF: Small: Linear Algebra++ and applications to machine learning
AF:小:线性代数及其在机器学习中的应用
  • 批准号:
    1527371
  • 财政年份:
    2015
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
AF: Medium: Towards Provable Bounds for Machine Learning
AF:中:迈向机器学习的可证明界限
  • 批准号:
    1302518
  • 财政年份:
    2013
  • 资助金额:
    $ 80万
  • 项目类别:
    Continuing Grant
AF: Small: Expansion, Unique Games, and Efficient Algorithms
AF:小:扩展、独特的游戏和高效的算法
  • 批准号:
    1117309
  • 财政年份:
    2011
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
New Directions in Semidefinite Programming and Approximation
半定规划和逼近的新方向
  • 批准号:
    0830673
  • 财政年份:
    2008
  • 资助金额:
    $ 80万
  • 项目类别:
    Continuing Grant
Collaborative Research: Understanding, Coping with, and Benefiting from Intractibility.
合作研究:理解、应对棘手问题并从中受益。
  • 批准号:
    0832797
  • 财政年份:
    2008
  • 资助金额:
    $ 80万
  • 项目类别:
    Continuing Grant
New directions in Approximation Algorithms for NP-hard problems
NP 难题近似算法的新方向
  • 批准号:
    0514993
  • 财政年份:
    2005
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: MSPA-MCS: Embeddings of Finite Metric Spaces - A Geometric Approach to Efficient Algorithms
合作研究:MSPA-MCS:有限度量空间的嵌入 - 高效算法的几何方法
  • 批准号:
    0528414
  • 财政年份:
    2005
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
ITR: New directions in clustering and learning
ITR:聚类和学习的新方向
  • 批准号:
    0205594
  • 财政年份:
    2002
  • 资助金额:
    $ 80万
  • 项目类别:
    Continuing Grant
Approximation of NP-Hard Problems: Algorithms and Complexity
NP 难问题的近似:算法和复杂性
  • 批准号:
    0098180
  • 财政年份:
    2001
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant

相似国自然基金

Research on Quantum Field Theory without a Lagrangian Description
  • 批准号:
    24ZR1403900
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Cell Research
  • 批准号:
    31224802
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research
  • 批准号:
    31024804
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research (细胞研究)
  • 批准号:
    30824808
  • 批准年份:
    2008
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
  • 批准号:
    10774081
  • 批准年份:
    2007
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312841
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312842
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313151
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312840
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: CompCog: RI: Medium: Understanding human planning through AI-assisted analysis of a massive chess dataset
合作研究:CompCog:RI:中:通过人工智能辅助分析海量国际象棋数据集了解人类规划
  • 批准号:
    2312374
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: CompCog: RI: Medium: Understanding human planning through AI-assisted analysis of a massive chess dataset
合作研究:CompCog:RI:中:通过人工智能辅助分析海量国际象棋数据集了解人类规划
  • 批准号:
    2312373
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232055
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了