CompCog: RI: Small: Human-like semantic grammar induction through knowledge distillation from pre-trained language models
CompCog:RI:Small:通过预训练语言模型的知识蒸馏进行类人语义语法归纳
基本信息
- 批准号:2313140
- 负责人:
- 金额:$ 48.45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-09-01 至 2026-08-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Human languages are thought to allow for an unbounded set of possible meanings to be expressed using bounded sets of rules, called grammars. These grammars assign meanings to words and compose meanings of words and phrases into larger phrases and clauses. Humans can communicate extremely precise descriptions of goals and world behaviors—and linguists know much about the logical structure of language involved in this kind of precise communication—but one of the central open questions in linguistics is how humans acquire these mechanisms. Computational models of how these grammars are learned from recorded or transcribed utterances can provide evidence that this learning can be accomplished by children without substantial innate biological biases, and these models can also provide automated tools for analysis and documentation of endangered languages, including many Indigenous American languages. Existing statistical and neural grammar learning methods can induce grammars from sentences in text corpora that predict about half of the phrases and clauses annotated by linguists; howevert this level of performance is nowhere near the accuracy of human language learners, and attempts to support this learning using image and video data have not substantially improved induction accuracy. The proposed work will instead extract statistics about logical predicates from large commercially available neural language models as a surrogate for human world knowledge so as to improve the accuracy of grammar induction.The proposed work will develop the first broad-coverage semantic grammar induction model that integrates world knowledge into the acquisition process by distilling it from large pre-trained neural language models. The world knowledge implicit in the large language models will be distilled into a matrix of predicate co-occurrence statistics using argument-specific prompts. The resulting predicate co-occurrence statistics will make no distinction between, for example, active and passive sentences, topicalized and non-topicalized sentences, or declarative and subject-auxiliary inverted sentences. This model will be used to evaluate claims about the statistical learnability of grammar. The proposed work will also continue work on developing resources for evaluating these structural models. The model and corpora collected as part of this project will be freely distributed on both university and external websites.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
人类语言被认为允许使用有限的规则集(称为语法)来表达无限的可能含义集。这些语法为单词赋予意义,并将单词和短语的意义组成更大的短语和分句。人类可以对目标和世界行为进行极其精确的描述——语言学家对这种精确交流所涉及的语言逻辑结构了解甚多——但语言学中一个悬而未决的核心问题是人类是如何获得这些机制的。这些语法是如何从记录或转录的话语中学习的计算模型可以提供证据,证明这种学习可以由儿童完成,而不存在重大的先天生物偏见,这些模型还可以为濒危语言(包括许多美洲土著语言)的分析和记录提供自动化工具。现有的统计和神经语法学习方法可以从文本语料库中的句子中归纳出语法,预测语言学家注释的大约一半的短语和分句;然而,这种表现水平与人类语言学习者的准确性相差甚远,并且尝试使用图像和视频数据来支持这种学习并没有实质性地提高归纳准确性。提议的工作将从大型商业可用的神经语言模型中提取有关逻辑谓词的统计数据,作为人类世界知识的替代品,从而提高语法归纳的准确性。提出的工作将开发第一个广泛覆盖的语义语法归纳模型,通过从大型预训练的神经语言模型中提取世界知识,将其集成到获取过程中。大型语言模型中隐含的世界知识将使用特定于参数的提示提取到谓词共现统计的矩阵中。结果谓词共现统计不会区分主动句和被动句、主题化句和非主题化句,或者陈述句和主辅助倒装句。该模型将用于评估关于语法统计可学习性的主张。拟议的工作还将继续为评估这些结构模型开发资源。作为这个项目的一部分,收集的模型和语料库将免费发布在大学和外部网站上。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
William Schuler其他文献
Parameterized Action Representation and Natural Language Instructions for Dynamic Behavior Modification of Embodied Agents
用于具体代理动态行为修改的参数化动作表示和自然语言指令
- DOI:
- 发表时间:
2000 - 期刊:
- 影响因子:0
- 作者:
N. Badler;R. Bindiganavale;J. Allbeck;William Schuler;Liwei Zhao;Seung;Hogeun Shin;Martha Palmer - 通讯作者:
Martha Palmer
Incremental Semantic Dependency Parsing
增量语义依存解析
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Marten van Schijndel;William Schuler - 通讯作者:
William Schuler
Analyzing complex human sentence processing dynamics with CDRNNs
使用 CDRNN 分析复杂的人类句子处理动态
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Cory Shain;William Schuler - 通讯作者:
William Schuler
Multi-Component TAG and Notions of Formal Power
多成分标签和形式权力的概念
- DOI:
- 发表时间:
2000 - 期刊:
- 影响因子:0
- 作者:
William Schuler;David Chiang;M. Dras - 通讯作者:
M. Dras
Toward a Psycholinguistically-Motivated Model of Language Processing
走向心理语言学驱动的语言处理模型
- DOI:
10.3115/1599081.1599180 - 发表时间:
2008 - 期刊:
- 影响因子:3.8
- 作者:
William Schuler;S. Abdelrahman;Timothy Miller;Lane Schwartz - 通讯作者:
Lane Schwartz
William Schuler的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('William Schuler', 18)}}的其他基金
RI: Small:Comp Cog: Broad-coverage semantic models of human sentence processing
RI:Small:Comp Cog:人类句子处理的广泛覆盖语义模型
- 批准号:
1816891 - 财政年份:2018
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
EAGER: Incremental Semantic Sentence Processing Models
EAGER:增量语义句子处理模型
- 批准号:
1551313 - 财政年份:2015
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
CAREER: Integrating denotational meaning into probabilistic language models
职业:将指称意义整合到概率语言模型中
- 批准号:
0447685 - 财政年份:2005
- 资助金额:
$ 48.45万 - 项目类别:
Continuing Grant
相似国自然基金
醒脑静多靶点调控PI3K/Akt通路抑制CI/RI氧化应激—基于网络药理学及体内、外实验研究
- 批准号:2025JJ90117
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
IgA-FcαRI介导的Syk/NLRP3/caspase-1通路在线状IgA大疱性皮病
中的机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于双修饰ANG-RNH1系统阻抑RI复合物生成机制建立口腔黏膜等效物血管化稳态
- 批准号:82401112
- 批准年份:2024
- 资助金额:30 万元
- 项目类别:青年科学基金项目
跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
- 批准号:82301120
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
- 批准号:82374375
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
- 批准号:82300022
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
nCs通过TβRI结合并磷酸化Axin促进颌骨成骨反应的作用及机制研究
- 批准号:2022J011347
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于 FcεRI 信号通路介导的肥大细胞脱颗粒过程研究支气管哮喘的机制及中药干预
- 批准号:2022JJ70115
- 批准年份:2022
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
RI: Small: Understanding Hand Interaction In The Jumble of Internet Videos
RI:小:在混乱的互联网视频中理解手部交互
- 批准号:
2426592 - 财政年份:2024
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313131 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
Travel: RI: Small: Student Travel Grant for 20th International Conference on Principles of Knowledge Representation and Reasoning and Doctoral Consortium
旅费:RI:小额:第 20 届知识表示和推理原理及博士联盟国际会议学生旅费补助
- 批准号:
2328173 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
- 批准号:
2345528 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:
2232298 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2232055 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
RI: Small: Large-Scale Game-Theoretic Reasoning with Incomplete Information
RI:小型:不完整信息的大规模博弈论推理
- 批准号:
2214141 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
CISE-ANR: RI: Small: Numerically efficient reinforcement learning for constrained systems with super-linear convergence (NERL)
CISE-ANR:RI:小:具有超线性收敛 (NERL) 的约束系统的数值高效强化学习
- 批准号:
2315396 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
RI: Small: The Surprising Power of Sequential Fair Allocation Mechanisms
RI:小:顺序公平分配机制的惊人力量
- 批准号:
2327057 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2232054 - 财政年份:2023
- 资助金额:
$ 48.45万 - 项目类别:
Standard Grant