EAGER: Building Language Technologies by Machine Reading Grammars

EAGER:通过机器阅读语法构建语言技术

基本信息

  • 批准号:
    2327143
  • 负责人:
  • 金额:
    $ 9.93万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-06-15 至 2024-05-31
  • 项目状态:
    已结题

项目摘要

Recent years have seen incredible advances in natural language processing (NLP) technologies, which now make it possible to perform numerous tasks through, with, or on language data. However, this progress has been limited to the handful of languages for which abundant data are available, because the neural models that facilitate the recent improvements are particularly data hungry. This work suggests that we should move away from the current data-inefficient learning paradigm, and instead attempt to also model languages by relying on the human mode of describing them: the grammar of each language. Put simply, we will aim to incorporate the grammars of languages, as written by linguists and treated as symbolic knowledge bases, in the process of training neural language models. Specifically, this work will focus on the first step towards this goal, namely extracting the necessary information from grammar descriptions and other linguistic documents. We will explore several alternative modeling approaches, first by relying on retrieval-based models. We will additionally attack the problem through a machine-reading and question-answering framework. Ultimately, the success of these methods will enable the creation of linguistically-informed models, which will in turn facilitate the creation of technologies especially for under-served language communities.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,自然语言处理(NLP)技术的进步令人难以置信,这使得可以通过,使用语言数据执行许多任务成为可能。但是,这种进展仅限于可获得丰富数据的少数语言,因为促进最近改进的神经模型特别饥饿。这项工作表明,我们应该远离当前的数据智能学习范式,而是尝试通过依靠人类描述它们的模式来建模语言:每种语言的语法。简而言之,在培训神经语言模型的过程中,我们将旨在将语言语法(由语言学家撰写并被视为象征性知识基础)结合在一起。具体而言,这项工作将集中在朝着这一目标的第一步上,即从语法描述和其他语言文档中提取必要的信息。我们将首先依靠基于检索的模型来探索几种替代建模方法。我们还将通过机器阅读和提问框架来攻击问题。最终,这些方法的成功将能够创建语言知名的模型,这反过来又可以促进技术的创建,尤其是针对服务不足的语言社区的创建。该奖项反映了NSF的法定任务,并被认为是值得通过基金会的知识分子和更广泛影响的评估审查审查标准来通过评估来获得支持的。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Antonios Anastasopoulos其他文献

Noisy Parallel Data Alignment
嘈杂的并行数据对齐
  • DOI:
    10.48550/arxiv.2301.09685
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ruoyu Xie;Antonios Anastasopoulos
  • 通讯作者:
    Antonios Anastasopoulos
PROBER: A System for Real-time Propaganda Behavior Analytics on Social Media and Web Data Streams
PROBER:社交媒体和网络数据流实时宣传行为分析系统
To token or not to token: A Comparative Study of Text Representations for Cross-Lingual Transfer
标记还是不标记:跨语言迁移文本表示的比较研究
  • DOI:
    10.48550/arxiv.2310.08078
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Md Mushfiqur Rahman;Fardin Ahsan Sakib;FAHIM FAISAL;Antonios Anastasopoulos
  • 通讯作者:
    Antonios Anastasopoulos
Flagging Comprehensibility Issues in Hindi Text with Question Answering
通过问答标记印地语文本中的可理解性问题
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Antonios Anastasopoulos;A. Cattelan;Yi Dou;Marcello Federico;Christian Federman;Dmitriy Genzel;Francisco Guzm'an;Junjie Hu;Sheila Castilho;Stephen Doherty;F. Gaspari;J. Devlin;Ming;Kenton Lee;Natasha Dhawan;I. Subbiah;Benjamin Thompson;Zachary Hildner;Areeba;Eric Prommer;Christian T Sinclair
  • 通讯作者:
    Christian T Sinclair
An Analysis of Source-Side Grammatical Errors in NMT
  • DOI:
    10.18653/v1/w19-4822
  • 发表时间:
    2019-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Antonios Anastasopoulos
  • 通讯作者:
    Antonios Anastasopoulos

Antonios Anastasopoulos的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Antonios Anastasopoulos', 18)}}的其他基金

CCRI: Planning-C: Facilitating Language Technologies for Crisis Response (LT4CR)
CCRI:Planning-C:促进语言技术应对危机(LT4CR)
  • 批准号:
    2234895
  • 财政年份:
    2023
  • 资助金额:
    $ 9.93万
  • 项目类别:
    Standard Grant
Collaborative Research: Language Documentation with an Artificial Intelligence (AI) Helper
协作研究:使用人工智能 (AI) 助手进行语言文档记录
  • 批准号:
    2109578
  • 财政年份:
    2021
  • 资助金额:
    $ 9.93万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: NL(V)P: Natural Language (Variety) Processing
合作研究:RI:小型:NL(V)P:自然语言(品种)处理
  • 批准号:
    2125466
  • 财政年份:
    2021
  • 资助金额:
    $ 9.93万
  • 项目类别:
    Standard Grant

相似国自然基金

自然语言驱动的建筑物室内外一体化矢量模型重建方法
  • 批准号:
    42371457
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
肢体语言表达下的建筑热环境舒适性评价与调控机制研究
  • 批准号:
    52278125
  • 批准年份:
    2022
  • 资助金额:
    54.00 万元
  • 项目类别:
    面上项目
肢体语言表达下的建筑热环境舒适性评价与调控机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于CityGML的三维古建筑语义建模研究
  • 批准号:
    41801295
  • 批准年份:
    2018
  • 资助金额:
    24.8 万元
  • 项目类别:
    青年科学基金项目
顾及建筑室内特征及环境的自适应导航研究
  • 批准号:
    41471324
  • 批准年份:
    2014
  • 资助金额:
    87.0 万元
  • 项目类别:
    面上项目

相似海外基金

Digital building blocks of elementary school foreign language reading motivation
小学外语阅读动机的数字积木
  • 批准号:
    23K25344
  • 财政年份:
    2024
  • 资助金额:
    $ 9.93万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Building AI-Powered Responsible Workforce by Integrating Large Language Models into Computer Science Curriculum
通过将大型语言模型集成到计算机科学课程中,打造人工智能驱动的负责任的劳动力队伍
  • 批准号:
    2336061
  • 财政年份:
    2024
  • 资助金额:
    $ 9.93万
  • 项目类别:
    Standard Grant
Building an Error-Annotated Corpus of Learner Indonesian and Developing an Automated Writing Support for Japanese Students Using Deep Linguistic Indonesian Parsers
建立一个错误注释的印尼语学习者语料库,并使用深度语言印尼语解析器为日本学生开发自动写作支持
  • 批准号:
    23K12235
  • 财政年份:
    2023
  • 资助金额:
    $ 9.93万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Implementing SafeCare Kenya to Reduce Noncommunicable Disease Burden: Building Community Health Workers' Capacity to Support Parents with Young Children
实施 SafeCare Kenya 以减少非传染性疾病负担:建设社区卫生工作者支持有幼儿的父母的能力
  • 批准号:
    10672785
  • 财政年份:
    2023
  • 资助金额:
    $ 9.93万
  • 项目类别:
A next-generation extendable simulation environment for affordable, accurate, and efficient free energy simulations
下一代可扩展模拟环境,可实现经济、准确且高效的自由能源模拟
  • 批准号:
    10638121
  • 财政年份:
    2023
  • 资助金额:
    $ 9.93万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了