Collaborative Research: RI: Small: NL(V)P: Natural Language (Variety) Processing
合作研究:RI:小型:NL(V)P:自然语言(品种)处理
基本信息
- 批准号:2125466
- 负责人:
- 金额:$ 16.6万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
No language is a monolith. Languages vary richly across countries, regions, social classes, and other factors. Despite recent advances in natural language processing (NLP) technology for translating between languages, answering questions, or engaging in simple conversations, current approaches have largely focused only on "standard" varieties of languages. By ignoring other varieties, treating them essentially as statistical noise, current technologies neglect the millions of people who speak these varieties. This project is creating ways to enable language technologies such as translation and question-answering systems, both to process and to generate fine-grained language varieties. The team will develop computational methods to automatically recognize features of different language varieties and then create approaches for integrating such linguistic information into the models powering language technologies. Additionally, the team will design methods to adapt models into varieties for which minimal training data may be available. The resulting suite of general methods will benefit diverse communities and less-privileged populations that speak underserved languages and varieties.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
没有一种语言是铁板一块。语言因国家、地区、社会阶层和其他因素的不同而有很大差异。尽管用于在语言之间进行翻译、回答问题或进行简单对话的自然语言处理(NLP)技术最近取得了进展,但目前的方法主要集中在语言的“标准”变体上。通过忽略其他变体,将它们本质上视为统计噪音,当前的技术忽视了数百万说这些变体的人。该项目正在创造各种方法,使翻译和问答系统等语言技术能够处理和生成细粒度的语言变体。该团队将开发计算方法,自动识别不同语言变体的特征,然后创建方法,将这些语言信息整合到为语言技术提供动力的模型中。此外,该团队将设计方法,使模型适应可获得最少训练数据的品种。由此产生的一套通用方法将使说服务不足的语言和各种语言的不同社区和较少特权的人口受益。这一奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Dataset Geography: Mapping Language Data to Language Users
- DOI:10.18653/v1/2022.acl-long.239
- 发表时间:2021-12
- 期刊:
- 影响因子:0
- 作者:FAHIM FAISAL;Yinkai Wang;Antonios Anastasopoulos
- 通讯作者:FAHIM FAISAL;Yinkai Wang;Antonios Anastasopoulos
SD-QA: Spoken Dialectal Question Answering for the Real World
SD-QA:现实世界的口语方言问答
- DOI:10.18653/v1/2021.findings-emnlp.281
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Faisal, Fahim;Keshava, Sharlina;Alam, Md Mahfuz;Anastasopoulos, Antonios
- 通讯作者:Anastasopoulos, Antonios
Machine Translation into Low-resource Language Varieties
- DOI:10.18653/v1/2021.acl-short.16
- 发表时间:2021-06
- 期刊:
- 影响因子:0
- 作者:Sachin Kumar;Antonios Anastasopoulos;S. Wintner;Yulia Tsvetkov
- 通讯作者:Sachin Kumar;Antonios Anastasopoulos;S. Wintner;Yulia Tsvetkov
GMU Systems for the IWSLT 2023 Dialect and Low-resource Speech Translation Tasks
用于 IWSLT 2023 方言和低资源语音翻译任务的 GMU 系统
- DOI:10.18653/v1/2023.iwslt-1.24
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Mbuya, Jonathan;Anastasopoulos, Antonios
- 通讯作者:Anastasopoulos, Antonios
Evaluating the Morphosyntactic Well-formedness of Generated Texts
- DOI:10.18653/v1/2021.emnlp-main.570
- 发表时间:2021-03
- 期刊:
- 影响因子:0
- 作者:Adithya Pratapa;Antonios Anastasopoulos;Shruti Rijhwani;Aditi Chaudhary;David R. Mortensen;Graham Neubig;Yulia Tsvetkov
- 通讯作者:Adithya Pratapa;Antonios Anastasopoulos;Shruti Rijhwani;Aditi Chaudhary;David R. Mortensen;Graham Neubig;Yulia Tsvetkov
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Antonios Anastasopoulos其他文献
PROBER: A System for Real-time Propaganda Behavior Analytics on Social Media and Web Data Streams
PROBER:社交媒体和网络数据流实时宣传行为分析系统
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Yasas Senarath;Antonios Anastasopoulos;Tonya Thornton;Hemant Purohit - 通讯作者:
Hemant Purohit
Noisy Parallel Data Alignment
嘈杂的并行数据对齐
- DOI:
10.48550/arxiv.2301.09685 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Ruoyu Xie;Antonios Anastasopoulos - 通讯作者:
Antonios Anastasopoulos
Flagging Comprehensibility Issues in Hindi Text with Question Answering
通过问答标记印地语文本中的可理解性问题
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Antonios Anastasopoulos;A. Cattelan;Yi Dou;Marcello Federico;Christian Federman;Dmitriy Genzel;Francisco Guzm'an;Junjie Hu;Sheila Castilho;Stephen Doherty;F. Gaspari;J. Devlin;Ming;Kenton Lee;Natasha Dhawan;I. Subbiah;Benjamin Thompson;Zachary Hildner;Areeba;Eric Prommer;Christian T Sinclair - 通讯作者:
Christian T Sinclair
To token or not to token: A Comparative Study of Text Representations for Cross-Lingual Transfer
标记还是不标记:跨语言迁移文本表示的比较研究
- DOI:
10.48550/arxiv.2310.08078 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Md Mushfiqur Rahman;Fardin Ahsan Sakib;FAHIM FAISAL;Antonios Anastasopoulos - 通讯作者:
Antonios Anastasopoulos
Language and Speech Technology for Central Kurdish Varieties
中部库尔德语品种的语言和语音技术
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Sina Ahmadi;Daban Q. Jaff;Md Mahfuz Ibn Alam;Antonios Anastasopoulos - 通讯作者:
Antonios Anastasopoulos
Antonios Anastasopoulos的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Antonios Anastasopoulos', 18)}}的其他基金
EAGER: Building Language Technologies by Machine Reading Grammars
EAGER:通过机器阅读语法构建语言技术
- 批准号:
2327143 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
CCRI: Planning-C: Facilitating Language Technologies for Crisis Response (LT4CR)
CCRI:Planning-C:促进语言技术应对危机(LT4CR)
- 批准号:
2234895 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
Collaborative Research: Language Documentation with an Artificial Intelligence (AI) Helper
协作研究:使用人工智能 (AI) 助手进行语言文档记录
- 批准号:
2109578 - 财政年份:2021
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
相似国自然基金
Research on Quantum Field Theory without a Lagrangian Description
- 批准号:24ZR1403900
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
Cell Research
- 批准号:31224802
- 批准年份:2012
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Cell Research
- 批准号:31024804
- 批准年份:2010
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Cell Research (细胞研究)
- 批准号:30824808
- 批准年份:2008
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
- 批准号:10774081
- 批准年份:2007
- 资助金额:45.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
- 批准号:
2312841 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
- 批准号:
2312842 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313131 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
- 批准号:
2313151 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Continuing Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
- 批准号:
2312840 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
- 批准号:
2345528 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:
2232298 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2232055 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
- 批准号:
2313149 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Continuing Grant
Collaborative Research: CompCog: RI: Medium: Understanding human planning through AI-assisted analysis of a massive chess dataset
合作研究:CompCog:RI:中:通过人工智能辅助分析海量国际象棋数据集了解人类规划
- 批准号:
2312374 - 财政年份:2023
- 资助金额:
$ 16.6万 - 项目类别:
Standard Grant














{{item.name}}会员




