NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties

NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响

基本信息

  • 批准号:
    1812778
  • 负责人:
  • 金额:
    $ 16.63万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-09-01 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Most people in the world today are multilingual. Though multilingualism is a gradual phenomenon, previous research has primarily examined text from second language learners who have not yet achieved fluency. This project focuses on text produced by nonnative but highly fluent speakers. Fluent but nonnative language differs subtly from native, monolingual language in the frequencies of certain concepts, constructions, and collocations. This raises the possibility that language technologies -- typically trained on "standard" native language -- are systematically biased in ways that render them less useful for the majority of users. This project will develop methods to examine large datasets of fluent nonnative language to detect the subtle influences of the native language and deliver natural language processing (NLP) tools for these language varieties. Its methods will be applicable beyond the populations in this study, including NLP-based measurement for social science and research seeking to better understand cognition in the bilingual mind. Native language identification will enable potential applications in language learning, cybersecurity, geolocation, personalization, and more. The project will openly share implementations and data, and will include educational activities that bring research into education.This project will advance natural language processing techniques to shed light on the differences in language use by fluent speakers with varying linguistic backgrounds: native speakers, highly fluent nonnative speakers, and translators when translating from another language into English. It is known that classifiers can be trained to discriminate with high accuracy among these populations, even though humans have difficulty telling them apart. This project will focus on semantic phenomena, which can confound even fluent nonnative speakers. If current NLP models are biased toward native language, then they may not support accurate measurement in nonnative text; the project will develop new techniques to mitigate this bias. This project will deliver a range of new models for native language identification, new measurement models and multi-variety models for language-variety-aware NLP tools, new semantic annotations in several Englishes, and a study on nonnative annotation. These novel methods for studying variation within a language and building such variation into our NLP systems will lead to unprecedented flexibility in computational models of natural language semantics.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
今天世界上大多数人都是多语言的。虽然多语现象是一个渐进的现象,以前的研究主要是从尚未达到流利的第二语言学习者的文本。这个项目的重点是由非母语,但非常流利的发言者产生的文本。流利但非母语的语言在某些概念、结构和搭配的频率上与母语、单语语言有微妙的不同。这就提出了一种可能性,即语言技术-通常是在“标准”母语上训练的-系统地存在偏见,使它们对大多数用户不那么有用。 该项目将开发方法来检查流利的非母语的大型数据集,以检测母语的微妙影响,并为这些语言种类提供自然语言处理(NLP)工具。它的方法将适用于本研究中的人群之外,包括基于NLP的社会科学测量和旨在更好地理解双语思维认知的研究。母语识别将使语言学习,网络安全,地理定位,个性化等方面的潜在应用成为可能。该项目将开放共享实施和数据,并将包括将研究引入教育的教育活动。该项目将推进自然语言处理技术,以揭示不同语言背景的流利使用者在语言使用方面的差异:母语使用者,高度流利的非母语使用者以及从另一种语言翻译成英语时的翻译。 众所周知,分类器可以被训练成在这些人群中以高精度进行区分,即使人类很难区分它们。这个项目将集中在语义现象,它可以混淆甚至流利的非母语人士。如果当前的NLP模型偏向于母语,那么它们可能不支持非母语文本的准确测量;该项目将开发新技术来减轻这种偏见。该项目将提供一系列用于母语识别的新模型,用于语言多样性感知NLP工具的新测量模型和多多样性模型,几种英语的新语义注释以及对非母语注释的研究。 这些研究语言内部变异的新方法,并将这种变异构建到我们的NLP系统中,将为自然语言语义的计算模型带来前所未有的灵活性。该奖项反映了NSF的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Corpus of Adpositional Supersenses for Mandarin Chinese
  • DOI:
  • 发表时间:
    2020-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Siyao Peng;Yang Janet Liu;Yilun Zhu;Austin Blodgett;Yushi Zhao;Nathan Schneider
  • 通讯作者:
    Siyao Peng;Yang Janet Liu;Yilun Zhu;Austin Blodgett;Yushi Zhao;Nathan Schneider
K-SNACS: Annotating Korean Adposition Semantics
K-SNACS:注释韩语介词语义
Making Heads and Tails of Models with Marginal Calibration for Sparse Tagsets
  • DOI:
    10.18653/v1/2021.findings-emnlp.423
  • 发表时间:
    2021-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michael Kranzlein;Nelson F. Liu;Nathan Schneider
  • 通讯作者:
    Michael Kranzlein;Nelson F. Liu;Nathan Schneider
Lexical Semantic Recognition
  • DOI:
    10.18653/v1/2021.mwe-1.6
  • 发表时间:
    2020-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nelson F. Liu;Daniel Hershcovich;Michael Kranzlein;Nathan Schneider
  • 通讯作者:
    Nelson F. Liu;Daniel Hershcovich;Michael Kranzlein;Nathan Schneider
Supertagging the Long Tail with Tree-Structured Decoding of Complex Categories
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Nathan Schneider其他文献

Comprehensive Annotation of Multiword Expressions in a Social Web Corpus
社交网络语料库中多词表达的综合注释
BERT Has Uncommon Sense: Similarity Ranking for Word Sense BERTology
BERT 具有不寻常的意义:词义相似度排序 BERTology
Thank You, Anarchy: Notes from the Occupy Apocalypse
谢谢你,无政府状态:占领启示录的笔记
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nathan Schneider;Rebecca Solnit
  • 通讯作者:
    Rebecca Solnit
SOFIA/FORCAST OBSERVATIONS OF WARM DUST IN S106: A FRAGMENTED ENVIRONMENT
索菲亚/预测 S106 中温暖尘埃的观测:支离破碎的环境
  • DOI:
    10.1088/0004-637x/814/1/54
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Adams;J. Adams;T. Herter;J. Hora;Nathan Schneider;R. Lau;J. Staguhn;J. Staguhn;R. Simon;Nathan Smith;R. Gehrz;Lori Allen;S. Bontemps;S. Carey;Giovanni G. Fazio;R. Gutermuth;A. Fernandez;M. Hankins;T. Hill;E. Keto;X. Koenig;K. Kraemer;S. Megeath;D. Mizuno;F. Motte;P. Myers;Howard A. Smith
  • 通讯作者:
    Howard A. Smith
The IRAM M 33 CO(2–1) survey - A complete census of molecular gas out to 7 kpc
IRAM M 33 CO(2–1) 调查 - 分子气体的完整普查,直至 7 kpc
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Druard;J. Braine;K. Schuster;Nathan Schneider;P. Gratier;S. Bontemps;M. Boquien;F. Combes;E. Corbelli;Christian Henkel;Christian Henkel;F. Herpin;C. Kramer;F. V. D. Tak;F. V. D. Tak;P. Werf
  • 通讯作者:
    P. Werf

Nathan Schneider的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Nathan Schneider', 18)}}的其他基金

CAREER: Metalinguistic Natural Language Understanding
职业:元语言自然语言理解
  • 批准号:
    2144881
  • 财政年份:
    2022
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Continuing Grant
Collaborative Research: DASS: Transitioning open-source software projects to accountable community governance
合作研究:DASS:将开源软件项目转变为负责任的社区治理
  • 批准号:
    2217654
  • 财政年份:
    2022
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant

相似国自然基金

枯草芽孢杆菌BSF01降解高效氯氰菊酯的种内群体感应机制研究
  • 批准号:
    31871988
  • 批准年份:
    2018
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目
基于掺硼直拉单晶硅片的Al-BSF和PERC太阳电池光衰及其抑制的基础研究
  • 批准号:
    61774171
  • 批准年份:
    2017
  • 资助金额:
    63.0 万元
  • 项目类别:
    面上项目
B细胞刺激因子-2(BSF-2)与自身免疫病的关系
  • 批准号:
    38870708
  • 批准年份:
    1988
  • 资助金额:
    3.0 万元
  • 项目类别:
    面上项目

相似海外基金

NSF-BSF: RI: Small: Mechanisms and Algorithms for Improving Peer Selection
NSF-BSF:RI:小型:改进同行选择的机制和算法
  • 批准号:
    2134857
  • 财政年份:
    2022
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Efficient Bi- and Multi-Objective Search Algorithms
NSF-BSF:RI:小型:高效的双目标和多目标搜索算法
  • 批准号:
    2121028
  • 财政年份:
    2021
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
NSF-BSF: Collaborative Research: RI: Small: Multilingual Language Generation via Understanding of Code Switching
NSF-BSF:协作研究:RI:小型:通过理解代码切换生成多语言
  • 批准号:
    2203097
  • 财政年份:
    2021
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Efficient Transformers via Formal and Empirical Analysis
NSF-BSF:RI:小型:通过形式和经验分析的高效变压器
  • 批准号:
    2113530
  • 财政年份:
    2021
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Planning and Acting While Time Passes
NSF-BSF:RI:小型:随着时间的推移进行规划和行动
  • 批准号:
    2008594
  • 财政年份:
    2020
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Resource-Constrained Multi-hypothesis-aware Perception
NSF-BSF:RI:小型:资源受限的多假设感知感知
  • 批准号:
    2008279
  • 财政年份:
    2020
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
NSF-BSF: Collaborative Research: RI: Small: Multilingual Language Generation via Understanding of Code Switching
NSF-BSF:协作研究:RI:小型:通过理解代码切换生成多语言
  • 批准号:
    2007656
  • 财政年份:
    2020
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Structured Distributions in Deep Nets
NSF-BSF:RI:小型:深度网络中的结构化分布
  • 批准号:
    2008387
  • 财政年份:
    2020
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Continuing Grant
NSF-BSF: RI: Small: Provably High-Quality Robot Inspection Planning - Theory and Application
NSF-BSF:RI:小型:可证明的高质量机器人检测规划 - 理论与应用
  • 批准号:
    2008475
  • 财政年份:
    2020
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
NSF-BSF: Collaborative Research: RI: Small: Multilingual Language Generation via Understanding of Code Switching
NSF-BSF:协作研究:RI:小型:通过理解代码切换生成多语言
  • 批准号:
    2007960
  • 财政年份:
    2020
  • 资助金额:
    $ 16.63万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了