NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties

NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响

基本信息

  • 批准号:
    1813153
  • 负责人:
  • 金额:
    $ 16.75万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-09-01 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Most people in the world today are multilingual. Though multilingualism is a gradual phenomenon, previous research has primarily examined text from second language learners who have not yet achieved fluency. This project focuses on text produced by nonnative but highly fluent speakers. Fluent but nonnative language differs subtly from native, monolingual language in the frequencies of certain concepts, constructions, and collocations. This raises the possibility that language technologies -- typically trained on "standard" native language -- are systematically biased in ways that render them less useful for the majority of users. This project will develop methods to examine large datasets of fluent nonnative language to detect the subtle influences of the native language and deliver natural language processing (NLP) tools for these language varieties. Its methods will be applicable beyond the populations in this study, including NLP-based measurement for social science and research seeking to better understand cognition in the bilingual mind. Native language identification will enable potential applications in language learning, cybersecurity, geolocation, personalization, and more. The project will openly share implementations and data, and will include educational activities that bring research into education.This project will advance natural language processing techniques to shed light on the differences in language use by fluent speakers with varying linguistic backgrounds: native speakers, highly fluent nonnative speakers, and translators when translating from another language into English. It is known that classifiers can be trained to discriminate with high accuracy among these populations, even though humans have difficulty telling them apart. This project will focus on semantic phenomena, which can confound even fluent nonnative speakers. If current NLP models are biased toward native language, then they may not support accurate measurement in nonnative text; the project will develop new techniques to mitigate this bias. This project will deliver a range of new models for native language identification, new measurement models and multi-variety models for language-variety-aware NLP tools, new semantic annotations in several Englishes, and a study on nonnative annotation. These novel methods for studying variation within a language and building such variation into our NLP systems will lead to unprecedented flexibility in computational models of natural language semantics.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
今天世界上大多数人都是多语言的。虽然多语现象是一个渐进的现象,以前的研究主要是从尚未达到流利的第二语言学习者的文本。这个项目的重点是由非母语,但非常流利的发言者产生的文本。流利但非母语的语言在某些概念、结构和搭配的频率上与母语、单语语言有微妙的不同。这就提出了一种可能性,即语言技术-通常是在“标准”母语上训练的-系统地存在偏见,使它们对大多数用户不那么有用。 该项目将开发方法来检查流利的非母语的大型数据集,以检测母语的微妙影响,并为这些语言种类提供自然语言处理(NLP)工具。它的方法将适用于本研究中的人群之外,包括基于NLP的社会科学测量和旨在更好地理解双语思维认知的研究。母语识别将使语言学习,网络安全,地理定位,个性化等方面的潜在应用成为可能。该项目将开放共享实施和数据,并将包括将研究引入教育的教育活动。该项目将推进自然语言处理技术,以揭示不同语言背景的流利使用者在语言使用方面的差异:母语使用者,高度流利的非母语使用者以及从另一种语言翻译成英语时的翻译。 众所周知,分类器可以被训练成在这些人群中以高精度进行区分,即使人类很难区分它们。这个项目将集中在语义现象,它可以混淆甚至流利的非母语人士。如果当前的NLP模型偏向于母语,那么它们可能不支持非母语文本的准确测量;该项目将开发新技术来减轻这种偏见。该项目将提供一系列用于母语识别的新模型,用于语言多样性感知NLP工具的新测量模型和多多样性模型,几种英语的新语义注释以及对非母语注释的研究。 这些研究语言内部变异的新方法,并将这种变异构建到我们的NLP系统中,将为自然语言语义的计算模型带来前所未有的灵活性。该奖项反映了NSF的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Multilingual Amazon Reviews Corpus
  • DOI:
    10.18653/v1/2020.emnlp-main.369
  • 发表时间:
    2020-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Phillip Keung;Y. Lu;György Szarvas;Noah A. Smith
  • 通讯作者:
    Phillip Keung;Y. Lu;György Szarvas;Noah A. Smith
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Noah Smith其他文献

Buying health: assessing the impact of a consumer-side vegetable subsidy on purchasing, consumption and waste
购买健康:评估消费者侧蔬菜补贴对购买、消费和浪费的影响
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    3.2
  • 作者:
    Noah Smith
  • 通讯作者:
    Noah Smith
Implications for cumulative and prolonged clinical improvement induced by cross-linked hyaluronic acid: An in vivo biochemical/microscopic study in humans.
交联透明质酸诱导的累积和长期临床改善的影响:人类体内生化/显微镜研究。
  • DOI:
    10.1111/exd.14998
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    3.6
  • 作者:
    Frank Wang;T. Do;Noah Smith;J. Orringer;Sewon Kang;John J Voorhees;Gary J. Fisher
  • 通讯作者:
    Gary J. Fisher
THE NORTH ATLANTIC TREATY ORGANIZATION AND UNITED STATES RELATIONSHIP: A STUDY OF ITS DEVELOPMENT AND POSSIBLE FUTURE
北大西洋公约组织与美国的关系:对其发展和可能的未来的研究
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Noah Smith
  • 通讯作者:
    Noah Smith
Constructions of locally recoverable codes with large availability
  • DOI:
    10.1007/s10623-025-01624-w
  • 发表时间:
    2025-04-05
  • 期刊:
  • 影响因子:
    1.200
  • 作者:
    Giacomo Micheli;Vincenzo Pallozzi Lavorante;Abhi Shukul;Noah Smith
  • 通讯作者:
    Noah Smith
Biopsy of Suspected Melanoma
疑似黑色素瘤活检
  • DOI:
    10.1007/978-3-319-46029-1_10-1
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Noah Smith;T. Johnson;J. Kelly;A. Sober;C. Bichakjian
  • 通讯作者:
    C. Bichakjian

Noah Smith的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Noah Smith', 18)}}的其他基金

NSF-BSF: RI: Small: Efficient Transformers via Formal and Empirical Analysis
NSF-BSF:RI:小型:通过形式和经验分析的高效变压器
  • 批准号:
    2113530
  • 财政年份:
    2021
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
RI/SES: Conference Proposal: Doctoral Consortium on Text as Data
RI/SES:会议提案:文本即数据博士联盟
  • 批准号:
    1830158
  • 财政年份:
    2018
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
RI: Medium: Broad-Coverage Semantic Parsing: Linguistic Representation Learning from Crowd-Scale Data
RI:中:广泛覆盖的语义解析:从人群规模数据中学习语言表示
  • 批准号:
    1562364
  • 财政年份:
    2016
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Continuing Grant
Workshop: Support for a workshop on scientific research applications of natural language technologies
研讨会:支持自然语言技术科研应用研讨会
  • 批准号:
    1433108
  • 财政年份:
    2014
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Big Multilinguality for Data-Driven Lexical Semantics
BIGDATA:小:DA:数据驱动词汇语义的大多语言性
  • 批准号:
    1251131
  • 财政年份:
    2013
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
EAGER: PARTIAL: An Exploratory Study on Practical Approaches for Robust NLP Tools with Integrated Annotation Languages
EAGER: PARTIAL:关于具有集成注释语言的鲁棒 NLP 工具实用方法的探索性研究
  • 批准号:
    1352440
  • 财政年份:
    2013
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
SoCS: Collaborative Research: Data-Driven, Computational Models for Discovery and Analysis of Framing
SoCS:协作研究:用于发现和分析框架的数据驱动计算模型
  • 批准号:
    1211277
  • 财政年份:
    2012
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
CAREER: Flexible Learning for Natural Language Processing
职业:自然语言处理的灵活学习
  • 批准号:
    1054319
  • 财政年份:
    2011
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Continuing Grant
RI-Small: Probabilistic Models for Structure Discovery in Text
RI-Small:文本结构发现的概率模型
  • 批准号:
    0915187
  • 财政年份:
    2009
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Continuing Grant
SGER: Scaling up unsupervised grammar induction
SGER:扩大无监督语法归纳
  • 批准号:
    0836431
  • 财政年份:
    2008
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant

相似国自然基金

枯草芽孢杆菌BSF01降解高效氯氰菊酯的种内群体感应机制研究
  • 批准号:
    31871988
  • 批准年份:
    2018
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目
基于掺硼直拉单晶硅片的Al-BSF和PERC太阳电池光衰及其抑制的基础研究
  • 批准号:
    61774171
  • 批准年份:
    2017
  • 资助金额:
    63.0 万元
  • 项目类别:
    面上项目
B细胞刺激因子-2(BSF-2)与自身免疫病的关系
  • 批准号:
    38870708
  • 批准年份:
    1988
  • 资助金额:
    3.0 万元
  • 项目类别:
    面上项目

相似海外基金

NSF-BSF: RI: Small: Mechanisms and Algorithms for Improving Peer Selection
NSF-BSF:RI:小型:改进同行选择的机制和算法
  • 批准号:
    2134857
  • 财政年份:
    2022
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Efficient Bi- and Multi-Objective Search Algorithms
NSF-BSF:RI:小型:高效的双目标和多目标搜索算法
  • 批准号:
    2121028
  • 财政年份:
    2021
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
NSF-BSF: Collaborative Research: RI: Small: Multilingual Language Generation via Understanding of Code Switching
NSF-BSF:协作研究:RI:小型:通过理解代码切换生成多语言
  • 批准号:
    2203097
  • 财政年份:
    2021
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Efficient Transformers via Formal and Empirical Analysis
NSF-BSF:RI:小型:通过形式和经验分析的高效变压器
  • 批准号:
    2113530
  • 财政年份:
    2021
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Planning and Acting While Time Passes
NSF-BSF:RI:小型:随着时间的推移进行规划和行动
  • 批准号:
    2008594
  • 财政年份:
    2020
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Resource-Constrained Multi-hypothesis-aware Perception
NSF-BSF:RI:小型:资源受限的多假设感知感知
  • 批准号:
    2008279
  • 财政年份:
    2020
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
NSF-BSF: Collaborative Research: RI: Small: Multilingual Language Generation via Understanding of Code Switching
NSF-BSF:协作研究:RI:小型:通过理解代码切换生成多语言
  • 批准号:
    2007656
  • 财政年份:
    2020
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Structured Distributions in Deep Nets
NSF-BSF:RI:小型:深度网络中的结构化分布
  • 批准号:
    2008387
  • 财政年份:
    2020
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Continuing Grant
NSF-BSF: RI: Small: Provably High-Quality Robot Inspection Planning - Theory and Application
NSF-BSF:RI:小型:可证明的高质量机器人检测规划 - 理论与应用
  • 批准号:
    2008475
  • 财政年份:
    2020
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
NSF-BSF: Collaborative Research: RI: Small: Multilingual Language Generation via Understanding of Code Switching
NSF-BSF:协作研究:RI:小型:通过理解代码切换生成多语言
  • 批准号:
    2007960
  • 财政年份:
    2020
  • 资助金额:
    $ 16.75万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了