RI: Small: DaRE: Detection and Recognition of Euphemisms

RI:小:DaRE:委婉语的检测和识别

基本信息

  • 批准号:
    2226006
  • 负责人:
  • 金额:
    $ 56.41万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-01-01 至 2025-12-31
  • 项目状态:
    未结题

项目摘要

To fully understand human language, machines need to be able to recognize and interpret expressions that contain hidden meanings. This project concentrates on euphemisms, mild or indirect phrases used in place of harsher or more offensive ones. Euphemisms are often used to mask profanity or refer to sensitive topics such as death, sex, religion, disability, or personal relationships in a polite way. People use euphemisms all the time, e.g., 'negative patient outcome', 'between jobs', 'financially fortunate', 'correctional facility','friendly fire', or 'sunshine unit'. Different cultures/languages use different euphemisms. Euphemisms change over time. Machines that process human language do not understand euphemisms yet. This project is devoted to making machines understand euphemisms in different languages, and therefore contributing to improving the capabilities of artificial intelligence. Additional benefits include interesting new generalizations about the nature of euphemisms and the training of a diverse cadre of undergraduate and graduate students in highly practical work on a difficult interdisciplinary problem. Montclair State University, a Hispanic Serving Institution, is known for its diverse student population and a large proportion of first-generation college students. Montclair State University puts great emphasis on justice and inclusivity in academia. This project is not an exception.Detecting and interpreting figurative language is a rapidly growing area in Natural Language Processing (NLP). Unfortunately, the processing of euphemisms is lacking in NLP thus far. The project addresses the following: 1) algorithm design for detecting and interpreting euphemisms, and 2) interpretability of black-box neural models by creating a series of new datasets and tasks that explore the embedding space of transformer language models for euphemism recognition. The key insights are 1) euphemistic expressions and their paraphrased counterparts differ in the strength of the sentiment they convey; 2) euphemistic and non-euphemistic interpretation is context-sensitive; 3) euphemisms are vaguer than the taboo expressions they substitute. The experiments test what linguistic properties of euphemisms the deep learning approaches capture and why. The algorithm developed can detect new euphemisms, not previously recorded in dictionaries, without human intervention. The computational work on euphemisms is important to further the understanding of how strategic use of language can bias people's perceptions of important and highly contentious actions and perhaps find ways how to de-bias language models. This work on euphemisms helps understand what topics are controversial or sensitive in a specific culture. Applying the algorithm to diachronic data and detecting the change in euphemism usage leads to a better understanding of culture changes. The corpora produced are useful for answering questions at the intersection of AI, NLP, linguistics, cultural anthropology, and social psychology. The range of languages provides a natural way of making interesting linguistic observations about euphemisms. Since euphemisms are a form of verbal behavior, finding a way to detect and interpret euphemisms automatically may lead to a better understanding of human behavior in general.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
为了完全理解人类语言,机器需要能够识别和解释包含隐藏含义的表达。这个项目集中在委婉语,温和或间接的短语使用的地方,严厉或更进攻性的。委婉语通常用于掩盖亵渎或以礼貌的方式提及敏感话题,如死亡,性,宗教,残疾或个人关系。人们一直在使用委婉语,例如,“消极的病人结果”,“工作之间”,“经济上的财富”,“惩教设施”,“友好的火灾”,或“阳光单位”。不同的文化/语言使用不同的委婉语。委婉语随着时间的推移而变化。处理人类语言的机器还不能理解委婉语。该项目致力于让机器理解不同语言中的委婉语,从而为提高人工智能的能力做出贡献。额外的好处包括有趣的新概括的性质委婉语和培训的不同干部的本科生和研究生在一个困难的跨学科问题的高度实用的工作。蒙特克莱尔州立大学是一所西班牙裔服务机构,以其多样化的学生群体和大部分第一代大学生而闻名。蒙特克莱尔州立大学非常重视学术界的公正和包容性。这个项目也不例外。检测和解释比喻语言是自然语言处理(NLP)中一个快速发展的领域。不幸的是,委婉语的处理是缺乏在NLP到目前为止。该项目解决了以下问题:1)用于检测和解释委婉语的算法设计,以及2)通过创建一系列新的数据集和任务来探索用于委婉语识别的Transformer语言模型的嵌入空间,从而实现黑盒神经模型的可解释性。本文的主要观点是:1)委婉语和其对应的释义在表达情感的强度上存在差异; 2)委婉语和非委婉语的释义是语境敏感的; 3)委婉语比它们所替代的禁忌语更容易被理解。实验测试了深度学习方法捕捉到的委婉语的语言特性以及原因。开发的算法可以检测新的委婉语,以前没有记录在字典中,没有人为干预。委婉语的计算工作是很重要的,以进一步了解如何战略性使用语言可以偏见的人的看法,重要的和高度有争议的行动,也许找到方法如何去偏见的语言模型。这项关于委婉语的工作有助于理解在特定文化中哪些话题是有争议的或敏感的。将该算法应用于历时数据,检测委婉语使用的变化,可以更好地理解文化变化。所产生的语料库对于回答人工智能,NLP,语言学,文化人类学和社会心理学的交叉问题非常有用。语言的范围提供了一个自然的方式,使有趣的语言观察委婉语。由于委婉语是一种言语行为,找到一种自动检测和解释委婉语的方法可能会更好地理解人类的一般行为。该奖项反映了NSF的法定使命,并已被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Report on the Euphemisms Detection Shared Task
  • DOI:
    10.48550/arxiv.2211.13327
  • 发表时间:
    2022-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Patrick Lee;Anna Feldman;J. Peng
  • 通讯作者:
    Patrick Lee;Anna Feldman;J. Peng
FEED PETs: Further Experimentation and Expansion on the Disambiguation of Potentially Euphemistic Terms.
FEED PET:消除潜在委婉术语歧义的进一步实验和扩展。
CAT s are Fuzzy PETs : A Corpus and Analysis of Potentially Euphemistic Terms
CAT是模糊PET:语料库和潜在委婉术语的分析
NollySenti: Leveraging Transfer Learning and Machine Translation for Nigerian Movie Sentiment Classification
  • DOI:
    10.48550/arxiv.2305.10971
  • 发表时间:
    2023-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Iyanuoluwa Shode;David Ifeoluwa Adelani;J. Peng;Anna Feldman
  • 通讯作者:
    Iyanuoluwa Shode;David Ifeoluwa Adelani;J. Peng;Anna Feldman
Searching for PETs: Using Distributional and Sentiment-Based Methods to Find Potentially Euphemistic Terms
搜索 PET:使用分布和基于情感的方法查找潜在的委婉术语
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gavidia, M.
  • 通讯作者:
    Gavidia, M.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Anna Feldman其他文献

WordPrep: Word-based Preposition Prediction Tool
WordPrep:基于单词的介词预测工具
Experiments in Cross-Language Morphological Annotation Transfer
跨语言形态注释迁移实验
  • DOI:
    10.1007/11671299_4
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Anna Feldman;Jirka Hana;Chris Brew
  • 通讯作者:
    Chris Brew
Legend at ArAIEval Shared Task: Persuasion Technique Detection using a Language-Agnostic Text Representation Model
ArAIEval 共享任务的传奇:使用与语言无关的文本表示模型进行说服技术检测
  • DOI:
    10.48550/arxiv.2310.09661
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    O. E. Ojo;O. O. Adebanji;Hiram Calvo;Damian O. Dieke;Olumuyiwa E. Ojo;S.E. Akinsanya;Tolulope O. Abiola;Anna Feldman
  • 通讯作者:
    Anna Feldman
Evaluating and automating the annotation of a learner corpus
评估和自动化学习者语料库的注释
  • DOI:
    10.1007/s10579-013-9226-3
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    2.7
  • 作者:
    Alexandr Rosen;Jirka Hana;Barbora Stindlová;Anna Feldman
  • 通讯作者:
    Anna Feldman
Linguistic Fingerprints of Internet Censorship: the Case of SinaWeibo
互联网审查的语言指纹:以新浪微博为例

Anna Feldman的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Anna Feldman', 18)}}的其他基金

Workshop on Natural Language Processing for Internet Freedom
自然语言处理促进互联网自由研讨会
  • 批准号:
    1828199
  • 财政年份:
    2018
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
Student Support at the North American Association for Computational Linguistics Workshop on Computational Methods for Analysis of Narrative
北美计算语言学协会叙事分析计算方法研讨会的学生支持
  • 批准号:
    1523285
  • 财政年份:
    2015
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
RI: Small: RUI: AIR: Automatic Idiom Recognition
RI:小:RUI:AIR:自动成语识别
  • 批准号:
    1319846
  • 财政年份:
    2013
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
Undergraduate Research: Cross-Lingual Approaches to Morphosyntactic Tagging
本科生研究:形态句法标记的跨语言方法
  • 批准号:
    1033275
  • 财政年份:
    2010
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Continuing Grant
RI:EAGER: A Montclair Group in Cognitive and Computational Aspects of Language and Speech Processing: An Exploration
RI:EAGER:蒙特克莱尔小组在语言和语音处理的认知和计算方面:探索
  • 批准号:
    1048406
  • 财政年份:
    2010
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
RI: Small: RUI: Resource-light Morphosyntactic Tagging of Morphologically Complex Languages
RI:小:RUI:形态复杂语言的轻资源形态句法标记
  • 批准号:
    0916280
  • 财政年份:
    2009
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
Workshop on Computational Approaches to Linguistic Creativity - Element 7495
语言创造力计算方法研讨会 - 元素 7495
  • 批准号:
    0906244
  • 财政年份:
    2009
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
  • 批准号:
    2342833
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
  • 批准号:
    2343062
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
  • 批准号:
    24K13443
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 56.41万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了