TWC: Small: Statistical Models for Opinion Spam Detection Leveraging Linguistic and Behavioral Cues
TWC:小型:利用语言和行为线索进行意见垃圾邮件检测的统计模型
基本信息
- 批准号:1527364
- 负责人:
- 金额:$ 49.97万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-08-01 至 2019-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Online opinions now play a pivotal role in decision making and influence a wide spectrum of our lives. Choices of restaurants at which to dine, places to stay, universities to attend, books to read, doctors to consult, and even political candidates to vote for, are largely influenced by crowdsourced opinions. However, it is estimated that up to 30% of reviews on websites are fake. As a larger part of the US economy is becoming driven by social opinions, it poses a serious risk to the general public (e.g., by getting mislead to invest on low quality products, services or doctors). The Federal Trade Commission Opinion may soon consider online fraud as unlawful and a legal offense. Detecting fake online opinions is an urgent research area. Otherwise, online social media might continue to progress undetected. This project aims to develop novel deception detection algorithms in order to identify fraudulent behavior. It synergistically integrates techniques from computational linguistics, behavioral modeling and statistical machine learning in order to advance knowledge in this area. The project consists of a four-pronged research effort: 1) novel methods to learn deception classifiers from large-scale noisy crowd data and small-scale domain expert coded data, 2) unsupervised models that treat "spamicity" of reviewers as latent with observed behavioral footprints, 3) a relational architecture for jointly modeling reviews, reviewers, and their linguistic and behavioral patterns leveraging inherent reinforcement relations, and 4) an ensemble scoring mechanism blending cues from of all approaches, and an end-to-end validation framework. The techniques developed in the project can (1) reduce the marketing, consumer, and economic risk in e-commerce; (2) improve user profiling, detecting online harassment, bigotry, trolls, and other social media fraud that are of major relevance to national security; and (3) transition techniques developed to courses/tutorials and attract underrepresented students, including minorities and women. The result is a suite of novel, principled, and scalable techniques to filter opinion spam at large scale.
如今,在线意见在决策中发挥着关键作用,并影响着我们生活的方方面面。吃饭的餐厅、住宿的地方、就读的大学、阅读的书籍、咨询的医生,甚至投票的政治候选人的选择,在很大程度上都受到众包意见的影响。然而,据估计,网站上高达 30% 的评论是虚假的。由于美国经济的很大一部分正在受到社会舆论的驱动,这给公众带来了严重的风险(例如,被误导投资于低质量的产品、服务或医生)。联邦贸易委员会的意见可能很快就会将网络欺诈视为非法和法律犯罪。检测虚假的在线意见是一个紧迫的研究领域。否则,在线社交媒体可能会继续发展而不被发现。该项目旨在开发新颖的欺骗检测算法以识别欺诈行为。它协同整合了计算语言学、行为建模和统计机器学习的技术,以推进该领域的知识发展。该项目包括四方面的研究工作:1)从大规模噪声人群数据和小规模领域专家编码数据中学习欺骗分类器的新方法,2)将评论者的“垃圾性”视为潜在的观察到的行为足迹的无监督模型,3)利用固有强化关系对评论、评论者及其语言和行为模式进行联合建模的关系架构, 4)融合所有方法线索的集成评分机制和端到端验证框架。该项目开发的技术可以(1)降低电子商务中的营销、消费者和经济风险; (2) 改进用户分析,检测与国家安全有重大关系的在线骚扰、偏执、巨魔和其他社交媒体欺诈行为; (3) 开发课程/教程的过渡技术,吸引代表性不足的学生,包括少数族裔和女性。其结果是一套新颖的、有原则的、可扩展的技术来大规模过滤垃圾评论。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Arjun Mukherjee其他文献
Predicting Interesting Things in Text
预测文本中有趣的事情
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Michael Gamon;Arjun Mukherjee;Patrick Pantel - 通讯作者:
Patrick Pantel
EasyChair Preprint No 865 Robust Authorship Verification with Transfer Learning
EasyChair 预印本 No 865 通过迁移学习进行稳健的作者身份验证
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Dainis Boumber;Yifan Zhang;Marjan Hosseinia;Arjun Mukherjee;R. Vilalta - 通讯作者:
R. Vilalta
Extracting Aspect Specific Sentiment Expressions Implying Negative Opinions
- DOI:
10.1007/978-3-319-75487-1_15 - 发表时间:
2016-04 - 期刊:
- 影响因子:0
- 作者:
Arjun Mukherjee - 通讯作者:
Arjun Mukherjee
Analysis of Anxious Word Usage on Online Health Forums
在线健康论坛上焦虑一词的使用分析
- DOI:
10.18653/v1/w16-6105 - 发表时间:
2016 - 期刊:
- 影响因子:3.3
- 作者:
Nicolas Rey;Prasha Shrestha;Farig Sadeque;Steven Bethard;Ted Pedersen;Arjun Mukherjee;T. Solorio - 通讯作者:
T. Solorio
Application of a RS- and GIS-based semi-quantitative approach (analytical hierarchy process – AHP) in landslide hazard risk assessment of the Shivkhola Watershed, Darjiling Himalaya
基于 RS 和 GIS 的半定量方法(层次分析法 - AHP)在喜马拉雅山大吉岭 Shivkhola 流域滑坡灾害风险评估中的应用
- DOI:
10.1080/17499518.2012.719392 - 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
S. Mondal;Arjun Mukherjee;Ramakrishna Maiti - 通讯作者:
Ramakrishna Maiti
Arjun Mukherjee的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Arjun Mukherjee', 18)}}的其他基金
BIGDATA: F: Collaborative Research: Collective Mining of Vertical Social Communities
BIGDATA:F:协同研究:垂直社交社区的集体挖掘
- 批准号:
1838147 - 财政年份:2018
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: SaTC: CORE: Small: Differentially Private Data Synthesis: Practical Algorithms and Statistical Foundations
协作研究:SaTC:核心:小型:差分隐私数据合成:实用算法和统计基础
- 批准号:
2247795 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Continuing Grant
Collaborative Research: SaTC: CORE: Small: Differentially Private Data Synthesis: Practical Algorithms and Statistical Foundations
协作研究:SaTC:核心:小型:差分隐私数据合成:实用算法和统计基础
- 批准号:
2247794 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Continuing Grant
NSF-BSF: Collaborative Research: CIF: Small: Neural Estimation of Statistical Divergences: Theoretical Foundations and Applications to Communication Systems
NSF-BSF:协作研究:CIF:小型:统计差异的神经估计:通信系统的理论基础和应用
- 批准号:
2308445 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
III: Small: Statistical Inference through Data-Collection and Expert-Knowledge Incorporation
III:小:通过数据收集和专家知识整合进行统计推断
- 批准号:
2311969 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Auditing Private Statistical and Machine Learning Algorithms: Theory and Practice
SaTC:核心:小型:审计私人统计和机器学习算法:理论与实践
- 批准号:
2247484 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Continuing Grant
Universal statistical laws in the small scales of high-Reynolds-number turbulence
小尺度高雷诺数湍流中的普遍统计定律
- 批准号:
23K03245 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
NSF-BSF: Collaborative Research: CIF: Small: Neural Estimation of Statistical Divergences: Theoretical Foundations and Applications to Communication Systems
NSF-BSF:协作研究:CIF:小型:统计差异的神经估计:通信系统的理论基础和应用
- 批准号:
2308446 - 财政年份:2023
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
SaTC: CORE: Small: LESS DOUBT: Learning Efficiently form Statistical Samples-Demonstrating Outcomes Using Better Tests
SaTC:核心:小:更少怀疑:从统计样本中有效学习 - 使用更好的测试展示结果
- 批准号:
2228884 - 财政年份:2022
- 资助金额:
$ 49.97万 - 项目类别:
Continuing Grant
Collaborative Research: CNS Core: Small: Towards Unsupervised Learning on Resource Constrained Edge Devices with Novel Statistical Contrastive Learning Scheme
合作研究:CNS 核心:小型:利用新颖的统计对比学习方案在资源受限的边缘设备上实现无监督学习
- 批准号:
2122220 - 财政年份:2021
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: Towards Unsupervised Learning on Resource Constrained Edge Devices with Novel Statistical Contrastive Learning Scheme
合作研究:CNS 核心:小型:利用新颖的统计对比学习方案在资源受限的边缘设备上实现无监督学习
- 批准号:
2122320 - 财政年份:2021
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant














{{item.name}}会员




