DC: Small: Cross-Language Bayesian Models for Web-Scale Text Analysis Using MapReduce
DC:小型:使用 MapReduce 进行 Web 规模文本分析的跨语言贝叶斯模型
基本信息
- 批准号:1018625
- 负责人:
- 金额:$ 45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-09-15 至 2014-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The Web promises unprecedented access to the perspectives of anenormous number of people on a wide range of issues. Turning thatstill untamed cacophony into meaningful insights requires dealing withthe linguistic diversity and scale of the Web. Most current researchfocuses on specialized tasks such as tracking consumer opinions, andvirtually all current research treats the Web as both monolithic andmonolingual, ignoring the variety of languages represented and therich interplay between topics and issues under discussion.This project moves the state of the art forward by focusing on two keychallenges. First, highly-scalable MapReduce algorithms forlinguistic modeling within a Bayesian framework, making use ofvariational inference to achieve a high degree of parallelization onWeb-scale datasets. Second, novel Bayesian models that learnconsistent interpretations of text across languages and a wide rangeof response variables of interest (for example, views on an issue,strength of emotion relative to an event, and focus of attention).The techniques developed in this project will be demonstrated on largecrawls of Web pages and blogs. Potential applications for thesetechnologies include helping a schoolchild learn that people indifferent countries may view some issues very differently, helping apolitician understand how constituents are reacting to proposedlegislation, or helping an intelligence analyst understand how publicopinion is evolving in a hostile country.For further information see the project Web page:http://www.umiacs.umd.edu/~jimmylin/cloud-computing
网络承诺前所未有地接触到大量人对广泛问题的观点。 要将这些尚未驯服的杂音转化为有意义的见解,需要处理语言的多样性和网络的规模。 大多数当前的研究集中在专门的任务上,比如跟踪消费者的意见,而实际上所有当前的研究都把网络看作是单一的和单语言的,忽略了所代表的语言的多样性以及所讨论的主题和问题之间的丰富的相互作用。这个项目通过关注两个关键挑战来推动技术的发展。 首先,高度可扩展的MapReduce算法在贝叶斯框架内进行语言建模,利用变分推理实现Web规模数据集的高度并行化。 第二,新颖的贝叶斯模型,它可以学习跨语言文本的一致解释和广泛的感兴趣的响应变量(例如,对问题的看法,与事件相关的情感强度以及注意力的焦点)。本项目中开发的技术将在大量的网页和博客上展示。 这些技术的潜在应用包括帮助学童了解不同国家的人对某些问题的看法可能非常不同,帮助政治家了解选民对拟议立法的反应,或帮助情报分析师了解敌对国家的民意如何演变。http://www.umiacs.umd.edu/~jimmylin/cloud-computing
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jimmy Lin其他文献
PartsList: a web-based system for dynamically ranking protein folds based on disparate attributes, including whole-genome expression and interaction information.
PartsList:一个基于网络的系统,用于根据不同的属性(包括全基因组表达和相互作用信息)对蛋白质折叠进行动态排名。
- DOI:
- 发表时间:
2001 - 期刊:
- 影响因子:14.9
- 作者:
Jiang Qian;Brad Stenger;Cyrus A. Wilson;Jimmy Lin;R. Jansen;S. Teichmann;Jong H. Park;W. G. Krebs;Haiyuan Yu;Vadim Alexandrov;N. Echols;M. Gerstein - 通讯作者:
M. Gerstein
Sensornet
传感器网
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Rodney Topor;Kenneth Salem;Amarnath Gupta;K. Goda;John F. Gehrke;N. Palmer;Mohamed Sharaf;Alexandros Labrinidis;J. Roddick;Ariel Fuxman;Renée J. Miller;Wang;Anastasios Kementsietsidis;Philippe Bonnet;D. Shasha;Ronald Peikert;Bertram Ludäscher;S. Bowers;T. McPhillips;Harald Naumann;K. Voruganti;J. Domingo;Ben Carterette;Panagiotis G. Ipeirotis;Marcelo Arenas;Y. Manolopoulos;Y. Theodoridis;V. Tsotras;B. Carminati;Jan Jurjens;Eduardo B. Fernandez;Murat Kantarcıoǧlu;Jaideep Vaidya;Indrakshi Ray;Athena Vakali;Cristina Sirangelo;E. Pitoura;Himanshu Gupta;Surajit Chaudhuri;G. Weikum;Ulf Leser;David W. Embley;Fausto Giunchiglia;P. Shvaiko;Mikalai Yatskevich;Edward Y. Chang;Christine Parent;S. Spaccapietra;E. Zimányi;G. Anadiotis;S. Kotoulas;Ronny Siebes;Grigoris Antoniou;D. Plexousakis;J. Bailey;François Bry;Tim Furche;Sebastian Schaffert;David Martin;Gregory D. Speegle;Krithi Ramamritham;P. Chrysanthis;Kai;Stéphane Bressan;S. Abiteboul;D. Suciu;G. Dobbie;Tok Wang Ling;Sugato Basu;Ramesh Govindan;Michael H. Böhlen;C. S. Jensen;Jianyong Wang;K. Vidyasankar;A. Chan;Serge Mankovski;S. Elnikety;P. Valduriez;Yannis Velegrakis;Mario A. Nascimento;Michael Huggett;Andrew U. Frank;Yanchun Zhang;Guandong Xu;R. Snodgrass;Alan Fekete;Marcus Herzog;Konstantinos Morfonios;Y. Ioannidis;E. Wohlstadter;M. Matera;F. Schwagereit;Steffen Staab;Keir Fraser;Jingren Zhou;M. Mokbel;Walid G. Aref;Mirella M. Moro;Markus Schneider;Panos Kalnis;Gabriel Ghinita;Michael F. Goodchild;Shashi Shekhar;James Kang;Vijayaprasath Gandhi;Nikos Mamoulis;Betsy George;Michel Scholl;Agnès Voisard;Ralf Hartmut Güting;Yufei Tao;Dimitris Papadias;Peter Revesz;G. Kollios;E. Frentzos;Apostolos N. Papadopoulos;Bernhard Thalheim;Jovan Pehcevski;Benjamin Piwowarski;S. Theodoridis;Konstantinos Koutroumbas;George Karabatis;Don Chamberlin;Philip A. Bernstein;Michael H. Böhlen;J. Gamper;Ping Li;Kazimierz Subieta;S. Harizopoulos;Ethan Zhang;Yi Zhang;Theodore Johnson;Hans;S. Fienberg;Jiashun Jin;Radu Sion;C. Paice;Nikos Hardavellas;Ippokratis Pandis;Edie M. Rasmussen;Hiroshi Yoshida;G. Graefe;Bernd Reiner;Karl Hahn;K. Wada;T. Risch;Jiawei Han;Bolin Ding;Lukasz Golab;Michael Stonebraker;Bibudh Lahiri;Srikanta Tirthapura;Erik Vee;Yanif Ahmad;U. Çetintemel;Mitch Cherniack;S. Zdonik;Mariano P. Consens;M. Lalmas;R. Baeza;D. Hiemstra;Peer Krögerand;Arthur Zimek;Nick Craswell;Carson Kai;Maxime Crochemore;Thierry Lecroq;Arie Shoshani;Jimmy Lin;Hwanjo Yu;David B. Lomet;H. Hinterberger;Ninghui Li;Phillip B. Gibbons;Mouna Kacimi;Thomas Neumann - 通讯作者:
Thomas Neumann
The Maryland Modular Method: An Approach to Doctoral Education in Information Studies
马里兰模块化方法:信息研究博士教育的一种方法
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
A. Druin;P. Jaeger;J. Golbeck;K. Fleischmann;Jimmy Lin;Yan Qu;Ping Wang;Bo Xie - 通讯作者:
Bo Xie
Resources for Brewing BEIR: Reproducible Reference Models and Statistical Analyses
酿造 BEIR 的资源:可重复的参考模型和统计分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Ehsan Kamalloo;Nandan Thakur;Carlos Lassance;Jimmy Lin - 通讯作者:
Jimmy Lin
SmartProbe: A Virtual Moderator for Market Research Surveys
SmartProbe:市场研究调查的虚拟主持人
- DOI:
10.48550/arxiv.2305.08271 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Joshua Seltzer;Jia;Kathy Cheng;Yuxiao Sun;Santosh Kolagati;Jimmy Lin;Shi Zong - 通讯作者:
Shi Zong
Jimmy Lin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jimmy Lin', 18)}}的其他基金
Student Travel Support for the 2014 IEEE International Conference on Big Data
2014 年 IEEE 国际大数据会议学生旅行支持
- 批准号:
1444666 - 财政年份:2014
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
II-EN: Hadoop NextGen Infrastructure for Heterogeneous Approaches to Data-Intensive Computing
II-EN:用于数据密集型计算异构方法的 Hadoop NextGen 基础设施
- 批准号:
1405688 - 财政年份:2014
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
III: Small: Providing Relevant and Timely Results: Real-Time Search Architectures and Relevance Algorithms
III:小型:提供相关且及时的结果:实时搜索架构和相关性算法
- 批准号:
1218043 - 财政年份:2012
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
EAGER: Learning to Efficiently Rank with Cascades
EAGER:学习使用级联进行有效排名
- 批准号:
1144034 - 财政年份:2011
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
III: Small: Ivory -- A Hadoop Toolkit for Distributed Text Retrieval
III:小:Ivory——分布式文本检索的 Hadoop 工具包
- 批准号:
0916043 - 财政年份:2009
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
2009 PI Meeting for the Cluster Exploratory Program
2009年集群探索计划PI会议
- 批准号:
0957954 - 财政年份:2009
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Putting the Clouds in Context: Statistical Machine Translation with MapReduce
将云放在上下文中:使用 MapReduce 进行统计机器翻译
- 批准号:
0836560 - 财政年份:2008
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
CSR: Small: Cross-Layer Solutions Enabling Instant Computing for Edge Intelligence Devices
CSR:小:跨层解决方案为边缘智能设备提供即时计算
- 批准号:
2247156 - 财政年份:2024
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
Collaborative Research: HCC: Small: RUI: Drawing from Life in Extended Reality: Advancing and Teaching Cross-Reality User Interfaces for Observational 3D Sketching
合作研究:HCC:小型:RUI:从扩展现实中的生活中汲取灵感:推进和教授用于观察 3D 草图绘制的跨现实用户界面
- 批准号:
2326998 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Collaborative Research: CSR: Small: Cross-layer learning-based Energy-Efficient and Resilient NoC design for Multicore Systems
协作研究:CSR:小型:基于跨层学习的多核系统节能和弹性 NoC 设计
- 批准号:
2321224 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Collaborative Research: HCC: Small: RUI: Drawing from Life in Extended Reality: Advancing and Teaching Cross-Reality User Interfaces for Observational 3D Sketching
合作研究:HCC:小型:RUI:从扩展现实中的生活中汲取灵感:推进和教授用于观察 3D 草图绘制的跨现实用户界面
- 批准号:
2326999 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Collaborative Research: CSR: Small: Cross-layer learning-based Energy-Efficient and Resilient NoC design for Multicore Systems
协作研究:CSR:小型:基于跨层学习的多核系统节能和弹性 NoC 设计
- 批准号:
2321225 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
NSF-AoF: CNS Core: Small: CRUISE: A Cross-system Architecture Design for Autonomous Wireless Networks based on Lifelong Machine Learning
NSF-AoF:CNS 核心:小型:CRUISE:基于终身机器学习的自主无线网络的跨系统架构设计
- 批准号:
2225427 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
- 批准号:
2134202 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
- 批准号:
2134203 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
CNS Core: Small: Embracing cross stack heterogeneity in next-generation cloud platforms
CNS 核心:小型:在下一代云平台中拥抱跨堆栈异构性
- 批准号:
2116962 - 财政年份:2021
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Collaborative Research: SWIFT: Small: Cross-Layer Interference Management: Bringing Interference Alignment to Reality
合作研究:SWIFT:小型:跨层干扰管理:将干扰调整变为现实
- 批准号:
2030285 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant