CiC (RDDC): Wordsmith in the Cloud - Refining Language Models Using Web-Scale Language Networks
CiC (RDDC):云中的 Wordsmith - 使用 Web 规模语言网络完善语言模型
基本信息
- 批准号:1048168
- 负责人:
- 金额:$ 21.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2011
- 资助国家:美国
- 起止时间:2011-07-01 至 2015-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
It has never been easier for Web users to express themselves in online communities. The overload of text information generated from online conversations is of concern to various consumer groups. Many effective tools to manage this information overload, such as text retrieval systems, rely on the use of statistical language models. The quality of language models is however limited by the sparseness of data, the mismatch of context, and the incapability of modeling semantic relations. In this project, cloud computing systems like Azure and Hadoop and novel distributed algorithms will be employed to extract heterogeneous language networks from Web-scale text collections. These language networks will be used to smooth and contextualize language models in various domains, making them accurate and robust. The refined language models will help improve state-of-the-art text retrieval and mining techniques, enhancing the information access and knowledge acquisition experience of real users across community and language boundaries. The techniques and resources (e.g., language networks and refined language models) will benefit a broad range of users that analyze text content in social media and many other domains. Research results of this project, including software tools and resources, will be published on the project Web site (http://www-personal.umich.edu/~qmei/wordsmith/).
网络用户在网络社区中表达自己从未如此容易。从在线对话中产生的文本信息的过载是各种消费者群体所关注的。许多有效的工具来管理这种信息过载,如文本检索系统,依赖于使用统计语言模型。然而,语言模型的质量受到数据稀疏、上下文不匹配和无法建模语义关系的限制。在这个项目中,云计算系统,如Azure和Hadoop和新的分布式算法将被用来从Web规模的文本集合中提取异构语言网络。这些语言网络将用于平滑和上下文化各个领域的语言模型,使其准确和健壮。改进的语言模型将有助于改进最先进的文本检索和挖掘技术,增强跨社区和语言界限的真实的用户的信息访问和知识获取体验。技术和资源(例如,语言网络和精炼的语言模型)将使分析社交媒体和许多其他领域中的文本内容的广泛用户受益。该项目的研究成果,包括软件工具和资源,将在项目网站上公布(http://www-personal.umich.edu/wangqmei/wordsmith/)。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Qiaozhu Mei其他文献
Emoji Promotes Developer Participation and Issue Resolution on GitHub
Emoji 促进 GitHub 上的开发者参与和问题解决
- DOI:
10.48550/arxiv.2308.16360 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Yuhang Zhou;Xuan Lu;Ge Gao;Qiaozhu Mei;Wei Ai - 通讯作者:
Wei Ai
Deriving User Preferences of Mobile Apps from their Management Activities
- DOI:
http://dx.doi.org/10.1145/3015462 - 发表时间:
2017 - 期刊:
- 影响因子:
- 作者:
Xuanzhe Liu;Wei Ai;Huoran Li;Jian Tang;Gang Huang;Qiaozhu Mei - 通讯作者:
Qiaozhu Mei
How Do Healthcare Professionals Personalize Their Software? A Pilot Exploration Based on an Electronic Health Records Search Engine
医疗保健专业人员如何个性化他们的软件?
- DOI:
10.3233/shti190459 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Kai Zheng;Yunan Chen;Julia Adler;A. Rosenberg;Danny T. Y. Wu;Qiaozhu Mei;D. Hanauer - 通讯作者:
D. Hanauer
Understanding Diverse Usage Patterns from Large-Scale Appstore-Service Profiles
从大规模应用商店服务配置文件中了解不同的使用模式
- DOI:
10.1109/tse.2017.2685387 - 发表时间:
2017-02 - 期刊:
- 影响因子:0
- 作者:
Xuanzhe Liu;Huoran Li;Xuan Lu;Tao Xie;Qiaozhu Mei;Feng Feng;Hong Mei - 通讯作者:
Hong Mei
Attribute Reduction Algorithm Based on Rough Set and Database Technology
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Qiaozhu Mei - 通讯作者:
Qiaozhu Mei
Qiaozhu Mei的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Qiaozhu Mei', 18)}}的其他基金
NSF Student Travel Grant for 2017 Conference on Knowledge Discovery and Data Mining (KDD 2017)
2017 年知识发现和数据挖掘会议 (KDD 2017) NSF 学生旅费补助金
- 批准号:
1742808 - 财政年份:2017
- 资助金额:
$ 21.5万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Efficient and Exact Methods for Big Data Reduction
BIGDATA:协作研究:F:大数据缩减的高效且精确的方法
- 批准号:
1633370 - 财政年份:2016
- 资助金额:
$ 21.5万 - 项目类别:
Standard Grant
CAREER: Eyes of the Foreseer - Integrative and In Situ Information Retrieval and Mining in Online Communities
职业:预见者之眼 - 在线社区中的集成和原位信息检索和挖掘
- 批准号:
1054199 - 财政年份:2011
- 资助金额:
$ 21.5万 - 项目类别:
Continuing Grant
SoCS: Assessing Information Credibility Without Authoritative Sources
SoCS:在没有权威来源的情况下评估信息可信度
- 批准号:
0968489 - 财政年份:2010
- 资助金额:
$ 21.5万 - 项目类别:
Standard Grant
相似海外基金
CiC (RDDC): Commoditizing Data-Intensive Biocomputing in the Cloud
CiC (RDDC):云中数据密集型生物计算的商品化
- 批准号:
1048253 - 财政年份:2011
- 资助金额:
$ 21.5万 - 项目类别:
Standard Grant
CiC (RDDC): Continuous Bulk Processing in the Cloud
CiC (RDDC):云端连续批量处理
- 批准号:
1048296 - 财政年份:2011
- 资助金额:
$ 21.5万 - 项目类别:
Standard Grant
CiC (RDDC) Parallelizing Large Scale Graph Problems on the Cloud
CiC (RDDC) 在云端并行化大规模图问题
- 批准号:
1048311 - 财政年份:2011
- 资助金额:
$ 21.5万 - 项目类别:
Standard Grant
CiC RDDC: Relational Data Markets in the Cloud
CiC RDDC:云中的关系数据市场
- 批准号:
1047815 - 财政年份:2011
- 资助金额:
$ 21.5万 - 项目类别:
Standard Grant