CAREER: New Directions in Probabilistic Topic Models
职业:概率主题模型的新方向
基本信息
- 批准号:0745520
- 负责人:
- 金额:$ 54.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2008
- 资助国家:美国
- 起止时间:2008-07-01 至 2014-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
There is a growing need for (semi-)automated tools to analyze and organize large collections of electronic information. In response, there is a surge of research on machine learning of probabilistic topic models, which automatically discover the hidden thematic structure in a large collection of documents. Once made explicit, this hidden structure facilitates browsing, searching, organizing, and summarizing vast amounts of information.This research program will significantly build on the current state-of-the-art in topic modeling.1. We will develop topic modeling algorithms that discover trends in document streams. Modeling evolutionary and revolutionary change of topics over time will be an important new capability for corpora analysts, providing methods of forecasting and understanding the changing patterns in serial collections such as news feeds, scientific publications, or web blogs.2. Many modern corpora, such as Wikipedia, contain important links between the documents. We will develop topic models of such interconnected collections that explicitly represent and generalize inter-document and/or inter-topic relationships. Such relationships may be hyper-links, scholarly citation, shared authorship, or statistical correlations. Capturing the patterns in these connections, and understanding their relationship to the texts, will have important implications for a great variety of scholarly, commercial, and personal 'recommender' systems.3. Very often, analysts and other users approach a corpora with particular questions in mind. To facilitate focused, personalized exploration, we will develop supervised methods for discovering topic models that predict document-specific variables -- notably forms of relevance -- of online material such as scholarly papers, legal briefs, media sources, and product specifications.This project addresses significant current limitations of topic modeling, and will provide practical new research and education tools for understanding and organizing modern repositories of information. We will make these tools available as open-source software to support and encourage their application to real-world problems, and we will fold the results of our research into ongoing education and outreach programs.
(半)自动化工具的需求日益增长,以分析和组织大量电子信息收集。 作为回应,对概率主题模型的机器学习有了一系列的研究,它们会在大量文档集合中自动发现隐藏的主题结构。 一旦明确说明,这种隐藏的结构便有助于浏览,搜索,组织和汇总大量信息。此研究计划将大大建立在主题建模中的最新目前。1。我们将开发主题建模算法,以发现文档流中的趋势。随着时间的推移,建模主题的进化和革命性变化将是Corpora分析师的重要新能力,提供了预测和理解串行收藏中不断变化的模式的方法,例如新闻提要,科学出版物或Web Blogs.2。许多现代语料库,例如Wikipedia,都包含文档之间的重要联系。 我们将开发此类相互联系的集合的主题模型,这些模型明确表示和概括了文档间和/或主题间关系。这种关系可能是超链接,学术引用,共享作者身份或统计相关性。 捕获这些联系中的模式,并了解它们与文本的关系,将对各种学术,商业和个人“推荐”系统具有重要意义。3。经常,分析师和其他用户会牢记特定问题的语料库。为了促进集中,个性化的探索,我们将开发有监督的方法来发现主题模型,以预测在线材料(例如学术论文,法律简介,媒体来源和产品规格)等在线材料的特定文档变量,尤其是相关性的形式。该项目解决了当前的主题建模的重大局限性,并将提供实用的新研究和教育工具,以理解现代化的现代知识库。我们将将这些工具作为开源软件提供,以支持和鼓励其在现实世界中的应用,并将研究结果折叠到正在进行的教育和外展计划中。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
David Blei其他文献
Overlapping clustering methods for networks
网络的重叠聚类方法
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
David Blei;Elena A. Erosheva - 通讯作者:
Elena A. Erosheva
David Blei的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('David Blei', 18)}}的其他基金
New Directions in Bayesian Model Criticism
贝叶斯模型批评的新方向
- 批准号:
2311108 - 财政年份:2023
- 资助金额:
$ 54.99万 - 项目类别:
Standard Grant
RI: Small: New Directions in Probabilistic Deep Learning: Exponential Families, Bayesian Nonparametrics and Empirical Bayes
RI:小:概率深度学习的新方向:指数族、贝叶斯非参数和经验贝叶斯
- 批准号:
2127869 - 财政年份:2021
- 资助金额:
$ 54.99万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
- 批准号:
1502780 - 财政年份:2014
- 资助金额:
$ 54.99万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
- 批准号:
1247664 - 财政年份:2013
- 资助金额:
$ 54.99万 - 项目类别:
Standard Grant
相似国自然基金
长偶极子和大磁环构成的新电磁矢量传感器多参联合估计研究
- 批准号:61801128
- 批准年份:2018
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
新算子分裂法及其在可分离优化中的应用
- 批准号:11301123
- 批准年份:2013
- 资助金额:22.0 万元
- 项目类别:青年科学基金项目
基于零序电流的超高压变压器新保护原理的研究
- 批准号:51267018
- 批准年份:2012
- 资助金额:48.0 万元
- 项目类别:地区科学基金项目
二苯并呋喃-示踪油藏充注途径的新标志物
- 批准号:40972089
- 批准年份:2009
- 资助金额:48.0 万元
- 项目类别:面上项目
基于新小波的图形特征表示与提取
- 批准号:60403011
- 批准年份:2004
- 资助金额:22.0 万元
- 项目类别:青年科学基金项目
相似海外基金
CAREER: New directions in the study of zeros and moments of L-functions
职业:L 函数零点和矩研究的新方向
- 批准号:
2339274 - 财政年份:2024
- 资助金额:
$ 54.99万 - 项目类别:
Continuing Grant
CAREER: New Directions in Foliation Theory and Diffeomorphism Groups
职业:叶状理论和微分同胚群的新方向
- 批准号:
2239106 - 财政年份:2023
- 资助金额:
$ 54.99万 - 项目类别:
Continuing Grant
FASEB SRC: Matricellular Proteins: Fundamental Concepts and New Directions
FASEB SRC:基质细胞蛋白:基本概念和新方向
- 批准号:
10468385 - 财政年份:2022
- 资助金额:
$ 54.99万 - 项目类别:
CAREER: New Directions in p-adic Heights and Rational Points on Curves
职业生涯:p-adic 高度和曲线上有理点的新方向
- 批准号:
1945452 - 财政年份:2020
- 资助金额:
$ 54.99万 - 项目类别:
Continuing Grant
CAREER: Shape Analysis in Submanifold Spaces: New Directions for Theory and Algorithms
职业:子流形空间中的形状分析:理论和算法的新方向
- 批准号:
1945224 - 财政年份:2020
- 资助金额:
$ 54.99万 - 项目类别:
Continuing Grant