III: Small: Multi-field Hierarchical Discovery and Tracking (mf-HDT) of Emerging Topics

III:小型:新兴主题的多领域分层发现和跟踪(mf-HDT)

基本信息

  • 批准号:
    1216282
  • 负责人:
  • 金额:
    $ 49.92万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-10-01 至 2016-09-30
  • 项目状态:
    已结题

项目摘要

The goal of this project addresses the open challenge of Multi-field Hierarchical Discovery and Tracking (mf-HDT) of emerging topics at different granularity levels based on combined evidence in heterogeneous data. The technical approaches consist of a new Bayesian framework with powerful inference algorithms, namely the multi-field Hierarchical Correlated Topic Modeling, for discovering multi-field hierarchies of latent topics, capturing inter-topic and cross-hierarchy correlations, and enabling query-driven threading of topics over a Markov chain of hierarchies. These technical innovations and capabilities go beyond existing Topic Detection and Tracking (TDT) methods and graphical models used to represent relationships between topics, citations, etc. Significant improvements are expected in both effectiveness and scalability over the existing methods, especially in terms of detecting newly emerging topics and tacking time-sensitive impact. The proposed approach will be evaluated on a four large datasets of scientific literature data in a broad range (Physics, Mathematics, Computer Science, Quantitative Biology, Quantitative Finance and Statistics) as well as news stories, with human-produced queries and relevance judgments and human-assigned topic labels to support task-oriented evaluations. Productivity of researchers, educational practitioners and students, government agencies supporting research and industries highly depends on the availability of up-to-date big pictures about scientific emergence and co-emergence within and across many fields, along with evidence of the impact of new technologies, and research or development funding. The proposed techniques, if successful, will provide principled and effective solutions with a broad future impact in the applications above and beyond. Web site (http://nyc.lti.cs.cmu.edu/mfhdt/) will provide access to open-source software, of datasets, results and publication in order to enable comparative evaluations and further studies by related research communities. The students involved in the project benefit from direct experience with using and evaluating cutting-edge IT technologies in real-world applications. This is complementary to classroom teaching where the students can observe first-hand the direct implication of choosing various strategies for categorization, active learning and distributed computing.
该项目的目标是解决基于异构数据中的组合证据的不同粒度级别的新兴主题的多字段分层发现和跟踪(mf-HDT)的开放性挑战。该技术方法包括一个新的贝叶斯框架与强大的推理算法,即多领域层次相关主题建模,用于发现多领域层次的潜在主题,捕捉主题间和跨层次的相关性,并使查询驱动的线程的主题层次结构的马尔可夫链。这些技术创新和能力超越了现有的主题检测和跟踪(TDT)的方法和图形模型,用于表示主题之间的关系,引文等显着的改进,预计在有效性和可扩展性超过现有的方法,特别是在检测新出现的主题和跟踪时间敏感的影响。 该方法将在四个大的科学文献数据集(物理学,数学,计算机科学,定量生物学,定量金融和统计学)以及新闻故事上进行评估,并使用人工查询和相关性判断以及人为分配的主题标签来支持面向任务的评估。研究人员、教育从业者和学生、支持研究和产业的政府机构的生产力高度依赖于关于科学涌现和许多领域内和跨领域共同涌现的最新大图景的可用性,沿着新技术影响的证据,以及研究或开发资金。所提出的技术,如果成功的话,将提供原则性和有效的解决方案,具有广泛的未来影响的应用程序以上和超越。网站(http://nyc.lti.cs.cmu.edu/mfhdt/)将提供开放源码软件、数据集、结果和出版物,以便有关研究界能够进行比较评价和进一步研究。参与该项目的学生受益于在现实世界的应用中使用和评估尖端IT技术的直接经验。这是课堂教学的补充,学生可以直接观察到选择分类,主动学习和分布式计算的各种策略的直接含义。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Yiming Yang其他文献

Recovering genetic regulatory networks from micro-array data and location analysis data.
从微阵列数据和位置分析数据中恢复基因调控网络。
Characteristics and sources of volatile organic compounds during pollution episodes and clean periods in the Beijing-Tianjin-Hebei region
京津冀地区污染期和清洁期挥发性有机物特征及来源
  • DOI:
    10.1016/j.scitotenv.2021.149491
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    9.8
  • 作者:
    Suding Yang;Xin Li;Mengdi Song;Ying Liu;Xuena Yu;Shiyi Chen;Sihua Lu;Wenjie Wang;Yiming Yang;Limin Zeng;Yuanhang Zhang
  • 通讯作者:
    Yuanhang Zhang
High Stability of Dielectric Permittity for K0.5Na0.5NbO3-Based Lead Free Piezoelectric Ceramics
K0.5Na0.5NbO3基无铅压电陶瓷介电常数的高稳定性
  • DOI:
    10.1080/00150193.2010.482848
  • 发表时间:
    2010-10
  • 期刊:
  • 影响因子:
    0.8
  • 作者:
    Hongliang Du;Zhuo Xu;Shaobo Qu;Zhen Yang;Jingbo Zhao;Yiming Yang;Weidong Mo;Song Xia
  • 通讯作者:
    Song Xia
Say CHEESE: Common Human Emotional Expression Set Encoder and Its Application to Analyze Deceptive Communication
Say CHEESE:人类常见情绪表达集编码器及其在分析欺骗性通信中的应用
Inferring Regulatory Networks Using a Hierarchical Bayesian Graphical Gaussian Model
使用分层贝叶斯图形高斯模型推断监管网络
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fan Li;Yiming Yang;E. Xing
  • 通讯作者:
    E. Xing

Yiming Yang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Yiming Yang', 18)}}的其他基金

BIGDATA: F: Large-Scale Transductive Learning from Heterogeneous Data Sources
BIGDATA:F:来自异构数据源的大规模转化学习
  • 批准号:
    1546329
  • 财政年份:
    2016
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
III-COR: Collaborative Research: User-centric, Adaptive and Collaborative Information Filtering
III-COR:协作研究:以用户为中心的自适应协作信息过滤
  • 批准号:
    0704689
  • 财政年份:
    2007
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
KDI: Universal Information Access: Translingual Retrieval, Summarization, Tracking, Detection and Validation
KDI:通用信息访问:跨语言检索、总结、跟踪、检测和验证
  • 批准号:
    9873009
  • 财政年份:
    1998
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: Computational Methods for Multi-dimensional Data Integration to Improve Phenotype Prediction
III:小:多维数据集成的计算方法以改进表型预测
  • 批准号:
    2246796
  • 财政年份:
    2023
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311596
  • 财政年份:
    2023
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311598
  • 财政年份:
    2023
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311597
  • 财政年份:
    2023
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
III : Small : Integrating and Learning on Spatial Data via Multi-Agent Simulation
III:小:通过多智能体模拟集成和学习空间数据
  • 批准号:
    2311954
  • 财政年份:
    2023
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
FET: III: Small: Innovative Approaches for Bias Correction and Systems-level Analysis in Integrated Multi-omics Data
FET:III:小型:集成多组学数据中的偏差校正和系统级分析的创新方法
  • 批准号:
    2203236
  • 财政年份:
    2022
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: III: SHF: Small: Multi-Stakeholder Decision Making: Qualitative Preference Languages, Interactive Reasoning, and Explanation
协作研究:RI:III:SHF:小型:多利益相关者决策:定性偏好语言、交互式推理和解释
  • 批准号:
    2225824
  • 财政年份:
    2022
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: III: SHF: Small: Multi-Stakeholder Decision Making: Qualitative Preference Languages, Interactive Reasoning, and Explanation
协作研究:RI:III:SHF:小型:多利益相关者决策:定性偏好语言、交互式推理和解释
  • 批准号:
    2225823
  • 财政年份:
    2022
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
III: Small: Learning Multi-scale Sequence Features for Predicting Gene to Microbiome Function
III:小:学习多尺度序列特征以预测基因与微生物组的功能
  • 批准号:
    2107108
  • 财政年份:
    2021
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
III: Small: Integrated prediction of intrinsic disorder and disorder functions with modular multi-label deep learning
III:小:通过模块化多标签深度学习对内在无序和无序函数进行集成预测
  • 批准号:
    2125218
  • 财政年份:
    2021
  • 资助金额:
    $ 49.92万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了