III: Small: Collaborative Research: Keyphrase Extraction in Document Networks

III:小:协作研究:文档网络中的关键词提取

基本信息

  • 批准号:
    1422951
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-09-01 至 2018-08-31
  • 项目状态:
    已结题

项目摘要

Keyphrases for a document concisely describe the document using a small set of phrases (i.e., sequences of contiguous words in a document). For example, the keyphrases "social networks" and "interest targeting" quickly provide us with a high-level topic description (i.e., a summary) of a document focused on targeting interest for recommending services such as products and news to users, in the context of social networks. Given today's very large collections of documents, these keyphrases are extremely important not only for summarizing a document, but also for the search and retrieval of relevant information. However, keyphrases are not always available directly. Instead, they need to be gleaned from the many details in documents. This project addresses the problem of automatic keyphrase extraction from research papers, which are enablers of the sharing and dissemination of scientific discoveries. The goal of the project is to explore accurate approaches that automatically discover and extract keyphrases in documents, using document networks, which will help users handle and digest more information in less time during these "big data" times. Educationally, this research will involve training of both graduate and undergraduate students in the active area of research of keyphrase extraction, which has high impact in many real-world applications such as online advertising, document categorization, recommendation, and summarization, Web search and discovery, and topic tracking in newswire.Although much research to date has been done on automatic keyphrase extraction, no previous approaches have captured the impact of documents on one another via the citation relation that connects documents in a network. This project will investigate models that take into consideration the linkage between citing and cited documents in a document network and will explore various qualitative and quantitative aspects of the question: "What are the key phrases or concepts in a document?" Scalable iterative algorithms will be designed and developed that capture different aspects of documents (e.g., topics or concepts), as well as the impact of one document on another (e.g., influence or topic evolution) in a document network. The results of this research will have a direct pipeline to the CiteSeerX digital library (http://citeseerx.ist.psu.edu). The software, tools, and benchmark datasets developed during the course of this project will be broadly disseminated via the project website (http://www.cse.unt.edu/~ccaragea/keyphrases.html). All findings will be shared to the research community through publications in academic journals and presented in Information Retrieval, Text Mining and Natural Language Processing conferences.
文档的关键短语使用一小组短语(即,文档中的连续单词序列)来简明地描述文档。例如,关键短语“社交网络”和“兴趣定向”迅速为我们提供了文档的高级主题描述(即,摘要),该文档集中于在社交网络上下文中向用户推荐诸如产品和新闻之类的服务的兴趣定向。考虑到当今非常庞大的文档集合,这些关键短语不仅对于概述文档,而且对于搜索和检索相关信息都是极其重要的。然而,关键短语并不总是直接可用的。相反,它们需要从文件中的许多细节中收集。该项目解决了从研究论文中自动提取关键短语的问题,这是共享和传播科学发现的促进因素。该项目的目标是探索准确的方法,利用文档网络自动发现和提取文档中的关键短语,这将帮助用户在这些“大数据”时代以更短的时间处理和消化更多的信息。在教育方面,这项研究将包括培养研究生和本科生在关键短语提取这一活跃的研究领域,这在许多现实世界的应用中都有很大的影响,如在线广告、文档分类、推荐和摘要、Web搜索和发现以及新闻报道中的话题跟踪。尽管到目前为止已经对关键短语自动提取做了大量的研究,但还没有以前的方法通过网络中连接文档的引用关系来捕捉文档之间的影响。这个项目将调查考虑到文献网络中引用文献和被引用文献之间的联系的模型,并将探索这个问题的各种定性和定量方面:“文献中的关键短语或概念是什么?”将设计和开发可扩展的迭代算法,以捕获文档的不同方面(例如,主题或概念),以及文档网络中一个文档对另一个文档的影响(例如,影响或主题演变)。这项研究的结果将直接传递到CiteSeerX数字图书馆(http://citeseerx.ist.psu.edu).在本项目过程中开发的软件、工具和基准数据集将通过项目网站(http://www.cse.unt.edu/~ccaragea/keyphrases.html).广泛传播所有研究成果将通过学术期刊上的出版物分享给研究界,并在信息检索、文本挖掘和自然语言处理会议上展示。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

C. Lee Giles其他文献

BBookX: An Automatic Book Creation Framework
BBookX:自动书籍创建框架
SearchGen: a synthetic workload generator for scientific literature digital libraries and search engines
SearchGen:科学文献数字图书馆和搜索引擎的综合工作负载生成器
Phrase Pair Classification for Identifying Subtopics
用于识别子主题的短语对分类
Using Non-invertible Data Transformations to Build Adversarial-Robust Neural Networks
使用不可逆数据转换构建对抗性鲁棒神经网络
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Qinglong Wang;Wenbo Guo;Alexander Ororbia;Xinyu Xing;Lin Lin;C. Lee Giles;Xue Liu;Peng Liu;Gang Xiong
  • 通讯作者:
    Gang Xiong
SNDocRank: document ranking based on social networks
SNDocRank:基于社交网络的文档排名
  • DOI:
    10.1145/1772690.1772825
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Liang Gou;Hung;Jung;X. Zhang;C. Lee Giles
  • 通讯作者:
    C. Lee Giles

C. Lee Giles的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('C. Lee Giles', 18)}}的其他基金

CRI: CI-SUSTAIN: Collaborative Research: CiteSeerX: Toward Sustainable Support of Scholarly Big Data
CRI:CI-SUSTAIN:协作研究:CiteSeerX:迈向学术大数据的可持续支持
  • 批准号:
    1823288
  • 财政年份:
    2018
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: STEM Workforce Training: A Quasi-Experimental Approach Using the Effects of Research Funding
协作研究:STEM 劳动力培训:利用研究经费影响的准实验方法
  • 批准号:
    1348712
  • 财政年份:
    2013
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
EAGER: Automatic Document and Record Disposition and Retention
EAGER:自动文档和记录处置和保留
  • 批准号:
    1143921
  • 财政年份:
    2011
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: CI-ADDO-EN: Semantic CiteSeer X
合作研究:CI-ADDO-EN:语义 CiteSeer X
  • 批准号:
    0958143
  • 财政年份:
    2010
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
EAGER: Creating a Book Citation Index
EAGER:创建图书引文索引
  • 批准号:
    1042276
  • 财政年份:
    2010
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CRI: Collaborative: Next Generation CiteSeer
CRI:协作:下一代 CiteSeer
  • 批准号:
    0454052
  • 财政年份:
    2005
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
SGER: A Digital Library Archive for Computer Scientists
SGER:计算机科学家的数字图书馆档案
  • 批准号:
    0330783
  • 财政年份:
    2003
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336768
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
  • 批准号:
    2311990
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
  • 批准号:
    2324770
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
  • 批准号:
    2316306
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311596
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311598
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
  • 批准号:
    2324769
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了