III: Medium: Collaborative Research: Connecting the Ephemeral and Archival Information Networks

III:媒介:协作研究:连接临时和档案信息网络

基本信息

  • 批准号:
    1160862
  • 负责人:
  • 金额:
    $ 53.63万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-08-01 至 2017-07-31
  • 项目状态:
    已结题

项目摘要

This collaborative research project (IIS-1160894, W. Bruce Croft, University of Massachusetts Amherst and IIS-1160862, Jamie Callan, Carnegie-Mellon University) addresses the complex issues of ephemeral information that is generated as part of social interactions is different in terms of time scale, quantity, and quality to archival information found on the web. This project investigates the hypothesis that, because of the context provided, searching either ephemeral or archival information is enhanced using the connections between them. It develops new retrieval models and features for ranking functions in a range of search tasks that can exploit an integrated ephemeral/archival network. Some search tasks are based on previous TREC blog, microblog, and web activities. It also investigates two new tasks, conversation retrieval and aggregated social search. Conversation retrieval targets information units in the form of "conversations" or "events" instead of simply retrieving social postings or web pages. Aggregated social search ranks information in different granularities, such as sentence, posting, conversation, or thread, based on the underlying query intent. Research that explores the connections between ephemeral and archival information requires a dataset that contains both types of information. A crucial part of this project extends the archival ClueWeb12 dataset with ephemeral microblog, blog, and discussion forum data that links to the web data. This extension is distributed to the research community as the ClueWeb12++ dataset. This project (http://ciir.cs.umass.edu/research/ephemeral/) is the first to address the full possibilities of search that exploits all the connections and contexts created by bringing together the two "worlds" of information. It also develops and distributes a unique new dataset that supports the development of a new generation of tools to access a broad range of information. Students at collaborating institutions, University of Massachusetts Amherst and Carnegie-Mellon University will be involved in educational activities and benefit from research experience.
这个合作研究项目(IIS-1160894, W. Bruce Croft,马萨诸塞大学阿默斯特分校和IIS-1160862, Jamie Callan,卡内基梅隆大学)解决了作为社会互动的一部分产生的短暂信息的复杂问题,这些信息在时间尺度、数量和质量上都不同于在网络上找到的档案信息。该项目调查了这样一种假设,即由于提供的上下文,使用它们之间的联系来增强对短暂或档案信息的搜索。它开发了新的检索模型和功能,用于在一系列搜索任务中排序功能,这些任务可以利用集成的短暂/档案网络。一些搜索任务基于以前的TREC博客、微博和web活动。它还研究了两个新的任务,对话检索和聚合社会搜索。会话检索以“会话”或“事件”的形式针对信息单元,而不是简单地检索社交帖子或网页。聚合的社会搜索根据底层查询意图对不同粒度的信息(如句子、帖子、对话或线程)进行排序。研究短暂信息和存档信息之间的联系需要一个包含这两种信息的数据集。这个项目的一个关键部分是扩展存档的ClueWeb12数据集,使用链接到web数据的临时微博、博客和论坛数据。这个扩展作为clueweb12++数据集分发给研究界。这个项目(http://ciir.cs.umass.edu/research/ephemeral/)是第一个解决搜索的全部可能性的项目,它利用了通过将两个信息“世界”结合在一起而创建的所有连接和上下文。它还开发和分发一个独特的新数据集,支持新一代工具的开发,以获取广泛的信息。马萨诸塞大学阿默斯特分校和卡内基梅隆大学合作院校的学生将参与教育活动,并从研究经验中受益。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jamie Callan其他文献

Pruning long documents for distributed information retrieval
修剪长文档以进行分布式信息检索
  • DOI:
    10.1145/584792.584847
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jie Lu;Jamie Callan
  • 通讯作者:
    Jamie Callan
Language processing technologies for electronic rulemaking: a project highlight
用于电子规则制定的语言处理技术:项目亮点
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stuart W. Shulman;E. Hovy;Jamie Callan;S. Zavestoski
  • 通讯作者:
    S. Zavestoski
Passage-retrieval evidence in document retrieval
  • DOI:
  • 发表时间:
    1994
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jamie Callan
  • 通讯作者:
    Jamie Callan
Metric-based ontology learning
基于度量的本体学习
  • DOI:
    10.1145/1458484.1458486
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    3
  • 作者:
    G. Yang;Jamie Callan
  • 通讯作者:
    Jamie Callan
An effective and efficient results merging strategy for multilingual information retrieval in federated search environments
联合搜索环境中多语言信息检索的有效且高效的结果合并策略
  • DOI:
    10.1007/s10791-007-9036-6
  • 发表时间:
    2007-11
  • 期刊:
  • 影响因子:
    2.8
  • 作者:
    Jamie Callan;Luo Si
  • 通讯作者:
    Luo Si

Jamie Callan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jamie Callan', 18)}}的其他基金

III: Small: Reliable and Generalizable Neural Search Engine Architectures
III:小:可靠且可推广的神经搜索引擎架构
  • 批准号:
    1815528
  • 财政年份:
    2018
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
CRI: CI-SUSTAIN: Collaborative Research: Sustaining Lemur Project Resources for the Long-Term
CRI:CI-SUSTAIN:合作研究:长期维持狐猴项目资源
  • 批准号:
    1822975
  • 财政年份:
    2018
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
III: Small: Using Knowledge Resources to Improve Information Retrieval
III:小:利用知识资源改进信息检索
  • 批准号:
    1422676
  • 财政年份:
    2014
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
CI-EN-Collaborative Research: Supporting Research and Teaching for Next-Generation Search Engines in Lemur
CI-EN-协作研究:支持狐猴下一代搜索引擎的研究和教学
  • 批准号:
    1405045
  • 财政年份:
    2014
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
III: Medium: Selective Search of Large-Scale Text Collections
III:媒介:大规模文本集合的选择性搜索
  • 批准号:
    1302206
  • 财政年份:
    2013
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
CI-ADDO-EN: Collaborative Proposal: Supporting Web-Scale Experimentation Using the Lemur Toolkit
CI-ADDO-EN:协作提案:使用 Lemur 工具包支持网络规模实验
  • 批准号:
    0934358
  • 财政年份:
    2010
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Continuing Grant
III: Small: Modeling and Predicting Term Mismatch for Full-Text Retrieval
III:小:全文检索的术语不匹配建模和预测
  • 批准号:
    1018317
  • 财政年份:
    2010
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
DC: Small: An Integrated Architecture for Federated Search
DC:小型:联合搜索的集成架构
  • 批准号:
    0916553
  • 财政年份:
    2009
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
Preservation and Access for ClueWeb09 Image Data
ClueWeb09 图像数据的保存和访问
  • 批准号:
    0948856
  • 财政年份:
    2009
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
SGER: Multi-Tier Indexing for Web Search Engines
SGER:网络搜索引擎的多层索引
  • 批准号:
    0841275
  • 财政年份:
    2008
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant

相似海外基金

III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
  • 批准号:
    2420691
  • 财政年份:
    2024
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Designing AI Systems with Steerable Long-Term Dynamics
合作研究:III:中:设计具有可操纵长期动态的人工智能系统
  • 批准号:
    2312865
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
  • 批准号:
    2312932
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: Integrating Large-Scale Machine Learning and Edge Computing for Collaborative Autonomous Vehicles
III:媒介:协作研究:集成大规模机器学习和边缘计算以实现协作自动驾驶汽车
  • 批准号:
    2348169
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Continuing Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2415562
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: New Machine Learning Empowered Nanoinformatics System for Advancing Nanomaterial Design
合作研究:III:媒介:新的机器学习赋能纳米信息学系统,促进纳米材料设计
  • 批准号:
    2347592
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Knowledge discovery from highly heterogeneous, sparse and private data in biomedical informatics
合作研究:III:中:生物医学信息学中高度异构、稀疏和私有数据的知识发现
  • 批准号:
    2312862
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
  • 批准号:
    2312930
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: VirtualLab: Integrating Deep Graph Learning and Causal Inference for Multi-Agent Dynamical Systems
协作研究:III:媒介:VirtualLab:集成多智能体动态系统的深度图学习和因果推理
  • 批准号:
    2312501
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
Collaborative Research: IIS: III: MEDIUM: Learning Protein-ish: Foundational Insight on Protein Language Models for Better Understanding, Democratized Access, and Discovery
协作研究:IIS:III:中等:学习蛋白质:对蛋白质语言模型的基础洞察,以更好地理解、民主化访问和发现
  • 批准号:
    2310113
  • 财政年份:
    2023
  • 资助金额:
    $ 53.63万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了