Text Reuse and Information Flow
文本重用和信息流
基本信息
- 批准号:0534383
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2006
- 资助国家:美国
- 起止时间:2006-04-15 至 2010-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
News stories or Web pages can contain a great deal of reused information. Different authors may each present different versions of a story or event based on the same sources, and the facts of an event may get recapitulated or restated each time it is presented. Sometimes such presentations have little in common with each other; at other times one may be a copy of the other with minor edits. Given a topic of interest, then, a sufficiently extensive archive could be used to identify when particular ideas or statements originated and to check their validity. The goal of this project is to develop techniques to identify alternative versions of the same information in order to reconstruct how information "flows" between documents.The project involves the investigation of a range of approaches to detecting reuse at the level of sentences, passages and documents. The research is evaluated using a range of corpora, such as news, Web crawls, and blogs, in order to explore the dimensions of reuse and information flow in different situations. The research and its outcomes will have a significant impact on the design of tools that can be used to validate and assess information that comes from sources of differing reliability. Such a tool would be valuable in many applications in education, scientific research, and national security. The results of the research will be published in papers, will be accessible via the project Web site (http://ciir.cs.umass.edu/research/textreuse.html) and source code will be distributed through the popular Lemur toolkit (http://www.lemurproject.org/).
新闻故事或网页可以包含大量重复使用的信息。不同的作者可能会根据相同的来源呈现故事或事件的不同版本,并且每次呈现时事件的事实可能会被重述或重述。有时候,这些演示文稿彼此之间几乎没有共同之处;有时候,一个演示文稿可能是另一个演示文稿的副本,只进行了少量编辑。如果有一个感兴趣的主题,那么,一个足够广泛的档案可以用来确定特定的想法或陈述是何时产生的,并检查它们的有效性。这个项目的目标是开发技术来识别相同信息的替代版本,以重建信息如何在文档之间“流动”。该项目涉及一系列方法的调查,以检测在句子,段落和文档层面的重用。本研究使用一系列的语料库,如新闻,网络爬虫和博客,以探讨在不同情况下的重用和信息流的维度进行评估。这项研究及其成果将对可用于验证和评估来自不同可靠性来源的信息的工具的设计产生重大影响。这种工具在教育、科学研究和国家安全等许多应用中都很有价值。研究结果将以论文形式发表,可通过项目网站(http://ciir.cs.umass.edu/research/textreuse.html)查阅,源代码将通过流行的狐猴工具包(http://www.lemurproject.org/)分发。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
W. Bruce Croft其他文献
The Darwinization of Linguistics
语言学的达尔文化
- DOI:
10.1556/select.3.2002.1.7 - 发表时间:
2002 - 期刊:
- 影响因子:0
- 作者:
W. Bruce Croft - 通讯作者:
W. Bruce Croft
Clustering large files of documents using the single-link method
- DOI:
10.1002/asi.4630280606 - 发表时间:
1977-11 - 期刊:
- 影响因子:0
- 作者:
W. Bruce Croft - 通讯作者:
W. Bruce Croft
Methods for Finding Language Universals in Syntax
在语法中查找语言共性的方法
- DOI:
10.1007/978-1-4020-8825-4_8 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
W. Bruce Croft - 通讯作者:
W. Bruce Croft
The Speech Community in Evolutionary Language Dynamics
进化语言动力学中的语音群落
- DOI:
10.1111/j.1467-9922.2009.00535.x - 发表时间:
2009 - 期刊:
- 影响因子:4.4
- 作者:
R. Blythe;W. Bruce Croft - 通讯作者:
W. Bruce Croft
Evolution: Language Use and the Evolution of Languages
进化:语言的使用和语言的进化
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
W. Bruce Croft - 通讯作者:
W. Bruce Croft
W. Bruce Croft的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('W. Bruce Croft', 18)}}的其他基金
III: Small: Searching for Answers through Iterative Feedback
III:小:通过迭代反馈寻找答案
- 批准号:
1715095 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Continuing Grant
CI-EN-Collaborative Research: Supporting Research and Teaching for Next-Generation Search Engines in Lemur
CI-EN-协作研究:支持狐猴下一代搜索引擎的研究和教学
- 批准号:
1405829 - 财政年份:2014
- 资助金额:
-- - 项目类别:
Standard Grant
III: Small: Understanding the Relevance of Text Passages
III:小:理解文本段落的相关性
- 批准号:
1419693 - 财政年份:2014
- 资助金额:
-- - 项目类别:
Standard Grant
III: Medium: Collaborative Research: Connecting the Ephemeral and Archival Information Networks
III:媒介:协作研究:连接临时和档案信息网络
- 批准号:
1160894 - 财政年份:2012
- 资助金额:
-- - 项目类别:
Continuing Grant
CI-ADDO-EN: Collaborative Proposal: Supporting Web-Scale Experimentation using the Lemur Toolkit
CI-ADDO-EN:协作提案:使用 Lemur 工具包支持网络规模实验
- 批准号:
0934322 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Continuing Grant
III-COR: Searching Archives of Community Knowledge
III-COR:搜索社区知识档案
- 批准号:
0711348 - 财政年份:2007
- 资助金额:
-- - 项目类别:
Continuing Grant
CRI: CRD - Supporting User Data, Privacy, and Evaluation in the Lemur Toolkit
CRI:CRD - 在 Lemur 工具包中支持用户数据、隐私和评估
- 批准号:
0707801 - 财政年份:2007
- 资助金额:
-- - 项目类别:
Standard Grant
SGER: Breaking the Keyword Bottleneck: Towards More Effective Access of Government Information
SGER:打破关键词瓶颈:更有效地获取政府信息
- 批准号:
0527159 - 财政年份:2005
- 资助金额:
-- - 项目类别:
Standard Grant
Question Triage for Experts and Documents: Expanding the Information Retrieval Function of the NSDL
专家和文献的问题分类:扩展 NSDL 的信息检索功能
- 批准号:
0226144 - 财政年份:2002
- 资助金额:
-- - 项目类别:
Standard Grant
相似海外基金
Development of dual-energy CT analysis for reuse of medical information supporting the Next-Generation Medical Infrastructure Act in Japan
开发双能 CT 分析以重复利用医疗信息,支持日本下一代医疗基础设施法案
- 批准号:
23K14922 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
CRII: CNS: A Hybrid Software Defined Networking-Information Centric Networking Framework for the Reuse of Computation at the Network Edge
CRII:CNS:一种混合软件定义网络-以信息为中心的网络框架,用于在网络边缘重用计算
- 批准号:
2306685 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
CRII: CNS: A Hybrid Software Defined Networking-Information Centric Networking Framework for the Reuse of Computation at the Network Edge
CRII:CNS:一种混合软件定义网络-以信息为中心的网络框架,用于在网络边缘重用计算
- 批准号:
2104700 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Standard Grant
New approach to control gastroenteritis viruses in wastewater reclamation and reuse by taking advantage of glycomics information
利用糖组学信息控制废水回收和再利用中胃肠炎病毒的新方法
- 批准号:
26249075 - 财政年份:2014
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (A)
Formal reuse and validation of information system specifications/Réutilisation et validation formelle des spécifications de systèmes d'information
信息系统规范的正式重用和验证/Réutilization et validation forelle des spécifications de systèmes dinformation
- 批准号:
185805-2009 - 财政年份:2013
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Formal reuse and validation of information system specifications/Réutilisation et validation formelle des spécifications de systèmes d'information
信息系统规范的正式重用和验证/Réutilization et validation forelle des spécifications de systèmes dinformation
- 批准号:
185805-2009 - 财政年份:2012
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Study on collection and reuse of insight information of care workers in nursing homes
养老院护理人员洞察信息采集与再利用研究
- 批准号:
24500676 - 财政年份:2012
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
Formal reuse and validation of information system specifications/Réutilisation et validation formelle des spécifications de systèmes d'information
信息系统规范的正式重用和验证/Réutilization etvalidation formelle des spécifications de systèmes dinformation
- 批准号:
185805-2009 - 财政年份:2011
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Formal reuse and validation of information system specifications/Réutilisation et validation formelle des spécifications de systèmes d'information
信息系统规范的正式重用和验证/Réutilization etvalidation formelle des spécifications de systèmes dinformation
- 批准号:
185805-2009 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Formal reuse and validation of information system specifications/Réutilisation et validation formelle des spécifications de systèmes d'information
信息系统规范的正式重用和验证/Réutilization etvalidation formelle des spécifications de systèmes dinformation
- 批准号:
185805-2009 - 财政年份:2009
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual