Probabilistic and link-based Methods for Exploiting Very Large Textual Repositories
用于利用超大型文本存储库的概率和基于链接的方法
基本信息
- 批准号:0329043
- 负责人:
- 金额:$ 31万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2003
- 资助国家:美国
- 起止时间:2003-09-15 至 2006-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This research project addresses the disconnect between the way in which humans ask questions on the Web and the existing interfaces to the state-of-the-art search engines. Search engines require online searchers to formulate their requests in idiosyncratic query languages whose syntax is unnatural and hard to learn by typical users. Furthermore, existing search engines are notoriously bad at returning documents which do not contain any of the terms given by the user and yet which were retrieved as relevant to the user's information need. The proposed work focuses on two areas of research: (1) probabilistic question-to-query transformation (query modulation) for Web access and (2) models of content transfer over web links. The approach for (1) involves designing and evaluating algorithms and systems for automatic, rule-based conversion of natural language queries to the language of specific search engines. Part (2) facilitates retrieval of relevant Web documents by virtue of the links from other relevant documents to them. The expected outcomes and impact of this project are threefold: (1) a better understanding of the interaction between document retrieval and question-answering in a Web environment, (2) better models describing how document relevance is transferred over the Web hypergraph, and (3) better algorithms for natural language access to the Web which will make it easier for millions of web users to find information that they need in a timely, accurate, and intuitive way. All findings and artifacts developed under this grant will be widely disseminated and incorporate into a public-domain search engine, and the results will be accessible via the project Web site (http://tangra.si.umich.edu/clair).
这个研究项目解决了人类在网络上提问的方式与现有的最先进的搜索引擎接口之间的脱节。搜索引擎要求在线搜索者用特殊的查询语言来表达他们的请求,这些语言的语法不自然,并且很难被普通用户学习。此外,现有的搜索引擎在返回不包含用户给出的任何术语但被检索为与用户的信息需求相关的文档方面是出了名的差。拟议的工作集中在两个领域的研究:(1)概率问题查询转换(查询调制)的Web访问和(2)模型的内容传输的Web链接。(1)的方法涉及设计和评估用于将自然语言查询自动地、基于规则地转换为特定搜索引擎的语言的算法和系统。第(2)部分通过从其他相关文档到相关Web文档的链接,方便检索相关Web文档。该项目的预期成果和影响有三个方面:(1)更好地理解Web环境中文档检索和问答之间的交互,(2)更好地描述文档相关性如何通过Web超图传递的模型,以及(3)更好的自然语言访问网络的算法,这将使数以百万计的网络用户更容易找到他们需要的信息,及时、准确和直观的方式。在该赠款下开发的所有研究结果和人工制品将广泛传播,并纳入公共领域搜索引擎,其结果将通过项目网站(http://tangra.si.umich.edu/clair)访问。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Dragomir Radev其他文献
Large Language Models: What will happen next?
大型语言模型:接下来会发生什么?
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Jungo Kasai;Keisuke Sakaguchi;Ronan Le Bras;Hao Peng;Ximing Lu;Dragomir Radev;Yejin Choi;Noah A. Smith;Keisuke Sakaguchi - 通讯作者:
Keisuke Sakaguchi
Neural Natural Language Processing for unstructured data in electronic health records: A review
电子健康记录中用于非结构化数据的神经自然语言处理:综述
- DOI:
10.1016/j.cosrev.2022.100511 - 发表时间:
2022-11-01 - 期刊:
- 影响因子:12.700
- 作者:
Irene Li;Jessica Pan;Jeremy Goldwasser;Neha Verma;Wai Pan Wong;Muhammed Yavuz Nuzumlalı;Benjamin Rosand;Yixin Li;Matthew Zhang;David Chang;R. Andrew Taylor;Harlan M. Krumholz;Dragomir Radev - 通讯作者:
Dragomir Radev
Dragomir Radev的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Dragomir Radev', 18)}}的其他基金
Collaborative Research: EAGER: Computational Thinking Olympiad
合作研究:EAGER:计算思维奥林匹克竞赛
- 批准号:
1048437 - 财政年份:2010
- 资助金额:
$ 31万 - 项目类别:
Standard Grant
Collaborative: SGER: New Problem Genres for the North American Computational Linguistics Olympiad
协作:SGER:北美计算语言学奥林匹克竞赛的新问题类型
- 批准号:
0838845 - 财政年份:2008
- 资助金额:
$ 31万 - 项目类别:
Standard Grant
Collaborative Research: BlogoCenter - Infrastructure for Collecting, Mining and Accessing Blogs
协作研究:BlogoCenter - 收集、挖掘和访问博客的基础设施
- 批准号:
0534323 - 财政年份:2006
- 资助金额:
$ 31万 - 项目类别:
Continuing Grant
Workshop on Effective Tools and Methodologies for Teaching Natural Language Processing and Computational Linguistics; Philadelphia, PA
自然语言处理和计算语言学教学有效工具和方法研讨会;
- 批准号:
0226408 - 财政年份:2002
- 资助金额:
$ 31万 - 项目类别:
Standard Grant
ITR: Information Fusion Across Multiple Text Sources: A Common Theory
ITR:跨多个文本源的信息融合:通用理论
- 批准号:
0082884 - 财政年份:2000
- 资助金额:
$ 31万 - 项目类别:
Continuing Grant
相似国自然基金
LINK-A/miR-155-5p/PKM2轴促进有氧糖酵解介导套细胞淋巴瘤伊布替尼耐药的作用机制研究
- 批准号:LQ21H160036
- 批准年份:2020
- 资助金额:0.0 万元
- 项目类别:省市级项目
高性能功率变换器DC-Link电容模组关键技术研究
- 批准号:51777146
- 批准年份:2017
- 资助金额:61.0 万元
- 项目类别:面上项目
载CCL5和Link N的HAP水凝胶招募干细胞修复压力诱导的椎间盘退变
- 批准号:81572204
- 批准年份:2015
- 资助金额:57.0 万元
- 项目类别:面上项目
Corey-Link反应的不对称催化研究及其在天然产物合成中的应用
- 批准号:21272221
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
Link N/P1543活性多肽自组装纳米纤维髓核组织工程研究
- 批准号:30872610
- 批准年份:2008
- 资助金额:35.0 万元
- 项目类别:面上项目
多基因系谱学(Multi-Gene Genealogy)对曲霉、青霉和拟青霉分类形态特征的研究
- 批准号:30660002
- 批准年份:2006
- 资助金额:25.0 万元
- 项目类别:地区科学基金项目
LINK SPAM技术的研究及相关算法在海量真实WEB数据上的有效性验证
- 批准号:60603042
- 批准年份:2006
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
我国各经济区域间动态投入产出连接(LINK)模型的研究
- 批准号:78870042
- 批准年份:1988
- 资助金额:2.0 万元
- 项目类别:面上项目
相似海外基金
Role of intestinal serotonin transporter in post traumatic stress disorder
肠道血清素转运蛋白在创伤后应激障碍中的作用
- 批准号:
10590033 - 财政年份:2024
- 资助金额:
$ 31万 - 项目类别:
Computational and neural signatures of interoceptive learning in anorexia nervosa
神经性厌食症内感受学习的计算和神经特征
- 批准号:
10824044 - 财政年份:2024
- 资助金额:
$ 31万 - 项目类别:
Neural activity-based candidate gene identification to link eating disorders and drug addiction
基于神经活动的候选基因识别将饮食失调和药物成瘾联系起来
- 批准号:
10528062 - 财政年份:2023
- 资助金额:
$ 31万 - 项目类别:
Genetics of Extreme Phenotypes of OSA and Associated Upper Airway Anatomy
OSA 极端表型的遗传学及相关上呼吸道解剖学
- 批准号:
10555809 - 财政年份:2023
- 资助金额:
$ 31万 - 项目类别:
Centrally-linked longitudinal peripheral biomarkers of AD in multi-ethnic populations
多种族人群中 AD 的中心连锁纵向外周生物标志物
- 批准号:
10555723 - 财政年份:2023
- 资助金额:
$ 31万 - 项目类别:
Implementation Science and Equity: Community Engagement & Outreach (CEO) Core
实施科学与公平:社区参与
- 批准号:
10557511 - 财政年份:2023
- 资助金额:
$ 31万 - 项目类别:
A next-generation extendable simulation environment for affordable, accurate, and efficient free energy simulations
下一代可扩展模拟环境,可实现经济、准确且高效的自由能源模拟
- 批准号:
10638121 - 财政年份:2023
- 资助金额:
$ 31万 - 项目类别:
The University of Miami AIDS Research Center on Mental Health and HIV/AIDS - Center for HIV & Research in Mental Health (CHARM)Research Core - EIS
迈阿密大学艾滋病心理健康和艾滋病毒/艾滋病研究中心 - Center for HIV
- 批准号:
10686546 - 财政年份:2023
- 资助金额:
$ 31万 - 项目类别:
Equipping social workers on the front line: The child welfare and addiction specialist fellowship program
为前线的社会工作者提供装备:儿童福利和成瘾专家奖学金计划
- 批准号:
10682109 - 财政年份:2023
- 资助金额:
$ 31万 - 项目类别:
A Paradigm Shift in Health Behavior Change: Understanding When and How Social Comparison Supports Healthy Behavior
健康行为改变的范式转变:了解社会比较何时以及如何支持健康行为
- 批准号:
10685733 - 财政年份:2023
- 资助金额:
$ 31万 - 项目类别:














{{item.name}}会员




