CRI: Collaborative Research: Improving Experimental Computer Science with a Searchable Web Portal for Data Sets
CRI:协作研究:通过可搜索的数据集门户网站改进实验计算机科学
基本信息
- 批准号:0551597
- 负责人:
- 金额:$ 20万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2006
- 资助国家:美国
- 起止时间:2006-03-15 至 2010-02-28
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This collaborative project, developing and populating a Web-based Dataset Portal, provides a powerful front-end for online searching, querying, and browsing research datasets coupled to an intelligent back-end system that dynamically provides cross-references among datasets, research papers, techniques, authors, grants, and journals/conferences. The datasets are linked to Rexa, a research paper digital library at U Mass. The work redesigns the UCI dataset archive with structured meta information that allow queries on the web creating a formalized repository of research datasets with uniform queryable metadata. The system is built on the UCI Machine Learning and KDD Data Repositories. In research areas such as machine learning, data mining, applied statistics, language modeling, information retrieval, computer vision, and speech recognition, methodologies are often evaluated on publicly available datasets. Although these Datasets often serve as a common touchstone for communication, identifying and locating specific data spread haphazardly across various Web sites presents some difficulty. This work creates a community resource to address this problem.Broader Impact: The project directly impacts empirical research, teaching, and most collaborative research activities. Browsing data that suggest new models and applications should inspire researchers and students. Real world data sets not only broaden research but are also bound to encourage teachers to incorporate these in the curriculum. Sharing data should bring about more collaboration from multiple areas.
这个合作项目,开发和填充一个基于web的数据集门户,为在线搜索、查询和浏览研究数据集提供了一个强大的前端,与一个智能后端系统相结合,该系统动态地提供数据集、研究论文、技术、作者、资助和期刊/会议之间的交叉引用。这些数据集与麻省大学的研究论文数字图书馆Rexa相连。该工作用结构化元信息重新设计了UCI数据集归档,允许在web上查询,创建具有统一可查询元数据的形式化研究数据集存储库。该系统建立在UCI机器学习和KDD数据存储库的基础上。在机器学习、数据挖掘、应用统计学、语言建模、信息检索、计算机视觉和语音识别等研究领域,方法通常是在公开可用的数据集上进行评估的。尽管这些数据集经常用作通信的通用试金石,但是识别和定位随意分布在各种Web站点上的特定数据存在一些困难。这项工作创建了一个社区资源来解决这个问题。更广泛的影响:该项目直接影响实证研究、教学和大多数合作研究活动。浏览提出新模型和应用的数据应该会激励研究人员和学生。真实世界的数据集不仅拓宽了研究范围,而且必然会鼓励教师将这些数据纳入课程。共享数据应该会带来更多来自多个领域的协作。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Andrew McCallum其他文献
An Interoperable Multimedia Catalog System for Electronic Commerce.
用于电子商务的可互操作多媒体目录系统。
- DOI:
- 发表时间:
2000 - 期刊:
- 影响因子:0
- 作者:
William W. Cohen;Andrew McCallum;D. Quass - 通讯作者:
D. Quass
Scaling Within Document Coreference to Long Texts
文档共指内的缩放到长文本
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Raghuveer Thirukovalluru;Nicholas Monath;K. Shridhar;M. Zaheer;Mrinmaya Sachan;Andrew McCallum - 通讯作者:
Andrew McCallum
ezCoref : A Scalable Approach for Collecting Crowdsourced Annotations for Coreference Resolution
ezCoref:一种收集众包注释以进行共指解析的可扩展方法
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
A. Crowdsourced;David Bamman;Olivia Lewke;Rachel Bawden;Rico Sennrich;Alexandra Birch;Ari Bornstein;Arie Cattan;Ido Dagan;Hong Chen;Zhenhua Fan;Hao Lu;Alan Yuille;Eduard Hovy;Mitch Marcus;M. Palmer;Lance;Rodney Huddleston. 2002;Frédéric Landragin;T. Poibeau;Bernard Vic;Belinda Z. Li;Gabriel Stanovsky;Robert L Logan;Andrew McCallum;Sameer Singh - 通讯作者:
Sameer Singh
PaRaDe: Passage Ranking using Demonstrations with Large Language Models
PaRaDe:使用大型语言模型的演示进行段落排名
- DOI:
10.48550/arxiv.2310.14408 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Andrew Drozdov;Honglei Zhuang;Zhuyun Dai;Zhen Qin;Razieh Rahimi;Xuanhui Wang;Dana Alon;Mohit Iyyer;Andrew McCallum;Donald Metzler;Kai Hui - 通讯作者:
Kai Hui
Every Answer Matters: Evaluating Commonsense with Probabilistic Measures
每个答案都很重要:用概率度量评估常识
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Qi Cheng;Michael Boratko;Pranay Kumar Yelugam;T. O’Gorman;Nalini Singh;Andrew McCallum;X. Li - 通讯作者:
X. Li
Andrew McCallum的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Andrew McCallum', 18)}}的其他基金
Collaborative Research: SOS-DCI / HNDS-R: Advancing Semantic Network Analysis to Better Understand How Evaluative Exchanges Shape Scientific Arguments
合作研究:SOS-DCI / HNDS-R:推进语义网络分析,以更好地理解评估性交流如何塑造科学论证
- 批准号:
2244805 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
RI: Medium: Probabilistic Box Embeddings
RI:中:概率框嵌入
- 批准号:
2106391 - 财政年份:2021
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
DMREF: Collaborative Research: The Synthesis Genome: Data Mining for Synthesis of New Materials
DMREF:协作研究:合成基因组:新材料合成的数据挖掘
- 批准号:
1922090 - 财政年份:2019
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
DMREF: Collaborative Research: The Synthesis Genome: Data Mining for Synthesis of New Materials
DMREF:协作研究:合成基因组:新材料合成的数据挖掘
- 批准号:
1534431 - 财政年份:2015
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
III: Medium: Constructing Knowledge Bases by Extracting Entity-Relations and Meanings from Natural Language via "Universal Schema"
III:媒介:通过“通用模式”从自然语言中提取实体关系和含义来构建知识库
- 批准号:
1514053 - 财政年份:2015
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
The Fourth Northeast Student Colloquium on Artificial Intelligence
第四届东北学生人工智能学术研讨会
- 批准号:
1036017 - 财政年份:2010
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CI-ADDO-EN: Flexible Machine Learning for Natural Language in the MALLET Toolkit
CI-ADDO-EN:MALLET 工具包中自然语言的灵活机器学习
- 批准号:
0958392 - 财政年份:2010
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
RI-Medium: Collaborative Research: Dynamically-Structured Conditional Random Fields for Complex, Natural Domains
RI-Medium:协作研究:复杂自然域的动态结构条件随机场
- 批准号:
0803847 - 财政年份:2008
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
ITR: Collaborative Research: (ACS+NHS)-(dmc+soc): Machine Learning for Sequences and Structured Data: Tools for Non-Experts
ITR:协作研究:(ACS NHS)-(dmc soc):序列和结构化数据的机器学习:非专家工具
- 批准号:
0427594 - 财政年份:2004
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
相似海外基金
CRI: CI-EN: Collaborative Research: mResearch: A platform for Reproducible and Extensible Mobile Sensor Big Data Research
CRI:CI-EN:协作研究:mResearch:可复制和可扩展的移动传感器大数据研究平台
- 批准号:
1822935 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CRI: CI-New: Collaborative Research: Extensible, Software Enabled Unmanned Aerial Vehicles
CRI:CI-New:协作研究:可扩展、软件支持的无人机
- 批准号:
1823230 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
CRI: CI-EN: Collaborative Research: OpenNetVM: A Software Platform Enabling Network Function Virtualization Research
CRI:CI-EN:协作研究:OpenNetVM:支持网络功能虚拟化研究的软件平台
- 批准号:
1823236 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CRI: CI-EN: Collaborative Research: An Experimental Infrastructure and a Database of Real Faults to Foster Reproducibility in Software Engineering Research
CRI:CI-EN:协作研究:实验基础设施和真实故障数据库,以促进软件工程研究的可重复性
- 批准号:
1929215 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CRI: CI-SUSTAIN: Collaborative Research: Sustaining Lemur Project Resources for the Long-Term
CRI:CI-SUSTAIN:合作研究:长期维持狐猴项目资源
- 批准号:
1822986 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CRI: CI-EN: Collaborative Research: An Experimental Infrastructure and a Database of Real Faults to Foster Reproducibility in Software Engineering Research
CRI:CI-EN:协作研究:实验基础设施和真实故障数据库,以促进软件工程研究的可重复性
- 批准号:
1823172 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CRI: CI-New: Collaborative Research: NJR: A Normalized Java Resource
CRI:CI-New:协作研究:NJR:标准化 Java 资源
- 批准号:
1823227 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CRI: CI-EN: Collaborative Research: mResearch: A platform for Reproducible and Extensible Mobile Sensor Big Data Research
CRI:CI-EN:协作研究:mResearch:可复制和可扩展的移动传感器大数据研究平台
- 批准号:
1823221 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CRI: CI-SUSTAIN: Collaborative Research: CiteSeerX: Toward Sustainable Support of Scholarly Big Data
CRI:CI-SUSTAIN:协作研究:CiteSeerX:迈向学术大数据的可持续支持
- 批准号:
1823288 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CRI: CI-SUSTAIN: Collaborative Research: CiteSeerX: Toward Sustainable Support of Scholarly Big Data
CRI:CI-SUSTAIN:协作研究:CiteSeerX:迈向学术大数据的可持续支持
- 批准号:
1853919 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Standard Grant