BIGDATA: Small: Big Data for Everyone

大数据:小:每个人的大数据

基本信息

  • 批准号:
    1250956
  • 负责人:
  • 金额:
    $ 54.84万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-08-01 至 2017-05-31
  • 项目状态:
    已结题

项目摘要

Although big data has had a huge impact in several areas, this impact is limited by the high cost and poor quality of analyzing unstructured data, and the costs of integrating data of multiple types. Lowering these costs will bring the benefits of big data based research to many new areas. Against this background, this project aims to develop machine-learning methods that read, analyze, and integrate web-scale collections of text and other data. The project can be expected to yield fundamental advances in data integration, machine learning, natural language understanding, and automated inference. The project includes research thrusts in (1) robust semi-supervised bootstrap learning algorithms that can cope with ambiguity in text, (2) algorithms for detecting and aligning the schemas implicit in semi-structured sources relative to a shared common ontology, (3) NLP algorithms that perform deeper analysis on text to extract infrequently mentioned yet important facts, and (4) targeted reading agents capable of pursuing specific queries or conjectures based on the scientist's current focus. Anticipated results of the project include fundamental advances in each of the research thrusts and their synergistic integration into software system (NESSIE) designed to help scientists in exploring scientific hypotheses in their respective domains of interest, by supporting targeted extraction of knowledge from large amounts of textual sources in relevant areas. Broader impacts of the research include advanced techniques for extracting and organizing structured knowledge from text, and integrate the learned information with existing structured knowledge in multiple domains. The Additional broader impacts of the research include enhanced opportunities fore advanced research-based training of graduate students. The softare and data resulting from the research will be made freely available to the larger scientific community.
尽管大数据在多个领域产生了巨大的影响,但这种影响受到分析非结构化数据的高成本和低质量以及集成多种类型数据的成本的限制。降低这些成本将为许多新领域带来基于大数据的研究的好处。在此背景下,该项目旨在开发机器学习方法,以读取、分析和整合网络规模的文本和其他数据集合。该项目有望在数据集成、机器学习、自然语言理解和自动推理方面取得根本性进展。该项目包括以下方面的研究重点:(1)强大的半监督自举学习算法,可以科普文本中的歧义,(2)用于检测和对齐半结构化源中隐含的模式的算法,相对于共享的公共本体,(3)对文本进行更深入分析的NLP算法,以提取不常提到但重要的事实,以及(4)能够基于科学家当前的关注点进行特定查询或查询的目标阅读代理。该项目的预期成果包括每个研究方向的基本进展及其协同集成到软件系统(NESSIE)中,旨在帮助科学家在各自感兴趣的领域探索科学假设,支持从相关领域的大量文本来源中有针对性地提取知识。研究的更广泛的影响包括从文本中提取和组织结构化知识的先进技术,以及将学习到的信息与多个领域的现有结构化知识相结合。该研究的其他更广泛的影响包括增加研究生高级研究培训的机会。研究产生的软件和数据将免费提供给更大的科学界。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

William Cohen其他文献

Prevalence and underdiagnosis of diabetes mellitus in a food insecure population
  • DOI:
    10.1038/s41598-025-97154-5
  • 发表时间:
    2025-04-10
  • 期刊:
  • 影响因子:
    3.900
  • 作者:
    Camden Richter;William Cohen;Ethan Belnap;Abigail McIntosh;Ishan Khosla;Daniel Luger
  • 通讯作者:
    Daniel Luger
Impact of hospital acquired infections on post-transplant one year mortality in pediatric bone marrow transplant patients
  • DOI:
    10.1016/j.ajic.2020.07.020
  • 发表时间:
    2021-02-01
  • 期刊:
  • 影响因子:
  • 作者:
    Benjamin R. Hanisch;William Cohen;David Jacobsohn;Xiaoyan Song
  • 通讯作者:
    Xiaoyan Song
Expert systems tools for hubble space telescope observation scheduling
  • DOI:
    10.1016/s0736-5853(87)80016-3
  • 发表时间:
    1987-01-01
  • 期刊:
  • 影响因子:
  • 作者:
    Glenn Miller;Don Rosenthal;William Cohen;Mark Johnston
  • 通讯作者:
    Mark Johnston
Congenitally Abnormal Aortic Valve Causing Coronary Obstruction and Cardiac Arrest in Infancy
  • DOI:
    10.1016/j.athoracsur.2020.07.070
  • 发表时间:
    2021-05-01
  • 期刊:
  • 影响因子:
  • 作者:
    Mubeena Abdulkarim;Julia Weld;William Cohen;Pamela Combs;Dhaval Patel;Chawki El-Zein;Michel Ilbawi;Luca Vricella;Narutoshi Hibino
  • 通讯作者:
    Narutoshi Hibino
65.2 Professional Growth Through International Collaboration: The Experiences of Trainees and Faculty
  • DOI:
    10.1016/j.jaac.2017.07.377
  • 发表时间:
    2017-10-01
  • 期刊:
  • 影响因子:
  • 作者:
    William Cohen;Beatriz Ortega
  • 通讯作者:
    Beatriz Ortega

William Cohen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('William Cohen', 18)}}的其他基金

SHF: Large: Collaborative Research: Exploiting the Naturalness of Software
SHF:大型:协作研究:利用软件的自然性
  • 批准号:
    1414030
  • 财政年份:
    2014
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Continuing Grant
EAGER: Exploiting the "Naturalness" of Software
EAGER:利用软件的“自然性”
  • 批准号:
    1247088
  • 财政年份:
    2012
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
Collaborative Research: SoCS: Analysis of Social Media Driven By Theories of Political Psychology
合作研究:SoCS:政治心理学理论驱动的社交媒体分析
  • 批准号:
    0968481
  • 财政年份:
    2010
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
III-CTX-Small: Adaptive Integration of Structured and Unstructured Data from Many Sources in a Biological Domain
III-CTX-Small:生物领域多源结构化和非结构化数据的自适应集成
  • 批准号:
    0811562
  • 财政年份:
    2008
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
Building Cognitive Tutors with Programming by Demonstration: When Simulated Students help Cognitive Modeling and Educational Studies
通过演示编程培养认知导师:当模拟学生帮助认知建模和教育研究时
  • 批准号:
    0537198
  • 财政年份:
    2005
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
Studies on Cytoskeletal Function in the Generation and Maintenance of Cell Shape
细胞骨架在细胞形状生成和维持中的功能研究
  • 批准号:
    9808368
  • 财政年份:
    1998
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
CISE Research Instrumentation: Infrastructure to Support Accurate Performance Measurements of Multithreaded Programs
CISE 研究仪器:支持多线程程序准确性能测量的基础设施
  • 批准号:
    9729889
  • 财政年份:
    1998
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
Improving Cell Biology Laboratories and Research Access for Biology Majors
改善细胞生物学实验室和生物学专业的研究机会
  • 批准号:
    9351203
  • 财政年份:
    1993
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
Marginal Band Formation and Cellular Morphogenesis in Nucleated Erythrocytes
有核红细胞的边缘带形成和细胞形态发生
  • 批准号:
    9118773
  • 财政年份:
    1992
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Continuing Grant
Studies of Marginal Band Formation and Function in Erythrocytes
红细胞边缘带形成和功能的研究
  • 批准号:
    8711810
  • 财政年份:
    1987
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: A Big Data and Machine Learning Approach for Improving the Efficiency of Two-sided Online Labor Markets
III:小:提高双边在线劳动力市场效率的大数据和机器学习方法
  • 批准号:
    2311582
  • 财政年份:
    2023
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
CAREER: Small Data in a Big World: Balancing Interpretability and Generalizability for Data Integration in Clinical Neuroscience
职业:大世界中的小数据:平衡临床神经科学数据集成的可解释性和概括性
  • 批准号:
    2322823
  • 财政年份:
    2023
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Continuing Grant
The Study of the paradox for multi-stage to the integration and small-size to big-size of wholesaler
批发商多级到一体化、小到大的悖论研究
  • 批准号:
    22K01777
  • 财政年份:
    2022
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Discrete and/or Longitudinal Data (small/big) analysis and The Behrens-Fisher problem
离散和/或纵向数据(小/大)分析和 Behrens-Fisher 问题
  • 批准号:
    RGPIN-2018-04558
  • 财政年份:
    2022
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Discovery Grants Program - Individual
Small Steps for Big Changes: Implementing an Evidence-Based Diabetes Prevention Program into Diverse Urban Communities
小步骤带来大改变:在不同的城市社区实施循证糖尿病预防计划
  • 批准号:
    471208
  • 财政年份:
    2022
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Operating Grants
Small area population forecasting using geospatial big datasets and national census in low and middle income countries
利用地理空间大数据集和中低收入国家人口普查进行小区域人口预测
  • 批准号:
    2751200
  • 财政年份:
    2022
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Studentship
Collaborative Research: RI: Small: Robust Deep Learning with Big Imbalanced Data
合作研究:RI:小型:具有大不平衡数据的鲁棒深度学习
  • 批准号:
    2246756
  • 财政年份:
    2022
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Continuing Grant
Big data for small patients - Building "child-size" individual predictive models for life after childhood cancer
小型患者的大数据 - 为儿童癌症后的生活建立“儿童大小”的个体预测模型
  • 批准号:
    EP/T028017/1
  • 财政年份:
    2021
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Fellowship
Development of a method for comprehensively analyzing the interaction between RNA and small molecule and analysis on big data of the RNA-small molecule binding pairs
建立RNA与小分子相互作用综合分析方法及RNA-小分子结合对大数据分析
  • 批准号:
    21H02079
  • 财政年份:
    2021
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
CIF: Small: Statistically Optimal Subsampling for Big Data and Rare Events Data
CIF:小:大数据和稀有事件数据的统计最佳子采样
  • 批准号:
    2105571
  • 财政年份:
    2021
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了