BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
基本信息
- 批准号:1502780
- 负责人:
- 金额:$ 64.35万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2014
- 资助国家:美国
- 起止时间:2014-07-01 至 2017-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Big data analytics is, fundamentally, the problem of bringing the massive amounts of data produced today down to human scale. In particular scientists, engineers, physicians, and many others in knowledge-intensive professions face data that is beyond human scale. This data is in the repositories that collect the data and the reports or results in their fields. This project will address the problem of bringing all this knowledge under control by using even more data, namely the individual and social patterns of how these repositories are accessed and used, and user-specific judgments (valuations) of the data. The proposed research will develop novel algorithms and an open-source infrastructure for improving discovery within and access to data repositories. These algorithms will aggregate and analyze the social analytic data, gathered from professional communities of data users, and will motivate them to participate by providing recommendations.The transformative goal is to develop methods for organizing, and operationalizing the access and preference patterns of users of large repositories, and for integrating those valuations to accelerate discovery within the collections. Diverse human minds interacting with data collections, as they carry out their own research or operational activities, provide a powerful source of information about the value of the data itself. Those data items may be textual documents, numerical datasets, or other kinds of media content. The novel methods for representing, aggregating, organizing and valuating interactions between the users and the items can reveal structures within data collections, which were previously invisible to any individual. This discovery of interrelations within data, driven by the capture of human intelligence, will accelerate the processes of scientific discovery. Users who are permitted to valuate data, and who are motivated by receiving valuable recommendations in return, reveal more about their own interests. This makes it possible to discover relations among the data items and among the users themselves. The educational goals are to: (a) contribute to the education of specific graduate students supported by the project, and undergraduates via the REU mechanism; (b) generate new educational materials related to algorithmic innovations, and to research findings; and (c) improve access to and discovery within specific collections of materials. Research findings will be included in courses at all three collaborating universities.Additional information about the project (including publication, software, data sets) will be made available through the project web site: http://arxiv_xs.rutgers.edu/.
从根本上说,大数据分析是将今天产生的大量数据降至人类规模的问题。特别是科学家、工程师、医生和许多其他从事知识密集型职业的人,他们面临着超出人类规模的数据。这些数据位于存储库中,存储库在其字段中收集数据和报告或结果。这个项目将解决通过使用更多的数据来控制所有这些知识的问题,即如何访问和使用这些存储库的个人和社会模式,以及用户对数据的特定判断(估值)。拟议的研究将开发新的算法和开源基础设施,以改进数据存储库中的发现和访问。这些算法将汇总和分析从数据用户的专业社区收集的社会分析数据,并将通过提供建议来激励他们参与。变革的目标是开发用于组织和操作大型存储库用户的访问和偏好模式的方法,以及用于集成这些评估以加速集合中的发现。在开展自己的研究或业务活动时,不同的人类思维与数据收集相互作用,提供了有关数据本身价值的强大信息来源。这些数据项可以是文本文档、数字数据集或其他类型的媒体内容。表示、聚合、组织和评估用户与项目之间交互的新方法可以揭示数据集合中的结构,这些结构以前对任何个人都是不可见的。在人类智慧的驱动下,这种对数据内部相互关系的发现将加速科学发现的进程。那些被允许评估数据的用户,以及那些因收到有价值的建议而受到激励的用户,会更多地透露他们自己的兴趣。这使得发现数据项之间和用户本身之间的关系成为可能。教育目标是:(a)通过REU机制为项目支持的特定研究生和本科生的教育做出贡献;(b)编制与算法创新和研究成果有关的新教材;(c)改进对特定材料集合的获取和发现。研究成果将纳入所有三所合作大学的课程。关于该项目的其他信息(包括出版物、软件、数据集)将通过该项目的网站:http://arxiv_xs.rutgers.edu/提供。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
David Blei其他文献
Correction to: Counterfactual inference for consumer choice across many product categories
- DOI:
10.1007/s11129-021-09245-y - 发表时间:
2021-12-01 - 期刊:
- 影响因子:1.100
- 作者:
Robert Donnelly;Francisco J. R. Ruiz;David Blei;Susan Athey - 通讯作者:
Susan Athey
Overlapping clustering methods for networks
网络的重叠聚类方法
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
David Blei;Elena A. Erosheva - 通讯作者:
Elena A. Erosheva
Starfysh integrates spatial transcriptomic and histologic data to reveal heterogeneous tumor–immune hubs
星鱼整合空间转录组学和组织学数据以揭示异质性肿瘤-免疫枢纽
- DOI:
10.1038/s41587-024-02173-8 - 发表时间:
2024-03-21 - 期刊:
- 影响因子:41.700
- 作者:
Siyu He;Yinuo Jin;Achille Nazaret;Lingting Shi;Xueer Chen;Sham Rampersaud;Bahawar S. Dhillon;Izabella Valdez;Lauren E. Friend;Joy Linyue Fan;Cameron Y. Park;Rachel L. Mintz;Yeh-Hsing Lao;David Carrera;Kaylee W. Fang;Kaleem Mehdi;Madeline Rohde;Jos√© L. McFaline-Figueroa;David Blei;Kam W. Leong;Alexander Y. Rudensky;George Plitas;Elham Azizi - 通讯作者:
Elham Azizi
Joint representation and visualization of derailed cell states with Decipher
- DOI:
10.1186/s13059-025-03682-8 - 发表时间:
2025-07-23 - 期刊:
- 影响因子:9.400
- 作者:
Achille Nazaret;Joyxa0Linyue Fan;Vincent-Philippe Lavallée;Cassandra Burdziak;Andrewxa0E. Cornish;Vaidotas Kiseliovas;Robertxa0L. Bowman;Ignas Masilionis;Jaeyoung Chun;Shiraxa0E. Eisman;James Wang;Justin Hong;Lingting Shi;Rossxa0L. Levine;Linas Mazutis;David Blei;Dana Pe’er;Elham Azizi - 通讯作者:
Elham Azizi
David Blei的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('David Blei', 18)}}的其他基金
New Directions in Bayesian Model Criticism
贝叶斯模型批评的新方向
- 批准号:
2311108 - 财政年份:2023
- 资助金额:
$ 64.35万 - 项目类别:
Standard Grant
RI: Small: New Directions in Probabilistic Deep Learning: Exponential Families, Bayesian Nonparametrics and Empirical Bayes
RI:小:概率深度学习的新方向:指数族、贝叶斯非参数和经验贝叶斯
- 批准号:
2127869 - 财政年份:2021
- 资助金额:
$ 64.35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
- 批准号:
1247664 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
Standard Grant
CAREER: New Directions in Probabilistic Topic Models
职业:概率主题模型的新方向
- 批准号:
0745520 - 财政年份:2008
- 资助金额:
$ 64.35万 - 项目类别:
Continuing Grant
相似国自然基金
肝细胞Mid 1活化加重脓毒症病理进程的分子机制研究及干预策略优化
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
MID1调控肿瘤相关巨噬细胞细胞中IRF8-STING通路在胶质瘤微环境中的作用机制研究
- 批准号:2025JJ70385
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
E3泛素连接酶Mid1调控Treg细胞影响GVHD 的作用及机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
线粒体动力蛋白MiD51在IL-27诱导类风湿关节炎DN2-B细胞分化扩增中的作用及机制研究
- 批准号:82302047
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
MID1调控糖稳态的分子机制
- 批准号:32000815
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
MID1基因缺陷对颅神经嵴细胞的影响及唇腭裂形成的分子病理
- 批准号:2020A151501160
- 批准年份:2020
- 资助金额:10.0 万元
- 项目类别:省市级项目
水稻MID1和赤霉素互作调控缺水条件下花粉发育的机制研究
- 批准号:31770352
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于最小重要差异值(MID)的冠心病病证结合疗效评价量表中医临床疗效判定阈值研究
- 批准号:81603504
- 批准年份:2016
- 资助金额:17.0 万元
- 项目类别:青年科学基金项目
层级稀疏化的Mid-Level特征空间下高分辨率遥感影像检索方法研究
- 批准号:41401376
- 批准年份:2014
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
MID器件机电集成数字化设计关键问题的研究
- 批准号:50975241
- 批准年份:2009
- 资助金额:20.0 万元
- 项目类别:面上项目
相似海外基金
BIGDATA: Mid-Scale: ESCE: DCM: Collaborative Research: DataBridge - A Sociometric System for Long-Tail Science Data Collections
BIGDATA:中型:ESCE:DCM:协作研究:DataBridge - 长尾科学数据收集的社会计量系统
- 批准号:
1560625 - 财政年份:2015
- 资助金额:
$ 64.35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
- 批准号:
8840914 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
- 批准号:
1247469 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
Continuing Grant
BIGDATA: Mid-Scale: DCM: Collaborative Research: Eliminating the Data Ingestion Bottleneck in Big Data Applications
BIGDATA:中型:DCM:协作研究:消除大数据应用中的数据摄取瓶颈
- 批准号:
1247726 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: DA: Collaborative Research: Genomes Galore - Core Techniques, Libraries, and Domain Specific Languages for High-Throughput DNA Sequencing
大数据:中规模:DA:协作研究:基因组丰富 - 高通量 DNA 测序的核心技术、库和领域特定语言
- 批准号:
1416259 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: DA : Collaborative Research Big Tensor Mining Theory
BIGDATA:中型:DA:协作研究大张量挖掘理论
- 批准号:
8599832 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
BIGDATA: Mid-Scale DCM: DA: ESCE: Discovering Molecular Processes
BIGDATA:中型 DCM:DA:ESCE:发现分子过程
- 批准号:
8599838 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
BIGDATA: Mid-Scale: DA: Distribution-based machine learning for high dimensional datasets
BIGDATA:中规模:DA:针对高维数据集的基于分布的机器学习
- 批准号:
1247658 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
Continuing Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature.
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析。
- 批准号:
1247696 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: DA: ESCE: Collaborative Research: Scalable Statistical Computing for Emerging Omics Data Streams
BIGDATA:中型:DA:ESCE:协作研究:新兴组学数据流的可扩展统计计算
- 批准号:
1247813 - 财政年份:2013
- 资助金额:
$ 64.35万 - 项目类别:
Standard Grant