RI-Small: Probabilistic Models for Structure Discovery in Text
RI-Small:文本结构发现的概率模型
基本信息
- 批准号:0915187
- 负责人:
- 金额:$ 44.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-01 至 2013-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project advances learning methods for obtaining linguistic knowledge from raw or nearly raw text; such knowledge constitutes a core component of natural language processing technology but is difficult to obtain, usually relying on expensive manual annotation of text data. Specifically, this project aims to automate some of the mechanical aspects of developing learning algorithms for linguistic structure (in part by using a empirical Bayesian framework to unify considerable past work by the PI and others), to enrich models with richer linguistic bias (particularly through lexicalization and integration of morphology and syntax), and to apply these techniques to new natural language processing problems (identifying boilerplate and quotation extraction). Another exciting dimension is learning from text collections in multiple languages (not necessarily including translations), which past work has shown can lead to better unsupervised learning. The project will lead to working systems, including generic tools applicable to many problems in natural language processing and machine learning. These tools will provide infrastructure for the PI's courses and will be publicly available to the research community. Research results will be published in leading journals and at major conferences. The project supports one primary graduate student and a post-doctoral researcher. Major impacts of this project will be improvements in the quality of rapidly ported natural language processing tools for new languages and text domains, as well as a deeper scientific understanding of natural language learning by machines.
该项目推进了从原始或接近原始文本中获取语言知识的学习方法;这些知识构成了自然语言处理技术的核心组成部分,但很难获得,通常依赖于昂贵的文本数据手动注释。 具体来说,这个项目的目的是自动化的一些机械方面的发展学习算法的语言结构(部分通过使用经验贝叶斯框架来统一PI和其他人过去的大量工作),以丰富语言偏见来丰富模型(特别是通过词汇化和词法与句法的整合),并将这些技术应用于新的自然语言处理问题(识别样板和引文提取)。 另一个令人兴奋的方面是从多种语言的文本集合中学习(不一定包括翻译),过去的工作表明这可以导致更好的无监督学习。 该项目将产生工作系统,包括适用于自然语言处理和机器学习中许多问题的通用工具。 这些工具将为PI的课程提供基础设施,并将公开提供给研究界。 研究成果将在主要期刊和主要会议上发表。 该项目资助一名小学研究生和一名博士后研究员。 该项目的主要影响将是提高用于新语言和文本领域的快速移植自然语言处理工具的质量,以及对机器自然语言学习的更深入的科学理解。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Noah Smith其他文献
Buying health: assessing the impact of a consumer-side vegetable subsidy on purchasing, consumption and waste
购买健康:评估消费者侧蔬菜补贴对购买、消费和浪费的影响
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:3.2
- 作者:
Noah Smith - 通讯作者:
Noah Smith
Implications for cumulative and prolonged clinical improvement induced by cross-linked hyaluronic acid: An in vivo biochemical/microscopic study in humans.
交联透明质酸诱导的累积和长期临床改善的影响:人类体内生化/显微镜研究。
- DOI:
10.1111/exd.14998 - 发表时间:
2024 - 期刊:
- 影响因子:3.6
- 作者:
Frank Wang;T. Do;Noah Smith;J. Orringer;Sewon Kang;John J Voorhees;Gary J. Fisher - 通讯作者:
Gary J. Fisher
THE NORTH ATLANTIC TREATY ORGANIZATION AND UNITED STATES RELATIONSHIP: A STUDY OF ITS DEVELOPMENT AND POSSIBLE FUTURE
北大西洋公约组织与美国的关系:对其发展和可能的未来的研究
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Noah Smith - 通讯作者:
Noah Smith
Constructions of locally recoverable codes with large availability
- DOI:
10.1007/s10623-025-01624-w - 发表时间:
2025-04-05 - 期刊:
- 影响因子:1.200
- 作者:
Giacomo Micheli;Vincenzo Pallozzi Lavorante;Abhi Shukul;Noah Smith - 通讯作者:
Noah Smith
Biopsy of Suspected Melanoma
疑似黑色素瘤活检
- DOI:
10.1007/978-3-319-46029-1_10-1 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Noah Smith;T. Johnson;J. Kelly;A. Sober;C. Bichakjian - 通讯作者:
C. Bichakjian
Noah Smith的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Noah Smith', 18)}}的其他基金
NSF-BSF: RI: Small: Efficient Transformers via Formal and Empirical Analysis
NSF-BSF:RI:小型:通过形式和经验分析的高效变压器
- 批准号:
2113530 - 财政年份:2021
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI/SES: Conference Proposal: Doctoral Consortium on Text as Data
RI/SES:会议提案:文本即数据博士联盟
- 批准号:
1830158 - 财政年份:2018
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties
NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响
- 批准号:
1813153 - 财政年份:2018
- 资助金额:
$ 44.99万 - 项目类别:
Continuing Grant
RI: Medium: Broad-Coverage Semantic Parsing: Linguistic Representation Learning from Crowd-Scale Data
RI:中:广泛覆盖的语义解析:从人群规模数据中学习语言表示
- 批准号:
1562364 - 财政年份:2016
- 资助金额:
$ 44.99万 - 项目类别:
Continuing Grant
Workshop: Support for a workshop on scientific research applications of natural language technologies
研讨会:支持自然语言技术科研应用研讨会
- 批准号:
1433108 - 财政年份:2014
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
BIGDATA: Small: DA: Big Multilinguality for Data-Driven Lexical Semantics
BIGDATA:小:DA:数据驱动词汇语义的大多语言性
- 批准号:
1251131 - 财政年份:2013
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
EAGER: PARTIAL: An Exploratory Study on Practical Approaches for Robust NLP Tools with Integrated Annotation Languages
EAGER: PARTIAL:关于具有集成注释语言的鲁棒 NLP 工具实用方法的探索性研究
- 批准号:
1352440 - 财政年份:2013
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
SoCS: Collaborative Research: Data-Driven, Computational Models for Discovery and Analysis of Framing
SoCS:协作研究:用于发现和分析框架的数据驱动计算模型
- 批准号:
1211277 - 财政年份:2012
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
CAREER: Flexible Learning for Natural Language Processing
职业:自然语言处理的灵活学习
- 批准号:
1054319 - 财政年份:2011
- 资助金额:
$ 44.99万 - 项目类别:
Continuing Grant
SGER: Scaling up unsupervised grammar induction
SGER:扩大无监督语法归纳
- 批准号:
0836431 - 财政年份:2008
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
RI: Small: New Directions in Probabilistic Deep Learning: Exponential Families, Bayesian Nonparametrics and Empirical Bayes
RI:小:概率深度学习的新方向:指数族、贝叶斯非参数和经验贝叶斯
- 批准号:
2127869 - 财政年份:2021
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Anytime Algorithms and Bounds for Probabilistic Graphical Models
RI:小:概率图形模型的随时算法和界限
- 批准号:
2008516 - 财政年份:2020
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Embracing Deep Neural Networks into Probabilistic Answer Set Programming
RI:小:将深度神经网络融入概率答案集编程
- 批准号:
2006747 - 财政年份:2020
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Stochastic Planning and Probabilistic Inference for Factored State and Action Spaces
RI:小:因子状态和行动空间的随机规划和概率推理
- 批准号:
2002393 - 财政年份:2019
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Expressive Reasoning and Learning about Actions under Uncertainty via Probabilistic Extension of Action Language
RI:小:通过动作语言的概率扩展来表达推理和学习不确定性下的动作
- 批准号:
1815337 - 财政年份:2018
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Parallel Methods for Large-Scale Probabilistic Inference
RI:小型:大规模概率推理的并行方法
- 批准号:
1829403 - 财政年份:2017
- 资助金额:
$ 44.99万 - 项目类别:
Continuing Grant
RI: Small: Stochastic Planning and Probabilistic Inference for Factored State and Action Spaces
RI:小:因子状态和行动空间的随机规划和概率推理
- 批准号:
1616280 - 财政年份:2016
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Probabilistic Hierarchical Models for Multi-Task Visual Recognition
RI:小型:多任务视觉识别的概率分层模型
- 批准号:
1618903 - 财政年份:2016
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Deep Natural Language Understanding with Probabilistic Logic and Distributional Similarity
RI:小:利用概率逻辑和分布相似性进行深度自然语言理解
- 批准号:
1523637 - 财政年份:2015
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Knowledge Representation and Reasoning under Uncertainty with Probabilistic Answer Set Programming
RI:小:不确定性下的知识表示和推理与概率答案集编程
- 批准号:
1526301 - 财政年份:2015
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant