RI: Small: Linguistic Structure in Neural Sequence Models
RI:小:神经序列模型中的语言结构
基本信息
- 批准号:1718846
- 负责人:
- 金额:$ 39.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2017
- 资助国家:美国
- 起止时间:2017-08-01 至 2021-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Over the past 25 years, the field of artificial intelligence has made great strides in the ability to automatically analyze and generate sequential data. Much of this progress has come by building probabilistic models. For example, mathematical descriptions of how words are typically used in context are based on a scientific understanding of the relationships among letters, sounds, words, and phrases, thanks to the field of linguistics. Probabilistic models based on this understanding have allowed us to develop computational, data-driven methods for reasoning about the likely structure and meaning of sentences. In the same way, probabilistic models of sequences of events have led to computational methods for predicting the unfolding of future events and reconstructing the ordering of past ones. This project starts with sophisticated probabilistic models of linguistic structure and event sequences, and aims to make them more powerful, by using "deep learning" (neural networks) to increase their sensitivity to contextual effects. Deep learning has already recently had a revolutionary impact on artificial intelligence. This research will focus on using deep learning to enhance probabilistic models in settings where the model must discover structure that is not provided in its training data, such as the compositional units of language or the causal relations among events.The planned model design will not focus on hand-engineered features, but rather on broad representational choices. The overall architectures are motivated by certain basic notions that linguists and other modelers have found indispensable in their analyses of empirical data as follows: (1) stick-breaking processes that respect duality of patterning, the linguistic notion that a word's internal form is not necessarily related to its external usage but is governed by separate rules or by chance; (2) finite-state transducers that can capture local editing that transforms an input sequence into an output sequence; (3) context-free grammars that can model hierarchical structure to help explain word sequences; and (4) temporal point processes that can capture process intensity, where different events are competing to occur next, and combinations of earlier events combine to elevate or suppress the rates of later events. The project will infuse these probabilistic techniques with recurrent neural networks, in particular, long short-term memory (LSTM) networks. In some cases, exact inference in the resulting models will not be tractable, necessitating the design of Monte Carlo or variational approximations.
在过去的25年里,人工智能领域在自动分析和生成顺序数据的能力方面取得了长足的进步。这一进步在很大程度上是通过建立概率模型取得的。例如,语言学领域对单词在上下文中的典型使用方式的数学描述是基于对字母、声音、单词和短语之间关系的科学理解。基于这一理解的概率模型使我们能够开发出计算的、数据驱动的方法,用于推理句子的可能结构和意义。同样,事件序列的概率模型导致了预测未来事件的展开和重建过去事件的顺序的计算方法。这个项目从复杂的语言结构和事件序列的概率模型开始,旨在通过使用“深度学习”(神经网络)来提高它们对上下文影响的敏感度,从而使它们变得更加强大。深度学习最近已经对人工智能产生了革命性的影响。这项研究的重点是在模型必须发现训练数据中没有提供的结构的情况下,使用深度学习来增强概率模型,例如语言的组成单位或事件之间的因果关系。计划中的模型设计不会关注手工设计的特征,而是关注广泛的代表性选择。整体架构是由语言学家和其他模型师发现在他们的经验数据分析中不可或缺的某些基本概念所驱动的:(1)尊重模式二元性的折断过程,即一个词的内部形式不一定与其外部用法相关,而是受单独的规则或偶然支配的语言概念;(2)可以捕获将输入序列转换为输出序列的局部编辑的有限状态转换器;(3)可以对层次结构进行建模以帮助解释单词序列的上下文无关语法;以及(4)可以捕捉过程强度的时间点过程,在该过程中,不同的事件竞相发生,并且早期事件的组合组合可以提高或抑制后期事件的发生率。该项目将把这些概率技术注入递归神经网络,特别是长期短期记忆(LSTM)网络。在某些情况下,所得到的模型中的精确推论将不容易处理,这就需要设计蒙特卡罗或变分近似。
项目成果
期刊论文数量(31)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Deep Generative Model of Vowel Formant Typology
元音共振峰类型学的深层生成模型
- DOI:10.18653/v1/n18-1004
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Cotterell, Ryan;Eisner, Jason
- 通讯作者:Eisner, Jason
Between words and characters: A Brief History of Open-Vocabulary Modeling and Tokenization in NLP
- DOI:
- 发表时间:2021-12
- 期刊:
- 影响因子:0
- 作者:Sabrina J. Mielke;Zaid Alyafeai;Elizabeth Salesky;Colin Raffel;Manan Dey;Matthias Gallé;Arun Raja;Chenglei Si;Wilson Y. Lee;Benoît Sagot;Samson Tan
- 通讯作者:Sabrina J. Mielke;Zaid Alyafeai;Elizabeth Salesky;Colin Raffel;Manan Dey;Matthias Gallé;Arun Raja;Chenglei Si;Wilson Y. Lee;Benoît Sagot;Samson Tan
On the Diachronic Stability of Irregularity in Inflectional Morphology
论屈折形态中不规则性的历时稳定性
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Ryan Cotterell;Christo Kirov;Mans Hulden;Jason Eisner
- 通讯作者:Jason Eisner
Unsupervised Disambiguation of Syncretism in Inflected Lexicons
- DOI:10.18653/v1/n18-2087
- 发表时间:2018-06
- 期刊:
- 影响因子:0
- 作者:Ryan Cotterell;Christo Kirov;Sabrina J. Mielke;Jason Eisner
- 通讯作者:Ryan Cotterell;Christo Kirov;Sabrina J. Mielke;Jason Eisner
Spelling-Aware Construction of Macaronic Texts for Teaching Foreign-Language Vocabulary
用于外语词汇教学的马卡罗语文本的拼写感知构建
- DOI:10.18653/v1/d19-1679
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Renduchintala, Adithya;Koehn, Philipp;Eisner, Jason
- 通讯作者:Eisner, Jason
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jason Eisner其他文献
Grammar Induction: Beyond Local Search
语法归纳:超越本地搜索
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Jason Eisner - 通讯作者:
Jason Eisner
A Glitch in the Matrix? Locating and Detecting Language Model Grounding with Fakepedia
矩阵中的故障?
- DOI:
10.48550/arxiv.2312.02073 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Giovanni Monea;Maxime Peyrard;Martin Josifoski;Vishrav Chaudhary;Jason Eisner;Emre Kiciman;Hamid Palangi;Barun Patra;Robert West - 通讯作者:
Robert West
Structure-Aware Path Inference for Neural Finite State Transducers
神经有限状态传感器的结构感知路径推理
- DOI:
10.48550/arxiv.2312.13614 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Weiting Tan;Chu;Jason Eisner - 通讯作者:
Jason Eisner
Learning to Retrieve Iteratively for In-Context Learning
学习迭代检索以进行情境学习
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Yunmo Chen;Tongfei Chen;Harsh Jhamtani;Patrick Xia;Richard Shin;Jason Eisner;Benjamin Van Durme - 通讯作者:
Benjamin Van Durme
Analyzing Learner Understanding of Novel L2 Vocabulary
分析学习者对新的 L2 词汇的理解
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Rebecca Knowles;Adithya Renduchintala;Philipp Koehn;Jason Eisner - 通讯作者:
Jason Eisner
Jason Eisner的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jason Eisner', 18)}}的其他基金
XPS: FULL: Collaborative Research: Parallel and Distributed Circuit Programming for Structured Prediction
XPS:完整:协作研究:用于结构化预测的并行和分布式电路编程
- 批准号:
1629564 - 财政年份:2016
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
RI: Small: CompCog: Modeling Latent Discrete Knowledge Across Utterances
RI:小:CompCog:跨话语的潜在离散知识建模
- 批准号:
1423276 - 财政年份:2014
- 资助金额:
$ 39.5万 - 项目类别:
Continuing Grant
RI: Medium: Learned Dynamic Prioritization
RI:中:学习动态优先级
- 批准号:
0964681 - 财政年份:2010
- 资助金额:
$ 39.5万 - 项目类别:
Continuing Grant
CAREER: Finite-State Machine Learning on Strings and Sequences
职业:字符串和序列的有限状态机器学习
- 批准号:
0347822 - 财政年份:2004
- 资助金额:
$ 39.5万 - 项目类别:
Continuing Grant
ITR: Weighted Dynamic Programming for Statistical Natural Language Processing
ITR:统计自然语言处理的加权动态规划
- 批准号:
0313193 - 财政年份:2003
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
- 批准号:
2312089 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
- 批准号:
2342833 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
- 批准号:
2343062 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
- 批准号:
2403559 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
- 批准号:
24K13443 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
- 批准号:
2332922 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
- 批准号:
2329908 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
- 批准号:
2331111 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331302 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331301 - 财政年份:2024
- 资助金额:
$ 39.5万 - 项目类别:
Standard Grant