Exploring structural constraints in neural network approaches for Natural Language Processing.
探索自然语言处理神经网络方法的结构约束。
基本信息
- 批准号:2260933
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2020
- 资助国家:英国
- 起止时间:2020 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Building effective and efficient models from data that map input structures to output structures is the lifeblood of Statistical Natural Language Processing (NLP). As an example, machine translation maps an input sequence in one language to an output sequence in another language, while syntactic and semantic analysers map input sequences to graphs, which express the structure of the sentence. In all of these cases, outputs that are predicted for a subset of an input sequence severely affect which remaining predictions are plausible. Namely, the outputs are structured.Neural network models have brought great advances to NLP modelling, since they boast of multiple alluring properties, such as scalable learning on web-scale datasets, learning reusable linguistic representations from raw text and having the ability to combine submodules from multiple modalities (text, image, speech) to learn complex mappings from inputs to outputs. However, the adoption of neural network models for NLP has come with some compromises. It is less clear what neural network models learn about structure. Furthermore, it is generally assumed that a large amount of annotated training data is readily available, an assumption that for many languages and domains (healthcare) is not realistic.In this project we aim to revisit the benefits of earlier structured approaches and intersect them with the beneficial traits of neural network models. Can we leverage neural models that are structure-aware to obtain effective and efficient models using less data? To this end, we will strive to better understand how neural network models effectively capture structure, despite the fact that most neural models don't explicitly model it. In addition, we will compare approaches that embed structure and constraints in neural models and contrast the dependence of these models on the amount of available training data.
从将输入结构映射到输出结构的数据构建有效和高效的模型是统计自然语言处理(NLP)的生命线。例如,机器翻译将一种语言的输入序列映射到另一种语言的输出序列,而句法和语义分析器将输入序列映射到表达句子结构的图形。在所有这些情况下,为输入序列的子集预测的输出严重影响剩余预测的合理性。神经网络模型为NLP建模带来了巨大的进步,因为它们拥有多种诱人的特性,例如在网络规模的数据集上进行可扩展学习,从原始文本中学习可重用的语言表示,以及能够联合收割机从多种模态(文本,图像,语音)中组合子模块,以学习从输入到输出的复杂映射。然而,采用神经网络模型进行NLP也带来了一些妥协。目前尚不清楚神经网络模型如何学习结构。此外,通常假设大量带注释的训练数据是现成的,这一假设对于许多语言和领域(医疗保健)来说是不现实的。在这个项目中,我们的目标是重新审视早期结构化方法的好处,并将它们与神经网络模型的有益特征相结合。我们是否可以利用结构感知的神经模型来使用更少的数据获得有效和高效的模型?为此,我们将努力更好地理解神经网络模型如何有效地捕捉结构,尽管大多数神经模型并没有明确地对其进行建模。此外,我们将比较在神经模型中嵌入结构和约束的方法,并对比这些模型对可用训练数据量的依赖性。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
CuAgSe基热电材料的结构特性与构效关系研究
- 批准号:22375214
- 批准年份:2023
- 资助金额:50.00 万元
- 项目类别:面上项目
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
染色体结构维持蛋白1在端粒DNA双链断裂损伤修复中的作用及其机理
- 批准号:31801145
- 批准年份:2018
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
典型团簇结构模式随尺度变化的理论计算研究
- 批准号:21043001
- 批准年份:2010
- 资助金额:10.0 万元
- 项目类别:专项基金项目
气动/结构耦合动力学系统目标敏感性分析的快速准确计算方法及优化设计研究
- 批准号:10402036
- 批准年份:2004
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Biophysical constraints of influenza neuraminidase evolution
流感神经氨酸酶进化的生物物理限制
- 批准号:
10654846 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Biophysical constraints of influenza neuraminidase evolution
流感神经氨酸酶进化的生物物理限制
- 批准号:
10522548 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Structural constraints on large-scale brain activity in psychosis associated with chromosome 22q11.2 deletion syndrome
与染色体 22q11.2 缺失综合征相关的精神病中大规模大脑活动的结构限制
- 批准号:
10092219 - 财政年份:2019
- 资助金额:
-- - 项目类别:
Biophysical constraints on evolution of enzyme specificity
酶特异性进化的生物物理限制
- 批准号:
9892055 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Unraveling constraints on motor cortical activity exploration and shaping during structural skill learning using large-scale 2-photon imaging and holographic optogenetic stimulation
使用大规模 2 光子成像和全息光遗传学刺激,揭示结构技能学习过程中运动皮层活动探索和塑造的限制
- 批准号:
9788757 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Biophysical constraints on evolution of enzyme specificity
酶特异性进化的生物物理限制
- 批准号:
10200837 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Random permutations and partitions with structural constraints
具有结构约束的随机排列和划分
- 批准号:
2106382 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Studentship
Collaborative Research: Structural Constraints on Microcontinent Formation, Gulf of California
合作研究:加利福尼亚湾微大陆形成的结构约束
- 批准号:
1728145 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Continuing Grant
Collaborative Research: Structural Constraints on Microcontinent Formation, Gulf of California
合作研究:加利福尼亚湾微大陆形成的结构约束
- 批准号:
1728690 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Continuing Grant
Doctoral Dissertation Research: Structural Constraints to Economic Mobility Among Highly Educated Youth
博士论文研究:受过高等教育的青年经济流动性的结构性限制
- 批准号:
1558732 - 财政年份:2016
- 资助金额:
-- - 项目类别:
Standard Grant