Computational natural language processing and the neuro-cognition of language

计算自然语言处理和语言的神经认知

基本信息

  • 批准号:
    EP/F030061/1
  • 负责人:
  • 金额:
    $ 91.51万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Research Grant
  • 财政年份:
    2008
  • 资助国家:
    英国
  • 起止时间:
    2008 至 无数据
  • 项目状态:
    已结题

项目摘要

Scientific understanding of the human language system is one of the main challenges facing cognitive science, and of interest to fields as diverse as linguistics, psychology, anthropology, philosophy, biology and computer science. An adequate theory of this complex system would need to integrate scientific knowledge from several fields, many of which are still in a state of rapid development. One such field is cognitive neuroscience, which investigates language function in the human brain, with the aim of developing neurobiologically and cognitively plausible accounts of the human capacity for dynamic comprehension and production of language. A key input to this research is linguistic information about the core properties of language. This information is typically obtained from conventional resources (dictionaries and grammars) which provide useful generalisations about language, but which do not include statistical information about language use or capture the considerable variation that linguistic items undergo across time and age, data type, and genre. Such information would be an invaluable resource for neuro-cognitive experiments, increasing the plausibility of neurobiological models of language, but it can only be obtained by analysing linguistic patterns and their frequencies in the specific human language data (e.g. patient data, spoken language corpus) of experimental interest. Manual analysis of linguistic data is prohibitively expensive. Automated language analysis using computational Natural Language Processing (NLP) is now a viable alternative. The last decades have seen a massive expansion in the application of statistical and machine learning methods to NLP. This work has made large-scale processing of human language data possible and yielded impressive results in speech and language processing tasks, including e.g. speech recognition, morphological analysis, parsing, and semantic interpretation. Although the same methods could be used to provide realistic, data-driven linguistic input to neuro-cognitive studies involving language, there have been no systematic attempts to do this. The basic NLP technology is available, but it is inaccessible for researchers without considerable computing skills and requires further development for optimal integration with neuro-cognitive research. In this new interdisciplinary project we will integrate research in cognitive neuroscience, experimental psycholinguistics and NLP with the aim of providing the infrastructure for more realistic models of language structure for input into theoretically-driven empirical studies of language in the mind and brain. We will conduct a series of neuro-cognitive experiments which focus on the processing of the core components of language at the levels of morphology, syntax and semantics, using linguistic input automatically extracted from relevant human language data. NLP techniques will be improved and extended to deal with a wider range of constructions, domains and text types as required. An easy-to-use tool will then be designed which will enable effective search, extraction and summarisation of the linguistic information in the annotated data and optimal integration with neuro-cognitive experiments.We expect this project (i) to improve the quality of neuro-cognitive experiments by rooting them in a much more realistic linguistic analysis, (ii) to advance research in NLP by extending existing techniques enabling richer and deeper analysis, and (iii) to provide an important case study for the integration of NLP into critical experimental research in cognitive sciences. The long term goal of this investigation is improved scientific understanding of human language processing which can benefit several disciplines and place researchers in a better position to develop more useful language models, NLP technology, as well as treatments and rehabilitation of various language disorders in the future.
对人类语言系统的科学理解是认知科学面临的主要挑战之一,涉及语言学、心理学、人类学、哲学、生物学和计算机科学等多个领域。对这一复杂系统的充分理论需要整合来自几个领域的科学知识,其中许多领域仍处于快速发展状态。其中一个领域是认知神经科学,它研究人类大脑中的语言功能,目的是从神经生物学和认知角度对人类动态理解和产生语言的能力进行可信的解释。这项研究的一个关键输入是关于语言核心属性的语言信息。这种信息通常是从传统资源(词典和语法)获得的,这些资源提供了关于语言的有用概括,但不包括关于语言使用的统计信息,也不包括语言项目在时间和年龄、数据类型和体裁上经历的相当大的变化。这些信息将是神经认知实验的宝贵资源,增加了语言神经生物学模型的可信性,但它只能通过分析语言模式及其在实验感兴趣的特定人类语言数据(例如患者数据、口语语料库)中的频率来获得。人工分析语言数据的成本高得令人望而却步。使用计算自然语言处理(NLP)的自动语言分析现在是一种可行的替代方案。在过去的几十年里,统计和机器学习方法在自然语言处理中的应用得到了巨大的扩展。这项工作使大规模处理人类语言数据成为可能,并在语音和语言处理任务中取得了令人印象深刻的结果,包括语音识别、形态分析、句法分析和语义解释。虽然同样的方法可以用来为涉及语言的神经认知研究提供现实的、数据驱动的语言输入,但还没有系统地尝试这样做。基本的NLP技术是可用的,但对于没有相当计算技能的研究人员来说,它是不可用的,需要进一步开发,以实现与神经认知研究的最佳整合。在这个新的跨学科项目中,我们将整合认知神经科学、实验心理语言学和自然语言处理的研究,目的是为更现实的语言结构模型提供基础,以便输入到理论驱动的大脑和大脑语言的实证研究中。我们将进行一系列神经认知实验,利用从相关人类语言数据中自动提取的语言输入,在词法、句法和语义水平上处理语言的核心成分。自然语言处理技术将得到改进和扩展,以根据需要处理更广泛的结构、领域和文本类型。然后,我们将设计一个简单易用的工具,它将能够有效地搜索、提取和总结注释数据中的语言信息,并与神经认知实验进行最佳整合。我们希望这个项目(I)通过将神经认知实验植根于更现实的语言分析来提高神经认知实验的质量,(Ii)通过扩展现有技术来促进自然语言处理的研究,从而实现更丰富和更深入的分析,以及(Iii)为将自然语言处理整合到认知科学的关键实验研究中提供一个重要的案例研究。这项研究的长期目标是提高对人类语言处理的科学理解,这将使几个学科受益,并使研究人员处于更有利的地位,以开发更有用的语言模型、自然语言处理技术,以及未来各种语言障碍的治疗和康复。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Parsing sentences are unlikely: corpus-based analyses of the neural processing of verbs
解析句子是不可能的:基于语料库的动词神经处理分析
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Barry Devereux (Author)
  • 通讯作者:
    Barry Devereux (Author)
Improving Verb Clustering with Automatically Acquired Selectional Preferences
  • DOI:
    10.3115/1699571.1699596
  • 发表时间:
    2009-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lin Sun;A. Korhonen
  • 通讯作者:
    Lin Sun;A. Korhonen
Lexical Isolation Point Software: a tool for predicting the lexical isolation point of a word
词汇隔离点软件:预测单词词汇隔离点的工具
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Andrew Thwaites (Co-Author)
  • 通讯作者:
    Andrew Thwaites (Co-Author)
Hierarchical Verb Clustering Using Graph Factorization
  • DOI:
  • 发表时间:
    2011-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lin Sun;A. Korhonen
  • 通讯作者:
    Lin Sun;A. Korhonen
Proceedings of the Interdisciplinary Workshop on Verbs - The Identification and Representation of Verb Features
动词跨学科研讨会论文集 - 动词特征的识别和表示
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Anna Korhonen (Editor)
  • 通讯作者:
    Anna Korhonen (Editor)
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lorraine Tyler其他文献

Neural correlates of human memory
人类记忆的神经关联
  • DOI:
    10.1038/nn0102-8
  • 发表时间:
    2002-01-01
  • 期刊:
  • 影响因子:
    20.000
  • 作者:
    Paul Fletcher;Lorraine Tyler
  • 通讯作者:
    Lorraine Tyler
Susceptibility and semantics: Comparing PET and fMRI on a language task
  • DOI:
    10.1016/s1053-8119(00)91189-3
  • 发表时间:
    2000-05-01
  • 期刊:
  • 影响因子:
  • 作者:
    Joseph Devlin;Richard Russell;Matthew Davis;Cathy Price;James Wilson;P.M. Matthews;Lorraine Tyler
  • 通讯作者:
    Lorraine Tyler

Lorraine Tyler的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lorraine Tyler', 18)}}的其他基金

Systems Cognitive Neuroscience of Healthy Ageing: Population-Representative Studies of Functional Plasticity and Neural Change
健康老龄化的系统认知神经科学:功能可塑性和神经变化的群体代表性研究
  • 批准号:
    BB/H008217/1
  • 财政年份:
    2010
  • 资助金额:
    $ 91.51万
  • 项目类别:
    Research Grant
Exploring the conceptual structure of nouns and verbs
探索名词和动词的概念结构
  • 批准号:
    ES/E009859/1
  • 财政年份:
    2006
  • 资助金额:
    $ 91.51万
  • 项目类别:
    Research Grant
Cognitive neuroscience of normal and disordered language function
正常和紊乱语言功能的认知神经科学
  • 批准号:
    G0500842/1
  • 财政年份:
    2006
  • 资助金额:
    $ 91.51万
  • 项目类别:
    Research Grant

相似国自然基金

Natural超对称中的希格斯物理与暗物质研究
  • 批准号:
    11775039
  • 批准年份:
    2017
  • 资助金额:
    52.0 万元
  • 项目类别:
    面上项目
Natural超对称在LHC上的现象学研究
  • 批准号:
    11405015
  • 批准年份:
    2014
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
双硅化合物反应及天然产物合成应用研究
  • 批准号:
    21172150
  • 批准年份:
    2011
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
受体编辑在天然自身反应性B细胞发育耐受中的作用和机制研究
  • 批准号:
    30901336
  • 批准年份:
    2009
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目
海洋天然产物Amphidinolide G和H全合成研究
  • 批准号:
    20772148
  • 批准年份:
    2007
  • 资助金额:
    30.0 万元
  • 项目类别:
    面上项目
抗肾小球基底膜抗体的免疫学特性在疾病发生和发展中的作用
  • 批准号:
    30700752
  • 批准年份:
    2007
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Computational phenotyping of face expression in early psychosis
早期精神病面部表情的计算表型
  • 批准号:
    10608718
  • 财政年份:
    2023
  • 资助金额:
    $ 91.51万
  • 项目类别:
Computational modeling of language impairment and control in bilingual individuals with post-stroke aphasia and neurodegenerative disorders
中风后失语症和神经退行性疾病双语个体语言障碍和控制的计算模型
  • 批准号:
    10680656
  • 财政年份:
    2023
  • 资助金额:
    $ 91.51万
  • 项目类别:
Computational Ophthalmology and Biomedical Informatics
计算眼科和生物医学信息学
  • 批准号:
    10709404
  • 财政年份:
    2023
  • 资助金额:
    $ 91.51万
  • 项目类别:
Knowledge Engine- A computational approach to combatting dermatological health disparities in underserved communities
知识引擎 - 一种解决服务不足社区皮肤病健康差异的计算方法
  • 批准号:
    10697912
  • 财政年份:
    2023
  • 资助金额:
    $ 91.51万
  • 项目类别:
Computational psycholinguistic analysis of speech samples in PPA and AD and FTD
PPA、AD 和 FTD 中语音样本的计算心理语言学分析
  • 批准号:
    10373191
  • 财政年份:
    2022
  • 资助金额:
    $ 91.51万
  • 项目类别:
Computational Drug Repurposing for AD/ADRD with Integrative Analysis of Real World Data and Biomedical Knowledge
通过对真实世界数据和生物医学知识的综合分析,计算药物再利用用于 AD/ADRD
  • 批准号:
    10576853
  • 财政年份:
    2022
  • 资助金额:
    $ 91.51万
  • 项目类别:
Computational psycholinguistic analysis of speech samples in PPA and AD and FTD
PPA、AD 和 FTD 中语音样本的计算心理语言学分析
  • 批准号:
    10563169
  • 财政年份:
    2022
  • 资助金额:
    $ 91.51万
  • 项目类别:
New approaches to computational natural language processing using ancient Near Eastern text corpora
使用古代近东文本语料库进行计算自然语言处理的新方法
  • 批准号:
    547773-2020
  • 财政年份:
    2022
  • 资助金额:
    $ 91.51万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Computational Drug Repurposing for AD/ADRD with Integrative Analysis of Real World Data and Biomedical Knowledge
通过对真实世界数据和生物医学知识的综合分析,计算药物再利用用于 AD/ADRD
  • 批准号:
    10392169
  • 财政年份:
    2022
  • 资助金额:
    $ 91.51万
  • 项目类别:
Adapting Hierarchical Circuits from Planning to Language with Computational Modeling
通过计算建模调整从规划到语言的分层电路
  • 批准号:
    10709065
  • 财政年份:
    2022
  • 资助金额:
    $ 91.51万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了