Joining graph- and vector-based sense representations for semantic end-user information access (JOIN-T 2)
连接基于图和向量的意义表示以实现语义最终用户信息访问 (JOIN-T 2)
基本信息
- 批准号:259256643
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:德国
- 项目类别:Research Grants
- 财政年份:2014
- 资助国家:德国
- 起止时间:2013-12-31 至 2018-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In recent years, research in Natural Language Processing (NLP) has led to major breakthroughs in language understanding. Computational semantics is one of the key areas in NLP, and accordingly a plethora of work focused on the representations of machine-readable knowledge along orthogonal dimensions such as manual vs. automatic acquisition, lexical vs. conceptual as well as dense vs. sparse representations. However, much work still lies ahead on combining these different dimensions together to complement their strengths and provide a unified semantic model and knowledge resource to tackle complex high-end NLP tasks. We propose an approach to meaning representation in context that is based on the graph-vector duality, namely a hypothesis stating that both graph and vector representations of lexical entities should be used at the same time to describe the semantics of these entities. To this end, we propose a computational framework and resource that integrate all these dimensions and combine the interpretability of manually crafted resources and sparse representations with the accuracy and high coverage of dense neural embeddings. We build upon our previous work on joining ontologies with graph-based distributional semantics, and take it to the next level by: i) joining it with dense semantic vector representations (a.k.a. embeddings) of text and knowledge bases (KBs) in a unified graph-vector semantic model; ii) extending the coverage to the long tail of (infrequent) named entities, including emerging ones, by leveraging extractions from Web-scale corpora; iii) exploring the benefits of a joint lexical, distributional and ontological representation for a high-end NLP task such as the browsing of document collections along structures such as entities and events. This is an application for the continuation of our previous project "JOIN-T". We successfully have addressed most work packages from the first project phase and are planning to complete the remaining work packages in the months during proposal review. The choice of topics for this continuation is informed by the key takeaways from the first project phase, namely i) linking of distributional semantic information with lexical ontologies is possible with high accuracy ii) disambiguation of lexical items in context towards distributional senses or ontological senses is possible with high accuracy using graph-based representations, but at the expense of computational efficiency, which hampers their scaling to very large corpora.
近年来,自然语言处理(NLP)的研究在语言理解方面取得了重大突破。计算语义是自然语言处理的关键领域之一,因此大量的工作集中在机器可读知识的沿着正交维度的表示上,例如手动与自动获取,词汇与概念以及密集与稀疏表示。然而,在将这些不同的维度结合在一起以补充其优势并提供统一的语义模型和知识资源来解决复杂的高端NLP任务方面,还有很多工作要做。我们提出了一种基于图-向量对偶的上下文意义表示方法,即假设词汇实体的图和向量表示应同时用于描述这些实体的语义。为此,我们提出了一个计算框架和资源,它集成了所有这些维度,并将手动制作的资源和稀疏表示的可解释性与密集神经嵌入的准确性和高覆盖率联合收割机相结合。我们建立在我们以前的工作加入本体与基于图的分布式语义,并把它带到一个新的水平:i)加入它与密集的语义向量表示(a.k.a.嵌入)的文本和知识库(知识库)在一个统一的图形向量语义模型; ii)扩大覆盖范围的长尾(不常见)命名实体,包括新兴实体,通过利用从网络规模语料库中提取; iii)探索联合词汇的好处,分布式和本体论表示,结束NLP任务,例如沿着实体和事件等结构浏览文档集合。这是我们之前的项目“JOIN-T”的延续。我们成功地解决了项目第一阶段的大部分工作包,并计划在提案审查期间的几个月内完成剩余的工作包。这个延续的主题的选择是由第一个项目阶段的关键要点所告知的,即i)分布语义信息与词汇本体的链接是可能的,具有高准确性ii)使用基于图形的表示,可以高准确性地消除上下文中的词汇项对分布意义或本体意义的歧义,但以牺牲计算效率为代价,这阻碍了它们扩展到非常大的语料库。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Professor Dr. Christian Biemann其他文献
Professor Dr. Christian Biemann的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Professor Dr. Christian Biemann', 18)}}的其他基金
Semantic Methods for Computer-supported Writing Aids
计算机支持写作辅助的语义方法
- 批准号:
249088706 - 财政年份:2014
- 资助金额:
-- - 项目类别:
Research Grants
Unitizing Plot to Advance Analysis of Narrative Structure (PLANS)
整合情节以推进叙事结构分析(计划)
- 批准号:
434552206 - 财政年份:
- 资助金额:
-- - 项目类别:
Priority Programmes
Answering Comparative Questions with Arguments (ACQuA 2.0)
用论证回答比较问题(ACQuA 2.0)
- 批准号:
376430233 - 财政年份:
- 资助金额:
-- - 项目类别:
Priority Programmes
相似国自然基金
基于Graph-PINN的层结稳定度参数化建模与沙尘跨介质耦合传输模拟研
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
平面三角剖分flip graph的强凸性研究
- 批准号:12301432
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于graph的多对比度磁共振图像重建方法
- 批准号:61901188
- 批准年份:2019
- 资助金额:24.5 万元
- 项目类别:青年科学基金项目
基于de bruijn graph梳理的宏基因组拼接算法开发
- 批准号:61771009
- 批准年份:2017
- 资助金额:50.0 万元
- 项目类别:面上项目
基于Graph和ISA的红外目标分割与识别方法研究
- 批准号:61101246
- 批准年份:2011
- 资助金额:22.0 万元
- 项目类别:青年科学基金项目
固定参数可解算法在平面图问题的应用以及和整数线性规划的关系
- 批准号:60973026
- 批准年份:2009
- 资助金额:32.0 万元
- 项目类别:面上项目
图的一般染色数与博弈染色数
- 批准号:10771035
- 批准年份:2007
- 资助金额:18.0 万元
- 项目类别:面上项目
中国Web Graph的挖掘与应用研究
- 批准号:60473122
- 批准年份:2004
- 资助金额:23.0 万元
- 项目类别:面上项目
组合设计及其大集
- 批准号:10371031
- 批准年份:2003
- 资助金额:20.0 万元
- 项目类别:面上项目
相似海外基金
SHINE: Understanding the Relationships of Photospheric Vector Magnetic Field Parameters in Solar Flare Occurrences using Graph-based Machine Learning Models
SHINE:使用基于图的机器学习模型了解太阳耀斑发生时光球矢量磁场参数的关系
- 批准号:
2301397 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Learn Systems Biology Equations From Snapshot Single Cell Genomic Data
从快照单细胞基因组数据学习系统生物学方程
- 批准号:
10736507 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Improving the design and statistical analysis of cluster-randomized trials on tropical infectious diseases
改进热带传染病整群随机试验的设计和统计分析
- 批准号:
10570440 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Fetal Programming of Human Newborn Energy Homeostasis Brain Networks
人类新生儿能量稳态大脑网络的胎儿编程
- 批准号:
10758984 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Imaging and multi-omics analyses to identify molecular subtypes of distinct emphysema patterns
影像学和多组学分析可识别不同肺气肿模式的分子亚型
- 批准号:
10736162 - 财政年份:2023
- 资助金额:
-- - 项目类别:
AE2Vec: Medical concept embedding and time-series analysis for automated adverse event detection
AE2Vec:用于自动不良事件检测的医学概念嵌入和时间序列分析
- 批准号:
10751964 - 财政年份:2023
- 资助金额:
-- - 项目类别:
New approach for identification pHFO networks to predict epileptogenesis
识别 pHFO 网络以预测癫痫发生的新方法
- 批准号:
10665791 - 财政年份:2022
- 资助金额:
-- - 项目类别:
A translational bioinformatics approach to elucidate and mitigate polypharmacy induced adverse drug reactions
阐明和减轻复方用药引起的药物不良反应的转化生物信息学方法
- 批准号:
10507532 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Causal graphical methods for high-dimensional heterogeneous biomedical data
高维异构生物医学数据的因果图方法
- 批准号:
10388447 - 财政年份:2022
- 资助金额:
-- - 项目类别:
VIOLIN 2.0: Vaccine Information and Ontology LInked kNowledgebase
VIOLIN 2.0:疫苗信息和本体链接知识库
- 批准号:
10687095 - 财政年份:2022
- 资助金额:
-- - 项目类别: