Efficient index data structures and natural language processing for semantic full-text search

用于语义全文搜索的高效索引数据结构和自然语言处理

基本信息

项目摘要

Ziel des Projektes ist ein voll-funktionales System für effiziente semantische Volltextsuche. Der Forschungsschwerpunkt liegt dabei auf der Entwicklung effizienter Indexdatenstrukturen sowie auf einer effizienten natürlichen Sprachverarbeitung für diese Art von Suche. Das System sollte es uns zum Beispiel ermöglichen in einer gegebenen Dokumentensammlung nach “plants with edible leaves” zu suchen, und dabei etwa die Passage “Broccoli: the edible portion is stem tissue, flower buds, and some small leaves” als Treffer zurückliefen, nicht aber “Bananas are eaten deep fried, or steamed in glutinous rice wrapped in a banana leaf”. Dafür benötigen wir ein gewisses Maß an natürlicher Sprachverarbeitung, die zum Beispiel erkennt, dass in diesen beiden Sätzen sowohl mit “Broccoli” als auch “Banana” die “plant” gemeint ist (und nicht etwa die amerikanische Filmproduzentin Barbara Broccoli oder die Hafenstadt Banana im Kongo), und dass im ersten Satz “Broccoli”, “edible” und “leaves” zusammengehören, im zweiten Satz dagegen “Bananas”, “eaten” und “leaf” nicht. Das System soll insbesondere für die englische Wikipedia (ca. 30 GB an Text) in Kombination mit einer Ontologie wie Yago (ca. 10 Millionen Entitäten) zum Laufen gebracht werden. Ziel für die Vorverarbeitungszeit sind 5 MB Volltext / Sekunde. Ziel für die Anfragezeit sind höchstens 50 Millisekunden pro Anfrage.
Ziel des Projektes ist in voll- functionales System fr effiziente semantische Volltextsuche。Der Forschungsschwerpunkt liegt dabei auf Der Entwicklung effizienter indexdatenstruckturen sof iner effizienten natrlichen Sprachverarbeitung fr diese Art von Suche。System sollte es uns zum Beispiel ermöglichen in einer gegebenen Dokumentensammlung nach“有可食用叶子的植物”zu suchen, and dabei etwa die Passage“西兰花:可食用的部分是茎组织、花蕾和一些小叶子”;Treffer zurckliefen,“香蕉是油炸的,或者用香蕉叶包在糯米里蒸”。dafr benötigen wir ein gewisses masß an natrrichher Sprachverarbeitung, die zum Beispiel erkennt, dass in diesen beiten Sätzen sowohl mit“西兰花”als auch“香蕉”die die Hafenstadt Banana in Kongo), dass in ersten Satz“西兰花”,“可食用”和“叶子”zusammengehören, imzweiten Satz dagegen“香蕉”,“可食用”和“叶子”晚上。该系统还将<s:1>英文维基百科(约30 GB)与Yago(约1000万Entitäten) zum Laufen gebracht werden结合在一起。Ziel f<s:1> r die Vorverarbeitungszeit s5mb Volltext / Sekunde。Ziel f<s:1> r die Anfragezeit sind höchstens 50毫秒。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professorin Dr. Hannah Bast其他文献

Professorin Dr. Hannah Bast的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professorin Dr. Hannah Bast', 18)}}的其他基金

Efficient Semantic Search on Big Data
大数据的高效语义搜索
  • 批准号:
    254890286
  • 财政年份:
    2014
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
Effiziente Suche in sehr großen Textmengen, Datenbanken und Ontologien
在大量文本、数据库和本体中进行高效搜索
  • 批准号:
    47940109
  • 财政年份:
    2007
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes

相似国自然基金

统计过程控制图设计理论的深入研究
  • 批准号:
    11071128
  • 批准年份:
    2010
  • 资助金额:
    27.0 万元
  • 项目类别:
    面上项目
机器具有中断条件下的随机调度问题
  • 批准号:
    70671043
  • 批准年份:
    2006
  • 资助金额:
    19.0 万元
  • 项目类别:
    面上项目

相似海外基金

Computational and neural signatures of interoceptive learning in anorexia nervosa
神经性厌食症内感受学习的计算和神经特征
  • 批准号:
    10824044
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
Validation of biomarkers of infant and toddler carotenoid intake
婴幼儿类胡萝卜素摄入量生物标志物的验证
  • 批准号:
    10636537
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Promesa: Urban gardening and peer nutritional counseling to improve HIV care outcomes among people with food insecurity in the Dominican Republic
Promesa:城市园艺和同伴营养咨询可改善多米尼加共和国粮食不安全人群的艾滋病毒护理结果
  • 批准号:
    10698434
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
The Renin-Angiotensin System in Air Pollution-Mediated Exacerbation of Obesity.
空气污染介导的肥胖加剧中的肾素-血管紧张素系统。
  • 批准号:
    10654124
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Sedentary behavior, physical activity, and 24-hour behavior in pregnancy and offspring health: the Pregnancy 24/7 Offspring Study
久坐行为、体力活动和 24 小时行为对怀孕和后代健康的影响:怀孕 24/7 后代研究
  • 批准号:
    10654333
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Sex-specific Impact of Prenatal Opioids on Brain Reward Signaling and Neonatal Feeding Regulation
产前阿片类药物对大脑奖赏信号和新生儿喂养调节的性别特异性影响
  • 批准号:
    10506345
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Evaluation of the Sensitivity to Endocrine Therapy (SET ER/PR) Assay to predict benefit from extended duration of adjuvant endocrine therapy in the NSABP B-42 trial
NSABP B-42 试验中内分泌治疗敏感性 (SET ER/PR) 测定的评估,用于预测延长辅助内分泌治疗持续时间的益处
  • 批准号:
    10722146
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Genome Editing Therapy for Usher Syndrome Type 3
针对 3 型亚瑟综合症的基因组编辑疗法
  • 批准号:
    10759804
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Multi-level intervention to promote healthy beverage choices among Navajo families
多层次干预促进纳瓦霍家庭选择健康饮料
  • 批准号:
    10776269
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Increasing initiation of evidence-based weight loss treatment
越来越多地开始开展循证减肥治疗
  • 批准号:
    10735201
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了