Semantische Duplikaterkennung mithilfe von Textual Entailment
使用文本蕴涵进行语义重复检测
基本信息
- 批准号:81487564
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:德国
- 项目类别:Research Grants
- 财政年份:2008
- 资助国家:德国
- 起止时间:2007-12-31 至 2011-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Die automatische Erkennung von Duplikaten bzw. Plagiaten textuell gegebener Informationen, und nur auf diese wollen wir uns in dem vorgeschlagenen Projekt konzentrieren, hat nicht nur erhebliche rechtliche und ethische Konsequenzen, sondern auch eine zunehmende wirtschaftliche Bedeutung. Das Spektrum der relevanten gesellschaftlichen bzw. ökonomischen Phänomene reicht dabei vom Patentdiebstahl über Produktpiraterie bis hin zu wissenschaftlichen Fälschungen. Aber auch im Bereich der Informationsrecherche über hochredundanten Quellen (wie z. B. dem Internet) ist es wichtig, Dubletten oder Redundanzen in den Antworten zu erkennen und auf eine Kerninformation zu reduzieren. Es werden also dringend Systeme benötigt, die automatisch semantisch ähnliche oder gar äquivalente Texte erkennen können. Das Ziel dieses Projektantrags ist es, genau ein solches semantisch orientiertes Duplikaterkennungssystem (kurz SemDupl genannt) zu entwickeln. Die Technik bzw. das theoretische Gebiet, das diesem System zugrunde liegt, nennt man Textual Entailment (textuelles Schlussfolgern), oder kurz TE. Während die meisten TE-Systeme syntax- oder oberflächenbasiert sind, wird in diesem Projekt ein semantischer Ansatz verfolgt. Letzterer setzt eine voll ausgebaute syntaktisch-semantische Analyse von Texten voraus, die natürlichsprachliche Ausdrücke (Phrasen, Sätze, Texte) automatisch in entsprechende Bedeutungsstrukturen übersetzen kann. Da einer solchen Analyse alle Sprachebenen (Oberflächenform des Satzes, lemmatisierte Form, syntaktische und semantische Struktur) zur Verfügung stehen, können auf dieser Basis flache, statistisch basierte Verfahren mit tiefen semantischen und damit auch logikbasierten Verfahren kombiniert werden. Damit lassen sich robuste Erkennungssysteme mit hoher Erkennungsrate realisieren. Im Rahmen des beantragten Projektes soll das System SemDupl zwar schwerpunktmäßig für das Deutsche entwickelt werden. Es ist aber gleichzeitig anhand eines Pilotsystems zu zeigen, dass die vorgeschlagenen tiefen semantischen Verfahren auch für multilinguale Anwendungen, angefangen von Duplikat-/Plagiaterkennung bis hin zur automatischen Übersetzung (genauer: für den Nachweis der semantischen Äquivalenz von Übersetzungen), geeignet sind.
模具自动化制造与重复加工。剽窃文本和信息,剽窃文本和信息,剽窃文本和信息,剽窃文本和信息,剽窃文本和信息,剽窃文本和信息,剽窃文本和信息,剽窃文本。相关光谱法。ökonomischen Phänomene reicht dabei vom Patentdiebstahl <s:2> ber produckpiraterie bis hinzu wissenschaftlichen Fälschungen。在此基础上,本文提出了一种新的方法,即在Internet上进行双冗余处理,在Internet上进行双冗余处理,在Internet上进行双冗余处理,在Internet上进行双冗余处理。我们还研究了自动化系统benötigt、自动化语义系统ähnliche、自动化语义系统äquivalente、自动化语义系统können。Das Ziel dieses projektantragists, genau in solches semantics orientites duplikterkennungssystem (kurz semduplgenant) zu entwickeln。模具技术公司。理论推导,系统推导,文本蕴涵(textuelles Schlussfolgern),等。Während die meisten te -系统语法-顺序oberflächenbasiert sind,在语法项目中使用语义分析器。分析文本voraus, die natrlichsprachliche ausdr<e:1> cke (Phrasen, Sätze, text) automatisch in entsprechende bedeutungsstruckturen bersetzen kann。Da einer solchen分析alle Sprachebenen (Oberflächenform des Satzes, lemmatierte Form, syntaktische and semantic structur) zur verfgung steen, können aufdier Basis flache, statistisch basierte verfahen tifen semantischen and damit augikbasierten verfahen kombiniert werden。Damit lassen认为这种健壮的erkennung系统可以实现其他erkennung系统。in Rahmen des beantragten Projektes销售系统SemDupl zwar schwerpunktmäßig fr das Deutsche entwickelt werden。1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:1 .参考译文:
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Synonymy Extraction From Semantic Networks Using String and Graph Kernel Methods
使用字符串和图核方法从语义网络中提取同义词
- DOI:10.3233/978-1-61499-098-7-822
- 发表时间:2012
- 期刊:
- 影响因子:0
- 作者:vor der Brück;Yu-FangWang
- 通讯作者:Yu-FangWang
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Professor Dr. Hermann Helbig其他文献
Professor Dr. Hermann Helbig的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}