构建传统蒙古文知识图谱关键技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61762069
- 项目类别:地区科学基金项目
- 资助金额:41.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:巩政; 飞龙; 邵允学; 武静; 路敏; 史霖炎; 高伟; 高耀文;
- 关键词:
项目摘要
With the rapid development of information technology, there is an explosive growth of Mongolian data on Internet. Many Mongolian users obtain the required information and services by Mongolian intelligent systems. A big Mongolian knowledge graph is needed to optimize these intelligent systems. Mongolian scripts are different in different districts, called Cyrillic Monglian in Mongolia and Traditional Mongolian in China. At present, Traditional Mongolian knowledge graph is unavailable. The research on Mongolian knowledge graph construction is still at its initial stage and many issues in the construction process remain unsolved. This project will investigate the key technology of Traditional Mongolian knowledge graph construction, including the conversion from Cyrillic Mongolian to Traditional Mongolian, data scheme construction, Traditional Mongolian named entity recognition and alignment, Traditional Mongolian relation and fact extraction. Meanwhile, we will build a knowledge graph construction system, and establish a Traditional Mongolian knowledge graph of certain size using the system. By referring to the fruits and methods of other related knowledge graphs and taking the characteristics of Mongolian into consideration, we will solve the key problems to construct Traditional Mongolian knowledge graph efficiently and accurately. This project has very important academic and application value, which can promote the development of Mongolian semantic technology, improve Mongolian intelligent information service level, and boost the development of border areas in China.
随着信息技术的发展,互联网上蒙古文数据量呈现爆炸式增长,大量蒙古文用户通过蒙古文智能知识系统来获取信息和服务,改进和优化这些系统需要大规模蒙古文知识图谱作为支撑。中国和蒙古国使用的蒙古文不同,分别为传统蒙古文和西里尔蒙古文。目前蒙古文知识图谱研究处于起步阶段,没有公开且满足应用需求的蒙古文知识图谱,构建这种知识图谱过程中有很多关键问题亟待解决。本项目将对构建传统蒙古文知识图谱的关键技术进行研究,包括西里尔蒙古文向传统蒙古文转换、传统蒙古文知识图谱数据模式建立、传统蒙古文命名实体识别和对齐、传统蒙古文关系和事实抽取,搭建整套知识图谱构建系统,建立大规模传统蒙古文知识图谱。我们将借鉴其它语言知识图谱的成果和方法,结合蒙古文特点,提出有效的方法解决知识图谱构建过程中的难点问题。本项目具有十分重要的学术和应用价值,能够推动蒙古文语义技术的发展,提高蒙古文智能信息服务水平,促进边疆地区的繁荣与发展。
结项摘要
蒙古文智能知识系统的优化依赖大规模蒙古文知识图谱,但是目前还没有开源的大规模蒙古文知识图谱。本项目的目标是利用互联网上的传统蒙古文和西里尔蒙古文两种文种的蒙古文数据,解决知识图谱构建过程中的关键问题,构建满足应用需求的蒙古文知识图谱。. 本项目对构建传统蒙古文知识图谱的关键技术进行研究,包括(1)西里尔蒙古文向传统蒙古文转换、(2)传统蒙古文知识图谱数据模式建立、(3)传统蒙古文命名实体识别和对齐、(4)传统蒙古文关系和事实抽取,搭建整套知识图谱构建系统,建立大规模传统蒙古文知识图谱。. 通过本项目的研究,我们提出了基于映射模式的蒙古文单词形态学分析方法,实现了蒙古文单词的精确分析;我们提出了融合词典和LSTM模型的西里尔蒙古文向传统蒙古文转换方法,西里尔蒙古文向传统蒙古文转换精度达到98%以上;我们提出了融合多特征的蒙古文命名实体识别方法,蒙古文命名实体的识别精度95%以上;我们提出蒙古文实体知识的多种技术融合的方案,实现了实体知识的精确抽取;我们提出了基于四元数差值的知识图谱推理方案,将知识图谱推理基线模型的Hit@1指标提升了9%。上述方案有效解决了蒙古文知识图谱构建过程中的难点问题。我们设计并开发了蒙古文知识图谱构建系统,构建了一个包含20万以上蒙古文实体的蒙古文通用知识图谱,其中三元组总数达到100万以上。. 项目成果包括发表论文14篇,软件著作权4项,CCF科学技术奖1项;授权发明专利2项,分别是“基于神经网络的蒙古文命名实体识别方法及识别系统”和“西里尔蒙古文和传统蒙古文双文种知识图谱构建方法”。项目共培养博士和硕士研究生11人。. 本项目具有十分重要的学术和应用价值,能够推动蒙古文语义技术的发展,可以被应用于智能问答、信息检索、内容推荐等领域,提高蒙古文智能信息服务水平,促进多语言信息技术研究与发展。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(1)
会议论文数量(14)
专利数量(3)
A benchmark dataset and case study for Chinese medical question intent classification
中文医学问题意图分类基准数据集及案例研究
- DOI:10.1186/s12911-020-1122-3
- 发表时间:2020-07-09
- 期刊:BMC MEDICAL INFORMATICS AND DECISION MAKING
- 影响因子:3.5
- 作者:Chen, Nan;Su, Xiangdong;Wei, Ming
- 通讯作者:Wei, Ming
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
复合锌盐和超临界流体诱导PLLA/PDLA共混物的复杂晶形结构研究
- DOI:10.14028/j.cnki.1003-3726.2020.09.005
- 发表时间:2020
- 期刊:高分子通报
- 影响因子:--
- 作者:朱勋贤;高红祥;刘伟;苏向东;吴显
- 通讯作者:吴显
蒙古文信息检索系统的设计与实现
- DOI:--
- 发表时间:2018
- 期刊:中文信息学报
- 影响因子:--
- 作者:温子潇;包飞龙;高光来;王勇和;苏向东
- 通讯作者:苏向东
TC4合金固体内润滑刀具干式切削性能有限元分析
- DOI:--
- 发表时间:2014
- 期刊:工具技术
- 影响因子:--
- 作者:丁元法;邵娟;苏向东;刘钊
- 通讯作者:刘钊
蒙古文依存句法分析
- DOI:--
- 发表时间:2014
- 期刊:计算机科学
- 影响因子:--
- 作者:苏向东;高光来;闫学亮
- 通讯作者:闫学亮
8.1亿年千里山基性岩墙群的厘定及其对华北克拉通西部地质演化的启示
- DOI:--
- 发表时间:2018
- 期刊:岩石学报
- 影响因子:--
- 作者:彭澎;王欣平;周小童;王冲;孙风波;苏向东;陈亮;郭敬辉;翟明国
- 通讯作者:翟明国
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
苏向东的其他基金
面向低清晰度视频的复杂场景文本检测技术研究
- 批准号:62366036
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}