面向古籍整理智能化的知识表示与加工研究
结题报告
批准号:
62006021
项目类别:
青年科学基金项目
资助金额:
24.0 万元
负责人:
胡韧奋
依托单位:
学科分类:
交叉学科中的人工智能问题
结题年份:
2023
批准年份:
2020
项目状态:
已结题
项目参与者:
胡韧奋
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
伴随大数据与人工智能技术的飞速发展,古籍整理工作面临从数字化转向智能化的重要机遇与挑战。课题拟在古籍文本数字化的基础上,通过智能技术实现大规模、深层次的知识加工,以提升古籍整理效率,为数据驱动的人文研究提供支持,并助力传统文化的深入挖掘与创新发展。具体来说,课题拟从语言知识角度研究如何加工古籍文本中的文字、标点、语法和语义信息,从世界知识角度研究命名实体识别、知识链接和典故识别技术。.值得注意的是,课题研究面临三项重要的挑战:(1)计算机如何对复杂的古汉语语言知识进行表示?(2)如何基于低资源、弱标注数据构建算法模型?(3)如何建模文内知识与文外知识的关联?针对上述问题,课题拟基于大规模语料库预训练古汉语语言模型,以此作为语言知识表示的基础;同时,在具体任务的学习中引入领域知识指导,增强知识学习效果;此外,拟通过联合学习机制,建模内外部知识之间的关联。
英文摘要
With the rapid development of big data and AI technologies, the collation of ancient books faces important opportunities and challenges. Based on the digitization of ancient books, this project aims at conducting large-scale and deep knowledge processing through intelligent technologies, so as to improve the efficiency of collating ancient books, provide support for data-driven research of Digital Humanities, and facilitate the deep excavation and innovation of Chinese traditional culture. Specifically, we design seven NLP tasks from both linguistic aspect and world knowledge aspect, including character recognition, sentence punctuation, grammatical analysis, word sense disambiguation, named entity recognition, entity linking, and allusion recognition..It is worth noting that the research in this project faces three important challenges: (1) How to encode the complex knowledge in ancient Chinese? (2) How to build efficient models in low resource and weak labeling data scenarios? (3) How to model the relations between the linguistic knowledge and the world knowledge?.To address these issues, we plan to build the language model of ancient Chinese by pre-training on large-scale corpus. After that, we could introduce domain knowledge into the model to guide the learning. In addition, we propose to model the dependencies between internal and external knowledge via the joint learning mechanism.
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1111/lang.12511
发表时间:2022-07-23
期刊:LANGUAGE LEARNING
影响因子:4.4
作者:Hu, Renfen;Wu, Jifeng;Lu, Xiaofei
通讯作者:Lu, Xiaofei
DOI:--
发表时间:2023
期刊:南京师范大学文学院学报
影响因子:--
作者:诸雨辰;李绅;胡韧奋
通讯作者:胡韧奋
DOI:--
发表时间:2021
期刊:中文信息学报
影响因子:--
作者:胡韧奋;李绅;诸雨辰
通讯作者:诸雨辰
DOI:--
发表时间:2023
期刊:数字人文
影响因子:--
作者:李绅;胡韧奋;诸雨辰
通讯作者:诸雨辰
DOI:--
发表时间:2021
期刊:语言文字应用
影响因子:--
作者:胡韧奋
通讯作者:胡韧奋
国内基金
海外基金