跨网页多源异构数据社会关系挖掘方法及应用研究

批准号:
61363072
项目类别:
地区科学基金项目
资助金额:
43.0 万元
负责人:
熊李艳
依托单位:
学科分类:
F0205.网络与系统安全
结题年份:
2017
批准年份:
2013
项目状态:
已结题
项目参与者:
钟茂生、曾辉、黄卫春、吴昊、柴亚辉、周美玲、雷莉霞、刘建林、陈建军
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
如何从跨网页多源异构数据中挖掘个体之间的非隐私真实社会关系,以构建真实的社会关系网络,是社会计算领域一个新的研究课题。区别于现有的实体关系抽取任务,跨网页多源异构数据社会关系挖掘将原有文本内部局部范围(句内或段内)的实体关系抽取扩展为跨文本跨网页中的实体抽取、同名消歧、关系识别和数据融合等任务,具有一定的挑战性。课题融逆向最大匹配、HMM模型和人名可信度模型对文本分词、词性标注和人名识别等任务进行联合协同分析处理,用个人关键特征信息相似度计算方法实现同名消歧;在人名识别和同名消歧基础上,用语义规则、关系模式匹配、关系自动分类相结合的方法,以及用搜索引擎、关系自动分类、融合选举投票思想等两种方案来实现跨网页社会关系挖掘。课题研究为构建真实社会关系网络提供了途径,对社会关系和社会网络的研究具有重要意义,构建的真实社会关系网络对于评审回避和面试回避等相关工作具有重要的实用价值。
英文摘要
It is a new research in the field of social computing to establish a real social relations network on how to mine the non-privacy real social relations between individuals from the cross-Webpage Multi-source heterogeneous data. Different from the existing entity relation extraction task, the social relations mining of the cross-Webpage Multi-source heterogeneous data extend the existing entity relation mining of internal partial range of the text (sentence or paragraph) to the task of entity extraction, disambiguation of the same name, relationship recognition, data fusion and so on in the cross-text or cross-Webpage data, which is a great challenge to the research. The project combines the Reverse Maximum Matching, the Hidden Markov Model and the Names Credibility Model to do with the tasks of word segmentation, POS tagging, name recognition and so on in a joint collaborative analysis way. And it uses a similarity calculation method of the personal key feature to achieve disambiguation of the same name. Based on the above name recognition and the disambiguation of the same name, those can help achieve cross-Webpage social relations mining by using a combination method of semantic rules, relations pattern matching and automatic relations classification, and another method of search engine-based, automatic relations classification, fusion elections thinking. The research provides a way to establish a real social network, which has great significance for the study of the social relations and social networks. Besides, the established real social network has much practical value for assessment evasive, interview evasive and the related work.
如何从跨网页多源异构数据中挖掘个体之间的非隐私真实社会关系,是社会计算领域一个新的研究课题。课题研究将为构建真实社会关系网络提供途径,对评审回避等相关工作具有重要的实用价值。课题组在国家自然科学基金项目“跨网页多源异构数据社会关系挖掘方法及应用研究 ”(61363072)项目的支持下,对跨文本跨网页的人名识别与同名消歧方法、人物社会关系挖掘和关系强度度量方法等方面进行了重点研究。提出了一种基于Naive Bayes的中文人名识别方法和基于句义结构分析中文人名消歧方法,提高了人物关系特征以及人物属性特征提取的准确率;通过研究社交网络中用户的个人信息相似度、用户姓名共现频率以及用户之间互动行为强度来准确测量用户之间的社会关系强度;提出了基于特征选择、基于模板上下文信息增益和基于动词名词和CHI特征选择的多种中文人物社会关系抽取方法;在构建“区域科研人员社会关系网络”方面利用深度信念网络的深度学习方法构建了对中文语义组块进行自动抽取的模型,提出了根据用户社交网络关系的资源服务推荐算法和一种关联多本体的科技奖励检索方法,研究了人物社会关系挖掘平台中任务关系强度的排序算法,并通过一种基于图形处理单元的并行加权k-means聚类算法提高运行速度,并将基于人物关系强度等算法应用赣州科技奖励服务平台中,保证了评审工作的科学性。在项目基金的支持下,已发表论文15 篇,参加国内会议20余人次,邀请国内相关领域知名专家来校进行指导2次,获得专利1项,软件著作权5项,培养研究生12名。通过课题组成员的努力,已完成项目预期目标。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:--
期刊:科学技术与工程
影响因子:--
作者:黄卫春;范少帅;熊李艳;钟茂生
通讯作者:钟茂生
DOI:--
发表时间:2014
期刊:科学技术与工程
影响因子:--
作者:黄卫春;周冬卫;钟茂生;熊李艳
通讯作者:熊李艳
DOI:--
发表时间:2017
期刊:科学技术与工程
影响因子:--
作者:熊李艳;陈晓霞;钟茂生;黄晓辉
通讯作者:黄晓辉
DOI:--
发表时间:2016
期刊:计算机应用研究
影响因子:--
作者:黄卫春;徐力;熊李艳;钟茂生
通讯作者:钟茂生
DOI:--
发表时间:--
期刊:科学技术与工程
影响因子:--
作者:曾辉;王俊;熊李艳
通讯作者:熊李艳
基于多源异构数据的学生群体性异常行为预测模型研究与优化
- 批准号:62067002
- 项目类别:地区科学基金项目
- 资助金额:37万元
- 批准年份:2020
- 负责人:熊李艳
- 依托单位:
国内基金
海外基金
