基于云计算和MapReduce的区域医疗大数据分析关键技术研究

批准号:
61572268
项目类别:
面上项目
资助金额:
65.0 万元
负责人:
宋波
依托单位:
学科分类:
F0211.信息检索与社会计算
结题年份:
2019
批准年份:
2015
项目状态:
已结题
项目参与者:
冯云霞、杜军威、孙振、于华、丰艳、李旭、丁玉忠、吕少萍、杨艳丽
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
大数据分析与挖掘是实现区域医疗服务的关键支撑技术之一。基于云计算和MapReduce模型的区域医疗数据除具有一般大数据的4V特征外,还具有生命周期长、数据模式和关系复杂、异构性和分布性等特性。因此,区域医疗大数据的挖掘无法直接采用传统的方案实现。以心肺性职业病、呼吸系统传染性疾病和肺部肿瘤为具体研究对象,以疾病模式分析、疾病异常检测和个性化治疗等为具体的应用,深入探索医疗大数据挖掘系统的形式化建模和检测、分布式挖掘算法,以及用户的隐私保护问题。提出基于openEHR Archetype和rCOS的区域医疗系统互操作建模方法和测试技术;针对具体医疗应用,提出一系列基于机器学习和MapReduce模型的分布式医疗大数据挖掘算法,并采用基于统计学的工具验证;在隐私保护方面,采用多元逐步回归模型和数据加密技术隐藏用户的敏感数据,以及基于同态数据加密技术和安全多方计算的方式实现隐私模式的保护。
英文摘要
Big data analysis and mining is the key support technology of regional health information service. Besides the 4V characteristics of common big data, data of regional health information service system based on cloud computing and MapReduce based has additional characteristics, such as long life cycle, complex pattern and relationship, heterogeneity, distribution, and etc. Consequently, traditional resolutions cannot be directly applied to regional health big data mining. Taking cardiopulmonary occupation disease, infectious disease of respiratory system and lung neoplasms as subjects, we focus our attention on problems of the formal modeling and software test, distributed big data mining algorisms and models, and privacy preservation, respectively. Based on rCOS and FSM model, we propose distributed formal modeling and auto-testing resolutions for regional medical big data mining system. Based on machine learning theory and new computing pattern, we put forward a series of models and algorisms for regional medical big data mining. Statistically based methods and tools are adopted to validate performance of the proposed resolutions. Privacy preserving resolutions presented to protect both sensitive data and sensitive patterns. Sensitive data are hidden by combing multiple stepwise regression model and encryption algorithms, while sensitive patterns are preserved by combing encryption and secure multi-party computation together.
本项目以基于云计算和 Hadoop 框架的区域卫生服务信息系统为应用场景,对医疗大数据挖掘应用相关技术进行深入研究。重点研究基于云计算和 Hadooop 框架的医疗大数据挖掘和分析模型的检测和测试技术、针对特定医疗服务需求的区域医疗大数据挖掘算法和技术,以及医疗大数据挖掘中的隐私保护问题。. 本项目的主要贡献如下:(1)通过优化临床路径标准诊疗方案,提出了一种基于诊疗单元划分的临床路径优化诊疗策略。(2)总结了现有模型和方法的优点与不足,利用人工智能和数据挖掘等先进的数据分析技术完善了现有的建模方法;利用大数据技术,提高了用于心血管疾病风险评估建模的数据质量。(3)在基于大数据分析技术的区域医疗环境下,对医院物资消耗及下周期购买预测技术进行了研究,面向基于 Hadoop 平台的区域医疗环境,研发了基于数据挖掘的医院物资采购量预测系统。(4)针对物联网新的环境和现有用户隐私保护技术的不足,提出并实现一种基于移动用户智能终端的隐私信息保护方法。. 本项目的研究成果目前已经扩展到区域医疗卫生信息服务系统,为促进我国医疗领域信息化、区域化发展提供有价值的参考。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.3969/j. issn .1673-7571.2018.02. 027
发表时间:2018
期刊:中国数字医学
影响因子:--
作者:宋波;张立君;冯云霞
通讯作者:冯云霞
DOI:--
发表时间:2017
期刊:中国数字医学
影响因子:--
作者:宋波;张立君;冯云霞
通讯作者:冯云霞
DOI:--
发表时间:--
期刊:中国数字医学
影响因子:--
作者:宋波;张立君;冯云霞
通讯作者:冯云霞
DOI:--
发表时间:2018
期刊:计算机应用
影响因子:--
作者:马兴录;杨文文;冯云霞
通讯作者:冯云霞
国内基金
海外基金
