医疗文本大数据分析中的统计学模型和方法
批准号:
11771242
项目类别:
面上项目
资助金额:
48.0 万元
负责人:
邓柯
依托单位:
学科分类:
A0403.贝叶斯统计与统计应用
结题年份:
2021
批准年份:
2017
项目状态:
已结题
项目参与者:
刘军、韩思蒙、徐崇元、杨洋、李艺超、徐嘉泽、李祺
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
过去20年,我国的各个大型医院积累了数以亿计的“电子病历”档案。这些“电子病历”详细记录了病人在医院就诊过程中的大量信息,对它们的深入挖掘具有极高的科学和社会价值。但是,“电子病历”中以自然语言形式出现的中文文本给数据分析带来了极大的挑战。 例如,“对医学文本中的医学术语进行识别和标准化”、“对医学文本中的多维度医学信息进行有效整合以准确重构医学场景”都是医学大数据分析中的核心问题,也是极其困难的问题。本项目力图从统计学角度研究这些问题,建立针对中文电子病历文本分析的统计模型,和能够高效实现“疾病名称”标准化的统计模型,并解决其中的统计推断和统计计算问题。同时,探索构建能够使“医学文本分析”与“医学知识库”高效互动的统计学框架,以更有效地促进医学知识库系统的自我完善和医学自然语言的语意理解。
英文摘要
In past 20 years, millions of Electronic Medical Records (EMRs) have been cumulated in China's hospitals. These EMRs record rich information on what patients have experienced in hospitals, and contain great values. However, the Chinese texts in these EMRs introduce great challenges in data analysis. For example, identification and standardization of medical terminologies and reconstruction of the medical scenario encoded by medical texts are both very challenging but also very important tasks in EMR analysis. In this project, we plan to study these challenging problems from the statistical perspective. We hope to build statistical models for mining Chinese medical texts and standardizing disease names, and investigate the statistical inference and computation of these models. We also want to connect the problem of medical text analysis with medical knowledge database, and establish a intelligent statistical framework with which the two sides can efficiently interact and help each other.
过去20年,我国的各个大型医院积累了数以亿计的“电子病历”档案。这些“电子病 历”详细记录了病人在医院就诊过程中的大量信息,对它们的深入挖掘具有极高的科学和 社会价值。但是,“电子病历”中以自然语言形式出现的中文文本给数据分析带来了极大 的挑战。 例如,“对医学文本中的医学术语进行识别和标准化”、“对医学文本中的多 维度医学信息进行有效整合以准确重构医学场景”都是医学大数据分析中的核心问题,也 是极其困难的问题。本项目力图从统计学角度研究这些问题,建立针对中文电子病历文本 分析的统计模型,和能够高效实现“疾病名称”标准化的统计模型,并解决其中的统计推 断和统计计算问题。同时,探索构建能够使“医学文本分析”与“医学知识库”高效互动 的统计学框架,以更有效地促进医学知识库系统的自我完善和医学自然语言的语意理解。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2020
期刊:数字人文
影响因子:--
作者:徐嘉泽;潘长在;贺莉丽;王宏甦;张力伟;邓柯
通讯作者:邓柯
DOI:--
发表时间:2019
期刊:应用数学与力
影响因子:--
作者:朱万闯;季春霖;邓柯
通讯作者:邓柯
Partition-Mallows Model and Its Inference for Rank Aggregation
划分-Mallows模型及其排序聚合推理
DOI:10.1080/01621459.2021.1930547
发表时间:2021
期刊:Journal of the American Statistical Association
影响因子:3.7
作者:Zhu Wanchuang;Jiang Yingkai;Liu Jun S.;Deng Ke
通讯作者:Deng Ke
RAPID DESIGN OF METAMATERIALS VIA MULTITARGET BAYESIAN OPTIMIZATION
通过多目标贝叶斯优化快速设计超材料
DOI:10.1214/20-aoas1426
发表时间:2021
期刊:Annals of Applied Statistics
影响因子:1.8
作者:Yang Yang;Ji Chunlin;Deng Ke
通讯作者:Deng Ke
DOI:10.1093/biomet/asab004
发表时间:2020-04
期刊:Biometrika
影响因子:2.7
作者:Yichao Li;Wenshuo Wang;Ke Deng;Jun S. Liu
通讯作者:Jun S. Liu
复杂空间上具有特殊约束的Monte Carlo方法
- 批准号:12371269
- 项目类别:面上项目
- 资助金额:43.5万元
- 批准年份:2023
- 负责人:邓柯
- 依托单位:
无指导汉语文本挖掘的统计模型和统计推断
- 批准号:11401338
- 项目类别:青年科学基金项目
- 资助金额:22.0万元
- 批准年份:2014
- 负责人:邓柯
- 依托单位:
国内基金
海外基金















{{item.name}}会员


