基于在线网络社区的难接触人群特征挖掘及抽样关键技术研究
结题报告
批准号:
71771213
项目类别:
面上项目
资助金额:
49.0 万元
负责人:
吕欣
学科分类:
G0107.管理系统工程
结题年份:
2021
批准年份:
2017
项目状态:
已结题
项目参与者:
熊健、丁兆云、李乐、陈洒然、黄格、范长俊、刘楚楚、牟建红
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
难接触人群在国内外不同的社会环境中均为亟需提高社会支持、管理和服务的对象。然而,由于其难接触的特性,导致大量群体均处于社会服务盲区,其行为特点、心理状态、生活方式等均不为大众所知悉,由此给传播性疾病预防与控制、社会安全与公共管理等带来巨大的挑战。本项目致力于研究在互联网大数据背景下,难接触人群特征挖掘方法及网络抽样关键技术。通过将网络抽样方法应用到互联网数据获取中,探索基于现有技术手段的网络数据抽样实施方法及其可代表性影响要素。在获取大量开源数据的基础上,进一步探索难接触人群群体和行为特征挖掘的基础方法,包括数据获取方法、网络社区活动分析、文本挖掘、社交网络构建和分析等。通过对在线社区难接触人群特征挖掘和分析,找到关键人群节点,设计和评估干预策略。项目成果有望为科学、全面地了解和干预难接触人群提供有效的技术手段和理论基础,对我国公共卫生、公共安全等管理问题具有重要的理论和实践意义。
英文摘要
Hard-to-access populations are in acute need for social support, management and service across different societies in the world. However, due to the hard to access properties, most of these groups are out of the scope of social services, and the characteristics of their behavior, psychological status and living style are mostly unknown to the general population, bringing great challenge to the prevent and control of infectious diseases, social security and public management. To overcome these difficulties, this project aims to study the method of pattern mining for hard-to-access population and to evaluate key network sampling approaches in the context of internet and big data. By applying the network sampling approach on the internet, we will explore alternative designs of sampling process and key factors to the representativeness of samples. Based on large amount of open source data, we further investigate methods for analysis of characteristics and behavior pattern of hard-to-access population, including data retrieval, online activity analysis, text mining and analysis of their social networks. Based on this, we will try to find key individuals and design and evaluate effective intervention strategies. The outcome of this project is expected to provide effective methods and technologies for scientifically and systematically studying hard-to-access population, and would be of great significance to the development of theories in management of public security and public health.
自获得国家自然科学基金面上项目“基于在线网络社区的难接触人群特征挖掘及抽样关键技术研究”(71771213)以来,课题组从2017年下半年开始组织和实施相关研究工作,通过继承和延续课题申请人前期在国际合作中积淀的研究基础,围绕难接触人群抽样算法设计、在线社区网络数据获取、移动社交平台数据挖掘等开展了细致深入的工作。自立项以来,已在相关领域开展多项合作研究,发表标注项目学术论文40余篇,其中包括《Nature》、《Nature Microbiology》、《National Science Review》、《Omega》、《Decision Support Systems》、《Naval Research Logistics》、《IEEE Transactions on Network Science and Engineering》等多篇综合类、管理学类和复杂系统研究权威期刊和中文大数据领域权威期刊《大数据》、《中国计算机学会通讯》等。形成29份数据分析报告和政策建议,其中6份被中共中央办公厅、国务院办公厅采用, 3份提交至浙江省疾控中心。相关研究成果获湖南省高等教育教学成果特等奖,军队级教学成果一等奖,教育部科技进步二等奖,中国仿真学会自然科学一等奖,中国仿真学会自然科学二等奖;获国家专利授权3项;成果被科技日报、解放军报、人民日报、新华网、BBC、New York Times、Science Daily、MIT等国内外媒体和机构关注和正面广泛报道。申请人本人也在2020年获国家杰出青年科学基金资助, 并于2021年获湖南省青年科技奖。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1063/1.5111995
发表时间:2019
期刊:Chaos: An Interdisciplinary Journal of Nonlinear Science
影响因子:--
作者:Qin Shuo;Mou Jianhong;Chen Saran;Lu Xin
通讯作者:Lu Xin
Inferring Opinions and Behavioral Characteristics of Gay Men with Large Scale Multilingual Text from Blued
利用 Blued 大规模多语言文本推断男同性恋者的观点和行为特征
DOI:10.3390/ijerph16193597
发表时间:2019-10-01
期刊:INTERNATIONAL JOURNAL OF ENVIRONMENTAL RESEARCH AND PUBLIC HEALTH
影响因子:--
作者:Huang, Ge;Cai, Mengsi;Lu, Xin
通讯作者:Lu, Xin
Population flow drives spatio-temporal distribution of COVID-19 in China
人口流动驱动中国 COVID-19 的时空分布
DOI:10.1038/s41586-020-2284-y
发表时间:2020-04-29
期刊:NATURE
影响因子:64.8
作者:Jia, Jayson S.;Lu, Xin;Christakis, Nicholas A.
通讯作者:Christakis, Nicholas A.
PLANET: A radial layout algorithm for network visualization
PLANET:一种用于网络可视化的径向布局算法
DOI:10.1016/j.physa.2019.122948
发表时间:2020-02-01
期刊:PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS
影响因子:3.3
作者:Huang,Ge;Li,Yong;Lu,Xin
通讯作者:Lu,Xin
DOI:10.7498/aps.69.20191817
发表时间:2020
期刊:Acta Physica Sinica
影响因子:1
作者:谭索怡;祁明泽;吴俊;吕欣
通讯作者:吕欣
基于人口流动大数据的新型冠状病毒(2019-nCoV)输出感染风险及接触网络传播模型研究
基于大数据挖掘的人类行为动力学研究及其在应急管理中的应用
基于移动通信与在线社会媒体数据的大规模突发事件下人类行为动力学研究
国内基金
海外基金