Developing synthetic data methods for large confidential administrative databases
为大型机密管理数据库开发合成数据方法
基本信息
- 批准号:2203901
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2019
- 资助国家:英国
- 起止时间:2019 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
There is a demand from social scientists to access high quality data for research, traditionally large surveys. These are costly and so there has been a shift to making routinely collected administrativedata more available to researchers. The government open data access policy has also led to an initiative to make the administrative data their departments hold, available more widely. Thesedatabases typically contain information on a large number of records with potentially sensitive information, and have severely restricted access. This has led to investigating ways to improve access to government administrative databases without compromising confidentiality.Synthetic data is an increasingly popular approach to address this problem. The approach replaces the data with synthetic values drawn from a statistical model fit to the original data. This is typicallydone multiple times to generate multiple synthetic data sets. As the data now comprise only synthetic values, confidentiality should have been protected, and providing a plausible model hasbeen used, statistical properties should be preserved. Synthetic data would give researchers the ability to test their methodology on a synthetic version prior to analysis of the original data. This project will develop synthetic data methods for administrative databases leading to the potential for more accessible synthetic versions.The use of partially synthetic data for SDC has been increasing in recent years. There are multiple examples of synthetic data products being developed in the US, such as the Survey of Income and Program Participation (https://ecommons.cornell.edu/handle/1813/43924), and the Longitudinal Business Database (Kinney et al., International Statistical Review, 2011: 79(3)). The appeal is also growing in Europe with the IAB in Germany investigating synthetic data to protect the German Establishment Survey (Drechsler and Reiter, Journal of Official Statistics, 2009: 25(4)). There is relatively little activity in producing synthetic data in the UK, the one exception being a project considering methods for synthesising longitudinal data (https://sls.lscs.ac.uk/projects/view/2013_012/). To date there has been no substantive work on generating synthetic administrative databases in the UK.
社会科学家需要获得高质量的研究数据,传统上是大型调查。这些都是昂贵的,所以已经有了一个转变,使常规收集的行政数据更容易为研究人员所用。政府的开放数据访问政策也导致了一项倡议,使其部门持有的行政数据更广泛地可用。这些数据库通常包含大量具有潜在敏感信息的记录的信息,并且严格限制访问。这导致研究如何在不损害机密性的情况下改进对政府行政数据库的访问。合成数据是解决这个问题的一种日益流行的方法。该方法用从适合原始数据的统计模型中提取的合成值替换数据。这通常会多次执行,以生成多个合成数据集。由于数据现在只包含合成值,因此应该保护机密性,并且使用了合理的模型,因此应该保留统计属性。合成数据将使研究人员能够在分析原始数据之前在合成版本上测试他们的方法。这个项目将为管理数据库开发综合数据方法,从而有可能获得更容易获得的综合版本。近年来,对部分合成的SDC数据的使用越来越多。美国正在开发多种综合数据产品,例如收入和计划参与调查(https://ecommons.cornell.edu/handle/1813/43924)和纵向商业数据库(Kinney et al., International Statistical Review, 2011: 79(3))。在欧洲,随着德国的IAB调查合成数据以保护德国企业调查(Drechsler和Reiter, Journal of Official Statistics, 2009: 25(4)),这种呼吁也在增长。在英国,生产综合数据的活动相对较少,唯一的例外是考虑综合纵向数据方法的项目(https://sls.lscs.ac.uk/projects/view/2013_012/)。到目前为止,在联合王国还没有在生成综合行政数据库方面进行实质性的工作。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
近空间飞行器载MIMO SAR高分辨率、宽测绘带遥感成像机理与方法
- 批准号:41101317
- 批准年份:2011
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
基于大机动运动平台的特定目标多极化成像与匹配技术研究
- 批准号:11176022
- 批准年份:2011
- 资助金额:46.0 万元
- 项目类别:联合基金项目
相似海外基金
Developing an ultra-high throughput droplet microfluidic workflow for genetic circuit characterization
开发用于遗传电路表征的超高通量液滴微流体工作流程
- 批准号:
10680017 - 财政年份:2023
- 资助金额:
-- - 项目类别:
DARSaW: Developing, Assessing, and Refining Synthetic Sampling Weights to Improve Generalizability of the All of Us Research Program Data
DARSaW:开发、评估和细化合成采样权重,以提高我们所有人研究计划数据的普遍性
- 批准号:
10796237 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Developing mutable barcodes for high-resolution single-cell lineage tracing
开发用于高分辨率单细胞谱系追踪的可变条形码
- 批准号:
10536930 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Developing mutable barcodes for high-resolution single-cell lineage tracing
开发用于高分辨率单细胞谱系追踪的可变条形码
- 批准号:
10680413 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Developing three-dimensional antisense oligonucleotide drugs against COVID-19
开发针对COVID-19的三维反义寡核苷酸药物
- 批准号:
10645137 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Developing novel CAR T cell designs using combinatorial antigen detection
使用组合抗原检测开发新型 CAR T 细胞设计
- 批准号:
10597967 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Developing Synthetic Enzymes to Treat Inborn Errors of Metabolism
开发合成酶来治疗先天性代谢缺陷
- 批准号:
10281241 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Developing a platform for human somatic cell rejuvenation, expansion and genetic engineering using synthetic RNA molecules
使用合成 RNA 分子开发人类体细胞再生、扩增和基因工程平台
- 批准号:
10399980 - 财政年份:2021
- 资助金额:
-- - 项目类别: