TC:Large:Collaborative Research:Anonymizing Textual Data and its Impact on Utility

TC:大型:协作研究:匿名文本数据及其对实用性的影响

基本信息

  • 批准号:
    1011984
  • 负责人:
  • 金额:
    $ 35.7万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2010
  • 资助国家:
    美国
  • 起止时间:
    2010-09-01 至 2015-08-31
  • 项目状态:
    已结题

项目摘要

Data Protection laws that exempt data that is not individually identifiable have led to an explosion in anonymization research. Unfortunately, how well current de-identification and anonymization techniques control risks to privacy and confidentiality is not well understood. Neither is the usefulness of anonymized data for real-world applications. The project addresses anonymization on three fronts: 1) Textual data, even when explicit identifiers are removed (names, dates, locations), can contain highly identifiable information. For example, a sample of chief complaint fields from the Indiana Network for Patient Care (INPC) found several instances of "phantom limb pain". Amputees can be visually identifiable, but the HIPAA Safe Harbor rules do not list this as "identifying information". Any policy explicitly listing all types of identifying data is likely to fail. Through a joint effort with computer science and linguistics, the project is developing new methods to remove specific details from text while preserving meaning, eliminating such highly identifiable information without a priori knowledge of what would be identifying. 2) Current anonymization research is based on unproven measures of identifiability. Through a re-identification challenge on synthetic data (but based on real healthcare data), the project is evaluating the efficacy of these measures. Interdisciplinary teams of students are given challenge problems - anonymized data with hypothetical healthcare data - and asked to make (hypothetical) inferences about health information of individuals. The results can be used to calibrate the effectiveness of different anonymization measures. 3) The utility of anonymized data has been a concern among research: Does anonymized data provide credible research results? By partnering with healthcare studies at the Kinsey Institute and Purdue University School of Nursing, the project is comparing analyses on original data with analyses on anonymized data, and evaluating the impact of types of anonymization on research results. A related issue is determining the impact on data collection: Are individuals more candid in their responses if they know data will be anonymized? Outcomes are broadening the scope of research that can be performed on anonymized data, while ensuring that researchers know when access to individually identifiable data (with attendant restrictions and safeguards) is needed. Through these tasks, the project is advancing our ability to utilize the wealth of data we now collect for the benefit of society, while ensuring individual privacy is protected. For further information see the project web site at the URL: http://projects.cerias.purdue.edu/TextAnon
数据保护法豁免了不能识别个人身份的数据,这导致了匿名化研究的爆炸式增长。不幸的是,目前的去识别和匿名化技术在多大程度上控制了隐私和机密性风险,人们还没有很好地理解。匿名数据对于真实世界应用的有用性也是如此。该项目从三个方面解决了匿名化问题:1)文本数据,即使删除了显式标识符(姓名、日期、位置),也可以包含高度可识别的信息。例如,印第安纳州患者护理网络(INPC)的主诉领域样本发现了几个“幻肢痛”的例子。截肢者可以在视觉上被识别,但HIPAA安全港规则并没有将其列为“识别信息”。任何显式列出所有类型标识数据的策略都可能失败。通过与计算机科学和语言学的共同努力,该项目正在开发新的方法,从文本中删除特定细节,同时保留意义,在没有先验知识的情况下删除这些高度可识别的信息。2)目前的匿名化研究是基于未经证实的可识别性措施。通过对合成数据的重新识别挑战(但基于真实的医疗保健数据),该项目正在评估这些措施的有效性。跨学科的学生团队被赋予挑战问题-匿名数据与假设的医疗保健数据-并要求对个人的健康信息做出(假设的)推断。结果可以用来校准不同的匿名化措施的有效性。3)匿名数据的效用一直是研究中关注的问题:匿名数据是否提供可信的研究结果?通过与金赛研究所(Kinsey Institute)和普渡大学护理学院(Purdue University School of Nursing)的医疗保健研究机构合作,该项目正在比较对原始数据的分析与对匿名数据的分析,并评估匿名化类型对研究结果的影响。一个相关的问题是确定对数据收集的影响:如果个人知道数据将被匿名化,他们的回答是否会更坦诚?结果扩大了可以对匿名数据进行研究的范围,同时确保研究人员知道何时需要访问个人身份数据(附带限制和保护措施)。通过这些任务,该项目正在提高我们利用我们现在收集的丰富数据造福社会的能力,同时确保个人隐私得到保护。欲了解更多信息,请参阅项目网站的URL: http://projects.cerias.purdue.edu/TextAnon

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Wei Jiang其他文献

Experimental Demonstration of Mixed-Polarization to Linearize Electro-Absorption Modulators in Radio-Over-Fiber Links
光纤无线电链路中电吸收调制器混合偏振线性化的实验演示
  • DOI:
    10.1109/lpt.2010.2098474
  • 发表时间:
    2011-02
  • 期刊:
  • 影响因子:
    2.6
  • 作者:
    Bouchaib Hraimel;Xiupu Zhang;Wei Jiang;Ke Wu;Taijun Liu;Tiefeng Xu;Qiuhua Nie;Kun Xu
  • 通讯作者:
    Kun Xu
Deferred cash compensation and risk-taking: Evidence from the Chinese banking industry
递延现金补偿与风险承担:来自中国银行业的证据
  • DOI:
    10.1016/j.pacfin.2018.12.005
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Wei Jiang;Yunguo Liu;Gerald J.Lobo;Yue Xu
  • 通讯作者:
    Yue Xu
Theoretical simulation study on crystal property and hygroscopicity of ADN doping with nitramine explosives (RDX, HMX, and CL-20)
硝胺炸药(RDX、HMX、CL-20)掺杂ADN晶体性质及吸湿性的理论模拟研究
  • DOI:
    10.1007/s00894-022-05200-0
  • 发表时间:
    2022-07
  • 期刊:
  • 影响因子:
    2.2
  • 作者:
    Qiangqiang Lu;Lei Xiao;Yinglei Wang;Guangpu Zhang;Yubing Hu;Fuyao Chen;Fengqi Zhao;Junqing Yang;Wei Jiang;Gazi Hao
  • 通讯作者:
    Gazi Hao
Ultra-Broadband, Fabrication Tolerant Optical Coupler for Arbitrary Splitting Ratio Using Particle Swarm Optimization Algorithm
使用粒子群优化算法实现任意分光比的超宽带、可制造容差光耦合器
  • DOI:
    10.1109/jphot.2020.3029059
  • 发表时间:
    2020-10
  • 期刊:
  • 影响因子:
    2.4
  • 作者:
    Lemeng Leng;Minfeng Jin;Zhongzhi Lin;Chenbin Zhang;Ding Ding;Wei Jiang
  • 通讯作者:
    Wei Jiang
Investigation of the near-threshold cluster resonance in C-14
C-14 中近阈值团簇共振的研究
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    3.6
  • 作者:
    Hong-Liang Zang;Yan-Lin Ye;Zhi-Huan Li;Jian-Song Wang;Jian-Ling Lou;Qi-Te Li;Yu-Cheng Ge;Xiao-Fei Yang;Jing Li;Wei Jiang;Jun Feng;Qiang Liu;Biao Yang;Zhi-Qiang Chen;Yang Liu;Hong-Yi Wu;Chen-Yang Niu;Chen-Guang Li;Chun-Guang Wang;Xiang Wang;Wei Liu;Jian Ga
  • 通讯作者:
    Jian Ga

Wei Jiang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Wei Jiang', 18)}}的其他基金

TWC SBE: Medium: Collaborative: Building a Privacy-Preserving Social Networking Platform from a Technological and Sociological Perspective
TWC SBE:媒介:协作:从技术和社会学角度构建保护隐私的社交网络平台
  • 批准号:
    1855391
  • 财政年份:
    2018
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
TWC SBE: Medium: Collaborative: Building a Privacy-Preserving Social Networking Platform from a Technological and Sociological Perspective
TWC SBE:媒介:协作:从技术和社会学角度构建保护隐私的社交网络平台
  • 批准号:
    1564101
  • 财政年份:
    2016
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
I-Corps: An Outsourced and Completely Private Social Network: You&Me
I-Corps:一个外包且完全私有的社交网络:您
  • 批准号:
    1522781
  • 财政年份:
    2015
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
Collaborative Research: Predatory Lending, Predatory Borrowing, and the Mortgage Crisis: Evidence from Loan-Level Data from a Large Bank
合作研究:掠夺性贷款、掠夺性借款和抵押危机:来自大型银行贷款水平数据的证据
  • 批准号:
    0851428
  • 财政年份:
    2009
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
STTR Phase I: Fully Embedded Optical Interconnect Layers Based on Molded Polymer Lightwave Components for Large Field Size Printed Circuit Boards
STTR 第一阶段:用于大面积印刷电路板的基于模制聚合物光波组件的完全嵌入式光学互连层
  • 批准号:
    0539538
  • 财政年份:
    2006
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
CAREER: Data Quality Management through Statistical Quality Control and Data Mining
职业:通过统计质量控制和数据挖掘进行数据质量管理
  • 批准号:
    0542881
  • 财政年份:
    2006
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
Role of Cdk Phosphorylation of HsCdc6 in DNA Replication
HsCdc6 Cdk 磷酸化在 DNA 复制中的作用
  • 批准号:
    0233887
  • 财政年份:
    2002
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
Role of Cdk Phosphorylation of HsCdc6 in DNA Replication
HsCdc6 Cdk 磷酸化在 DNA 复制中的作用
  • 批准号:
    0078432
  • 财政年份:
    2000
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant

相似国自然基金

水稻穗粒数调控关键因子LARGE6的分子遗传网络解析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
量子自旋液体中拓扑拟粒子的性质:量子蒙特卡罗和新的large-N理论
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    62 万元
  • 项目类别:
    面上项目
甘蓝型油菜Large Grain基因调控粒重的分子机制研究
  • 批准号:
    31972875
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
Large PB/PB小鼠 视网膜新生血管模型的研究
  • 批准号:
    30971650
  • 批准年份:
    2009
  • 资助金额:
    8.0 万元
  • 项目类别:
    面上项目
基因discs large在果蝇卵母细胞的后端定位及其体轴极性形成中的作用机制
  • 批准号:
    30800648
  • 批准年份:
    2008
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
LARGE基因对口腔癌细胞中α-DG糖基化及表达的分子调控
  • 批准号:
    30772435
  • 批准年份:
    2007
  • 资助金额:
    29.0 万元
  • 项目类别:
    面上项目

相似海外基金

TC: Large: Collaborative Research: Facilitating Free and Open Access to Information on the Internet
TC:大型:合作研究:促进互联网上信息的自由和开放获取
  • 批准号:
    1540066
  • 财政年份:
    2015
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Facilitating Free and Open Access to Information on the Internet
TC:大型:合作研究:促进互联网上信息的自由和开放获取
  • 批准号:
    1111734
  • 财政年份:
    2012
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Facilitating Free and Open Access to Information on the Internet
TC:大型:合作研究:促进互联网上信息的自由和开放获取
  • 批准号:
    1111539
  • 财政年份:
    2012
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Facilitating Free and Open Access to Information on the Internet
TC:大型:合作研究:促进互联网上信息的自由和开放获取
  • 批准号:
    1111723
  • 财政年份:
    2012
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Practical Secure Two-Party Computation: Techniques, Tools, and Applications
TC:大型:协作研究:实用安全两方计算:技术、工具和应用
  • 批准号:
    1111781
  • 财政年份:
    2011
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Privacy-Enhanced Secure Data Provenance
TC:大型:协作研究:隐私增强的安全数据来源
  • 批准号:
    1111512
  • 财政年份:
    2011
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Privacy-Enhanced Secure Data Provenance
TC:大型:协作研究:隐私增强的安全数据来源
  • 批准号:
    1111529
  • 财政年份:
    2011
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: High-Level Language Support for Trustworthy Networks
TC:大型:协作研究:对可信赖网络的高级语言支持
  • 批准号:
    1111520
  • 财政年份:
    2011
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
TC: Large: Collaborative Research: Practical Secure Two-Party Computation: Techniques, Tools, and Applications
TC:大型:协作研究:实用安全两方计算:技术、工具和应用
  • 批准号:
    1111599
  • 财政年份:
    2011
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Privacy-Enhanced Secure Data Provenance
TC:大型:协作研究:隐私增强的安全数据来源
  • 批准号:
    1111925
  • 财政年份:
    2011
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了