Opening the black box: helping AI to persuade without bias

打开黑匣子:帮助人工智能无偏见地说服

基本信息

  • 批准号:
    2752436
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2022
  • 资助国家:
    英国
  • 起止时间:
    2022 至 无数据
  • 项目状态:
    未结题

项目摘要

The overall aim of the project is to establish how AI can use natural language to persuade humans in transparent and bias-free ways. AI systems are becoming an integral part of our daily lives, from simple recommendations on YouTube or Netflix, to life-changing decisions such as shortlisting job applicants or recommending loans. However, these systems lack transparency and objective indicators of fairness, producing poorly understood 'advice' that could be fuelling biased decisions on a growing scale right across society. Biased advice that treats individuals differently based on their gender is a particular concern (e.g. in employment contexts). Detecting and removing this bias is extremely difficult. It arises from stereotyped human labelling and categorisation residing within huge, cobbled-together data sets typically used to train AI. Because this bias is 'hidden', its transmission to humans interacting with AI is correspondingly difficult to establish, and even more difficult to eliminate. In this Phd, we propose and test a novel solution which combines experimental psychology with computing science to offer a way of detecting when biased advice from AI passes into human judgements. The student will engineer their own AI into which known patterns of gender-bias, deriving from our work on cognitive stereotypes, can be 'injected'. Using advanced natural language models, the AI will have brief 'conversations' with human participants in a series of studies that will provide a rich source of data on acts of rejection or conformity to biased and unbiased advice. Using cutting-edge machine learning techniques, the student will analyse this new bespoke data set to identify language features that signal persuasion. Within these features the student will seek to isolate ones specifically linked to acceptance of biased content. Crucially, these features may be used to detect the transmission of hidden biases in real-life applications.
该项目的总体目标是确定人工智能如何使用自然语言以透明和无偏见的方式说服人类。人工智能系统正在成为我们日常生活中不可或缺的一部分,从YouTube或Netflix上的简单推荐,到改变生活的决定,如入围求职者或推荐贷款。然而,这些系统缺乏透明度和客观的公平指标,产生了人们理解不深的“建议”,可能会在整个社会范围内助长越来越大规模的偏见决策。基于性别而区别对待个人的带有偏见的建议尤其令人关切(例如在就业方面)。发现和消除这种偏见是非常困难的。它源于刻板的人类标签和分类,这些标签和分类存在于通常用于训练AI的庞大的拼凑数据集中。由于这种偏见是“隐藏的”,因此它对与人工智能互动的人类的传播相应地很难建立,甚至更难消除。在这篇博士论文中,我们提出并测试了一种新颖的解决方案,该解决方案将实验心理学与计算科学相结合,提供了一种检测人工智能的偏见建议何时传递到人类判断中的方法。学生将设计自己的人工智能,其中已知的性别偏见模式,从我们对认知刻板印象的工作中衍生出来,可以“注入”。使用先进的自然语言模型,人工智能将在一系列研究中与人类参与者进行简短的“对话”,这些研究将提供关于拒绝或遵守偏见和无偏见建议的行为的丰富数据来源。使用尖端的机器学习技术,学生将分析这个新的定制数据集,以识别信号说服的语言特征。在这些特征中,学生将寻求孤立那些与接受有偏见的内容特别相关的特征。至关重要的是,这些特征可以用来检测现实生活中应用程序中隐藏的偏见的传播。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

空间分数阶 Black-Scholes 方程的波动率反演 问题
  • 批准号:
    Q24A010012
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Black-Scholes期权定价模型的时间自适应算法与分析
  • 批准号:
    12271142
  • 批准年份:
    2022
  • 资助金额:
    45 万元
  • 项目类别:
    面上项目
复杂衍生品定价的新型拉氏变换方法
  • 批准号:
    11671323
  • 批准年份:
    2016
  • 资助金额:
    48.0 万元
  • 项目类别:
    面上项目
新老岛弧斑岩铜(金)矿中间岩浆房过程对比研究:以菲律宾 Black Mountain和我国多宝山为例
  • 批准号:
    41672090
  • 批准年份:
    2016
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
非线性Black-Scholes方程有限差分并行计算的新方法研究
  • 批准号:
    11371135
  • 批准年份:
    2013
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
星系恒星与气体的动力学演化
  • 批准号:
    11073025
  • 批准年份:
    2010
  • 资助金额:
    30.0 万元
  • 项目类别:
    面上项目
中国南方早古生代黑色岩系中硒的地球化学循环及其成矿效应
  • 批准号:
    40773034
  • 批准年份:
    2007
  • 资助金额:
    40.0 万元
  • 项目类别:
    面上项目
非Black-Scholes 模型环境下的未定权益的定价和套期保值研究
  • 批准号:
    70771006
  • 批准年份:
    2007
  • 资助金额:
    19.0 万元
  • 项目类别:
    面上项目
黄、东海沉积物中碳黑(Black Carbon)的地球化学研究
  • 批准号:
    40576039
  • 批准年份:
    2005
  • 资助金额:
    40.0 万元
  • 项目类别:
    面上项目
统计物理模型在金融领域中的应用
  • 批准号:
    70471001
  • 批准年份:
    2004
  • 资助金额:
    10.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: Opening the black box of oxygen deficient zone biogeochemistry through integrative tracers
合作研究:通过综合示踪剂打开缺氧区生物地球化学黑匣子
  • 批准号:
    2342987
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: Opening the black box of oxygen deficient zone biogeochemistry through integrative tracers
合作研究:通过综合示踪剂打开缺氧区生物地球化学黑匣子
  • 批准号:
    2342986
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: Opening the black box of oxygen deficient zone biogeochemistry through integrative tracers
合作研究:通过综合示踪剂打开缺氧区生物地球化学黑匣子
  • 批准号:
    2342988
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Opening the black box on the contribution of interprofessional health providers in primary care: Measuring performance indicators that reflect and optimize practice
打开跨专业卫生服务提供者在初级保健中的贡献的黑匣子:衡量反映和优化实践的绩效指标
  • 批准号:
    493377
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Operating Grants
Opening The Black Box: Enhancing Machine Learning Interpretability To Optimize Clinical Response To Sudden Deterioration In COVID-19 Patients
打开黑匣子:增强机器学习的可解释性,以优化对 COVID-19 患者突然恶化的临床反应
  • 批准号:
    10259197
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
Financial Inclusion in the Era of the Platform Economy: Opening the black box of digital lending to MSMEs in China
平台经济时代的普惠金融:打开中国中小微企业数字借贷的黑匣子
  • 批准号:
    2396185
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Studentship
CRII: RI: Opening the black box of neural natural language processing models using machine-behavioral methods
CRII:RI:使用机器行为方法打开神经自然语言处理模型的黑匣子
  • 批准号:
    1947307
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Opening the black box of viruses in aquatic systems
打开水生系统中病毒的黑匣子
  • 批准号:
    RGPIN-2015-05896
  • 财政年份:
    2019
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Opening the conservation black box: actors, values and practice in Laikipia, Kenya
打开保护黑匣子:肯尼亚莱基皮亚的参与者、价值观和实践
  • 批准号:
    2273343
  • 财政年份:
    2019
  • 资助金额:
    --
  • 项目类别:
    Studentship
Opening the Black Box of Machine Learning Models
打开机器学习模型的黑匣子
  • 批准号:
    10437684
  • 财政年份:
    2018
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了