Towards Trustworthy Large Language Models

迈向可信赖的大型语言模型

基本信息

  • 批准号:
    2895111
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2023
  • 资助国家:
    英国
  • 起止时间:
    2023 至 无数据
  • 项目状态:
    未结题

项目摘要

In the past few years Large Language models (broadly speaking foundational models) (e.g. ChatGPT, GPT-3 Brown et al. [2020], GPT-4 OpenAI [2023]) have stirred up the field of Artificial Intelligence (AI). More specifically, with the recent release of ChatGPT in November 2022, a wider section of audience got to experience the generative power of LLMs. The generative power of large language models (LLM) has been successfully applied in different areas of natural language processing tasks. Along with the revolutionary impact, many questions have been raised regarding the stakes of using LLMs in different applications. Broadly speaking a significant portion of the scientific community has advised to use LLMs in a socially responsible and ethical way Nat [2023]. Consequently, the aim of this project is to build explainable LLMs. The end user for LLMs can be of different types. The user may be a domain expert using an NLP model which uses LLMs at its back end or a stakeholder, investing in an AI product, which uses LLMs or someone having no AI expertise. Each type of user should be able to trust the output provided by LLMs. Existing research has shown that explaining the output of an AI model to a user should help to increase a user's trust in the system. Broadly speaking, the idea of explainability is to understand the working principle of an AI model with a simple explainer module which can mimic the original AI model. In this project we would like to specifically focus on explaining the output of LLMs to every type of users (i.e. domain experts, stakeholders, common people). The overall goal of this research proposal is to increase transparency of the LLMs using explainability techniques. Along with transparency, explainable LLM can also help to identify any kind of bias present in the model itself. Eventually explainable LLMs is a step towards the goal of creating a socially responsible AI environment.
在过去的几年里,大型语言模型(广义上说是基础模型)(例如ChatGPT,GPT-3 Brown et al. [2020],GPT-4 OpenAI [2023])已经搅动了人工智能(AI)领域。更具体地说,随着2022年11月ChatGPT的发布,更广泛的受众体验到了LLM的生成能力。大型语言模型(LLM)的生成能力已成功应用于自然语言处理任务的不同领域。沿着革命性的影响,许多问题已经提出了关于在不同的应用程序中使用LLMs的风险。从广义上讲,科学界的一个重要部分已经建议以社会责任和道德的方式使用LLM Nat [2023]。因此,本项目的目的是建立可解释的LLM。LLM的最终用户可以是不同类型。用户可能是使用NLP模型的领域专家,该模型在其后端使用LLM或投资于AI产品的利益相关者,该产品使用LLM或没有AI专业知识的人。每种类型的用户都应该能够信任LLM提供的输出。现有的研究表明,向用户解释AI模型的输出应该有助于增加用户对系统的信任。广义地说,可解释性的概念是通过一个简单的解释器模块来理解AI模型的工作原理,该模块可以模仿原始AI模型。在这个项目中,我们希望特别专注于向每种类型的用户(即领域专家,利益相关者,普通人)解释LLM的输出。本研究提案的总体目标是使用可解释性技术增加LLM的透明度。沿着透明度,可解释LLM还可以帮助识别模型本身存在的任何类型的偏差。最终,可解释的LLM是朝着创造一个对社会负责的AI环境的目标迈出的一步。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似海外基金

Toward Trustworthy Generative AI by Integrating Large Language Model with Knowledge Graph
通过将大型语言模型与知识图相结合,迈向可信赖的生成式人工智能
  • 批准号:
    24K20834
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Trustworthy decentralized AI for large-scale IoT representation learning
用于大规模物联网表征学习的值得信赖的去中心化人工智能
  • 批准号:
    22KJ0878
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
TC: Large: Collaborative Research: High-Level Language Support for Trustworthy Networks
TC:大型:协作研究:对可信赖网络的高级语言支持
  • 批准号:
    1111520
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
TC: Large: Collaborative Research: High-Level Language Support for Trustworthy Networks
TC:大型:协作研究:对可信赖网络的高级语言支持
  • 批准号:
    1111698
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
TC: Large: Collaborative Research: Towards Trustworthy Interactions in the Cloud
TC:大型:协作研究:实现云中值得信赖的交互
  • 批准号:
    1012060
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: 3Dsec: Trustworthy System Security through 3-D Integrated Hardware
TC:大型:协作研究:3Dsec:通过 3D 集成硬件实现值得信赖的系统安全
  • 批准号:
    0910389
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
TC: Large: Collaborative Research: 3Dsec: Trustworthy System Security through 3-D Integrated Hardware
TC:大型:协作研究:3Dsec:通过 3D 集成硬件实现值得信赖的系统安全
  • 批准号:
    0910734
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Interagency Agreement
TC: Large: Collaborative Research: 3Dsec: Trustworthy System Security through 3-D Integrated Hardware
TC:大型:协作研究:3Dsec:通过 3D 集成硬件实现值得信赖的系统安全
  • 批准号:
    0910581
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
TC: Large: Trustworthy Information Systems for Healthcare (TISH)
TC:大型:值得信赖的医疗保健信息系统 (TISH)
  • 批准号:
    0910842
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
TC: Large: Collaborative Research: Trustworthy Virtual Cloud Computing
TC:大型:协作研究:值得信赖的虚拟云计算
  • 批准号:
    0910483
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了