Multi-agent Self-improving of Large Language Models (LLMs)
大型语言模型 (LLM) 的多智能体自我改进
基本信息
- 批准号:2903811
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2024
- 资助国家:英国
- 起止时间:2024 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
In the rapidly evolving field of artificial intelligence (AI), Large Language Models (LLMs) stand out as powerful tools capable of understanding human instructions and generating helpful answers. However, the development of these models faces significant challenges. In general, improving LLMs' generation ability and aligning their generation with human values rely heavily on vast amounts of human feedback annotations. This approach, while effective, is difficult to scale and may inherently limit the models' potential. As an alternative, some researchers turn to train LLMs using self-generated data, i.e., self-learning. Self-learning also presents a set of problems, including the risk of reinforcing existing biases or inaccuracies without external correction. This dilemma sets the stage for a novel approach to advancing LLM capabilities without substantial demand for human resources or the pitfalls of self-learning. This project tries to propose an innovative self-improving framework through a multi-agent system that enables these models to learn and enhance themselves by leveraging feedback from other peer models. By integrating the strengths and diversity of various LLMs, the system is expected to refine its ability to follow instructions, align with human values, and perform across a broad spectrum of downstream tasks with minimal human supervision. The vision is to establish a scalable and efficient method for continuous improvement through inter-model interactions, sidestepping the constraints of human feedback and the limitations of self-generated data training. At the heart of this self-improving system are two pivotal questions: 1. Can the diversity of LLMs enrich the quality of self-generated training data? 2. Can collaboration among different LLMs reduce the necessity for human annotations while ensuring ongoing enhancement? Addressing these two open queries could open the door to a new paradigm in AI training/alignment methodologies. This exploration aims at fostering more efficient AI systems development with reduced reliance on human oversight and intervention. This project, therefore, is also an open-ended exploration into future AI training strategies. It seeks to contribute to the AI community by moving away from heavily human-supervision-dependent models to more data-efficient and self-improving LLM systems.
在快速发展的人工智能(AI)领域,大型语言模型(LLM)作为能够理解人类指令并生成有用答案的强大工具脱颖而出。然而,这些模式的发展面临重大挑战。一般来说,提高LLM的生成能力并使其生成与人类价值观相一致在很大程度上依赖于大量的人类反馈注释。这种方法虽然有效,但难以扩展,并且可能固有地限制模型的潜力。作为替代方案,一些研究人员转向使用自我生成的数据来训练LLM,即,自学自学也带来了一系列问题,包括在没有外部纠正的情况下加强现有偏见或不准确性的风险。这种困境为一种新的方法奠定了基础,以提高LLM的能力,而无需大量的人力资源需求或自学的陷阱。该项目试图通过多代理系统提出一个创新的自我改进框架,使这些模型能够通过利用其他对等模型的反馈来学习和增强自己。通过整合各种LLM的优势和多样性,该系统有望改进其遵循指令的能力,与人类价值观保持一致,并在最少的人为监督下执行广泛的下游任务。我们的愿景是建立一种可扩展的、高效的方法,通过模型间的交互进行持续改进,避开人类反馈的约束和自我生成数据训练的局限性。这个自我完善系统的核心是两个关键问题:1。LLM的多样性能否丰富自我生成的训练数据的质量?2.不同LLM之间的协作是否可以在确保持续增强的同时减少人工注释的必要性?解决这两个开放的问题可以为人工智能训练/对齐方法的新范式打开大门。这种探索旨在促进更有效的人工智能系统开发,减少对人类监督和干预的依赖。因此,该项目也是对未来人工智能培训策略的开放式探索。它旨在通过从严重依赖人类监督的模型转向更有效的数据和自我改进的LLM系统来为AI社区做出贡献。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
城市随迁老年人活动需求的影响机制与动态空间模型预测研究
- 批准号:2025JJ60227
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于Agent的自动化渗透测试技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
AI Agent赋能中小企业智能决策系统研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
计算机控制Agent在可交互式企业征信报告生成的应用研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
大模型Agent驱动的AI制药关键技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
复杂网络理论下的智慧景区管理与人流控制方法
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
混合多元区域情境下多Agent的自主协同决策方法研究
- 批准号:62306099
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于操控员情境意识状态可解释Agent的智能交互触发机制研究
- 批准号:62376220
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于多Agent仿真模型的新能源汽车市场渗透研究
- 批准号:2023JJ60196
- 批准年份:2023
- 资助金额:0.0 万元
- 项目类别:省市级项目
面向联排联调的城市复合洪涝灾害风险Agent建模与智能决策
- 批准号:42371092
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Self-adaptive and Cooperative Multi-agent Reinforcement Learning-based Network Traffic Control
基于强化学习的自适应协作多智能体网络流量控制
- 批准号:
23K19982 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Research Activity Start-up
Dynamic and Self-adaptive Multi-agent Network for Optimal Operation of Engineering Processes
用于工程过程优化运行的动态自适应多智能体网络
- 批准号:
RGPIN-2017-04456 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Dynamic and Self-adaptive Multi-agent Network for Optimal Operation of Engineering Processes
用于工程过程优化运行的动态自适应多智能体网络
- 批准号:
RGPIN-2017-04456 - 财政年份:2020
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Dynamic and Self-adaptive Multi-agent Network for Optimal Operation of Engineering Processes
用于工程过程优化运行的动态自适应多智能体网络
- 批准号:
RGPIN-2017-04456 - 财政年份:2019
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Dynamic and Self-adaptive Multi-agent Network for Optimal Operation of Engineering Processes
用于工程过程优化运行的动态自适应多智能体网络
- 批准号:
RGPIN-2017-04456 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Learning, Innovation, and Explanation in Self-Organising Multi-Agent Systems
自组织多智能体系统的学习、创新和解释
- 批准号:
2127915 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Studentship
RI: Small: Variation and self-organization in multi-agent systems
RI:小:多智能体系统中的变化和自组织
- 批准号:
1816777 - 财政年份:2018
- 资助金额:
-- - 项目类别:
Standard Grant
Dynamic and Self-adaptive Multi-agent Network for Optimal Operation of Engineering Processes
用于工程过程优化运行的动态自适应多智能体网络
- 批准号:
RGPIN-2017-04456 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Multi-Agent Solutions for the Development of Self-Organised and Self-Adapted Distributed Energy Generation Systems
用于开发自组织和自适应分布式能源发电系统的多智能体解决方案
- 批准号:
DP140100974 - 财政年份:2014
- 资助金额:
-- - 项目类别:
Discovery Projects