Methoden des Reinforcement Lernens in realen, verteilten, kooperierenden Systemen

真实分布式协作系统中的强化学习方法

基本信息

  • 批准号:
    5318734
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    德国
  • 项目类别:
    Priority Programmes
  • 财政年份:
    2001
  • 资助国家:
    德国
  • 起止时间:
    2000-12-31 至 2007-12-31
  • 项目状态:
    已结题

项目摘要

Inhalt des Antrags ist die Konzeption und Weiterentwicklung von Reinforcement Lernverfahren zur Steuerung von realen, verteilten Robotersystemen. Der Antrag weist dabei zwei Schwerpunkte auf: 1. die Entwicklung von schnellen Lernalgorithmen für die Individualfähigkeiten eines realen Roboters. Hier existiert ein solider theoretischer Unterbau; allerdings benötigen die heutigen Algorithmen eine um mehrere Größenordnung zu hohe Anzahl an Trainingserfahrungen. Nach heutiger Einschätzung kann dieser Aufwand nur durch eine Kombination verschiedener Methoden (Simulation, Speicherung relevanter Erfahrungen, aktives Lernen) auf ein praktisch vertretbares Maß reduziert werden. Der 2. Schwerpunkt des Antrags liegt in der Konzeption von Lernverfahren zur verteilten Steuerung eines Teams von Robotern in kooperativen Multi-Agenten-Systemen. Hier existieren zur Zeit nur punktuell theoretisch fundierte Lernalgorithmen. Im Zusammenhang mit der Gesamtausrichtung des Schwerpunkts fehlen insbesondere Lernalgorithmen für verteilte, unabhängige, kooperierende Lerner in stochastischer Umgebung. Basierend auf Vorarbeiten unserer Gruppe sollen solche Algorithmen erarbeitet werden. Die Validierung der entwickelten Konzepte soll zum einen durch das Erlernen zentraler Fähigkeiten eines realen Roboters zum anderen durch die Umsetzung in unserem Simulationsklasseteam "Karlsruhe Brainstormers" (dem amtierenden Vizeweltmeister) durchgeführt werden.
嵌入式机器人是机器人系统中用于实际控制的加固系统的概念和Weiterentwicklung。这个陷阱有两个小洞:1。用于个人高性能机器人的学习算法的开发。Hier existiert ein solider theoretischer Unterbau; allerdings benötigen die heutigen Algorithmen eine um mehrere Größenordnung zuhe Anzahl an Trainingserfahrungen。因此,只有通过一种组合验证方法(模拟、相关实验、激励学习)才能实现最大限度的减少韦尔登。Der 2.在多机器人系统的协作中,控制机器人团队的远程控制系统的协调性是关键。这篇文章只介绍了基于Lernalgorithmen的punktuell理论。Im Zusammenhang mit der Gesamtausrichtung des Schwerpunkts fehlen insbesondere Lernalgorithmen für vertesilte,unabhängige,kooperierende Lerner in stochastischer Umgebung.我们的团队只能靠自己的努力来完成韦尔登。通过在韦尔登的模拟实验室“头脑风暴”小组中进行的实验,验证了一个由经验丰富的中央机器人组成的机器人。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr. Martin Riedmiller其他文献

Professor Dr. Martin Riedmiller的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr. Martin Riedmiller', 18)}}的其他基金

Mobile Manipulation in natürlichen Umgebungen - "TidyUpRobot"
自然环境中的移动操控——“TidyUpRobot”
  • 批准号:
    188951940
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Design einer Standardplattform (Hard- und Software) für die RoboCup Middle-Size Liga im Rahmen eines Open-Source Projektes
作为开源项目的一部分,为 RoboCup 中型联赛设计标准平台(硬件和软件)
  • 批准号:
    68707621
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Research Grants (Transfer Project)
Lernalgorithmen für kooperative Multi-Agenten Systeme
协作多智能体系统的学习算法
  • 批准号:
    5446214
  • 财政年份:
    2005
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似国自然基金

DES影响下RXFP2 参与小鼠睾丸引带细胞增殖迁移的信号通路研究
  • 批准号:
    2025JJ80600
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
番茄渣中类胡萝卜素与果胶的梯度DES提取机理与绿色工艺优化研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
活性炭分级孔中氨基酸类DES强化协同吸收—分步解吸SO2和NO的机制
  • 批准号:
    22378180
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
负载型POM-DES催化体系构筑及其对原本木质素的选择性降解与溶出机制研究
  • 批准号:
    22378217
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
构筑温敏相转变B-L双酸DES催化体系用于高效催化合成己内酰胺的研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
DES体系下木质纤维素定向修饰对植物精油的可控固定及抗菌增效机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
自噬在调节DES所致小鼠睾丸引带损伤中的作用及其机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
低共熔溶剂(DES)体系与木质纤维素生物质分子间相互作用研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
基于DNA纳米技术的模块化DES加密系统研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于CO2捕集的DES设计和筛选及其对CO2吸收机理研究
  • 批准号:
    52206220
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

DES空力弾性解析とAM風洞試験法のハイブリッド評価法による遷音速空力弾性現象の解明
使用 DES 气动弹性分析和 AM 风洞试验方法的混合评估方法阐明跨音速气动弹性现象
  • 批准号:
    24K17450
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
水を超える:生体DESが実現する革新的DNAの機能材料化
超越水:生物DES实现的创新DNA功能材料
  • 批准号:
    24K08554
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Vieillissement actif des personnes vivant avec des incapacités : Une vision inclusive et axée sur la personne
Vieillissement actif des personnes vivant avec des incapacités : Une Vision Included et axée sur la personne
  • 批准号:
    477892
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Salary Programs
Traiter le trouble de stress-post-traumatique découlant d'agressions sexuelles auprès des personnes 2ELGBTQI+
Traiter le Trouble destress-post-traumatique découlant dagressions sexuelles auprès des personnes 2ELGBTQI
  • 批准号:
    487614
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Operating Grants
Exploitation des ressources naturelles et santé mondiale : les coûts cachés et les impacts sur les communautés locales
自然和世界资源的开发:缓存和对公共场所的影响
  • 批准号:
    485676
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Miscellaneous Programs
Conversation collective pour identifier et prioriser des pistes d'action pour des personnes de la diversité sexuelle et de genre qui pratiquent le chemsex.
对话集体,旨在识别和优先考虑性别多样性和化学性类型的行动。
  • 批准号:
    485602
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Miscellaneous Programs
Prediction du risque de maladies cardiovasculaires par des approches misant sur l'intelligence artificielle dans la cohorte NutriNet-Sante
通过 NutriNet-Sante 智能技术预测心血管疾病风险
  • 批准号:
    486867
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Miscellaneous Programs
Chemsex après 55 ans : parcours de vie des hommes de la diversité sexuelle et de genre et des personnes non-binaires
Chemsex 于 55 年后推出:性多样性和流派及非二元人物的生活公园
  • 批准号:
    487999
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Operating Grants
Dérivation et validation d'un outil de stratification du risque applicable en préhospitalier pour déterminer le risque qu'une personne âgée nécessite des soins d'urgence et/ou une hospitalisation après une chute
在住院前适用的风险分层的衍生和验证是确定风险人员的必要条件,是住院后紧急情况和住院治疗所必需的
  • 批准号:
    479568
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Operating Grants
Les demandes anticipées d'aide médicale à mourir en contexte de troubles neurocognitifs majeurs: Perspective citoyenne autour des enjeux de santé
Les Demandes anticipées daide médicale à mourir en contexte de Troubles Neurocognitifs majeurs: Perspective citoyenne autour des enjeux de santé©
  • 批准号:
    485647
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Miscellaneous Programs
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了