多智能体强化学习 | 爱代码爱编程

代码编织梦想

ubuntu20.04和windows11下配置starcraft ii环境-爱代码爱编程

2024-02-24 分类: windows ubuntu smac 多智能体强化学习

1.Ubuntu20.04 根据下面这篇博客就可以顺利安装：强化学习实战(九) Linux下配置星际争霸Ⅱ环境https://blog.csdn.net/weixin_39059031/article/details/117247635?spm=1001.2014.3001.5506 Ubuntu下显示游戏界面目前还没有解决掉。大家可以根据以下

Continue Reading

【论文研读】marllib 的架构分析-爱代码爱编程

2023-08-09 分类: 架构 marl 算法 python 机器学习科研笔记多智能体强化学习

【论文研读】MARLlib: A Scalable Multi-agent Reinforcement Learning Library 和尚念经多智能体强化学习框架研究。多智能体强化学习库。多智能体强化学习算

Continue Reading

多智能体强化学习(marl)训练环境总结_多智能体协同控制 python-爱代码爱编程

2023-03-24 分类: 深度强化学习人工智能多智能体强化学习

目前开源的多智能体强化学习项目都是需要在特定多智能体环境下交互运行，为了更好的学习MARL code，需要先大致了解一些常见的MARL环境以及库文章目录 1.Farama Foundation2.Pettin

Continue Reading

多智能体强化学习-爱代码爱编程

2022-11-03 分类: 人工智能强化学习多智能体强化学习

引入注意力机制的actor-critic强化学习论文链接：https://arxiv.org/pdf/1810.02912.pdf 代码链接：https://github.com/shariqiqbal2810/M

Continue Reading

论文阅读-爱代码爱编程

2023-03-28 分类: 论文阅读强化学习 maddpg 多智能体强化学习 ddpg 攻击和防御

论文原题目：A deep reinforcement learning-based method applied for solving multi-agent defense and attack problems 论文链接：https://www.sciencedirect.com/science/article/pii/S0957417421003

Continue Reading

多智能体强化学习-爱代码爱编程

2022-11-18 分类: 深度学习神经网络计算机视觉多智能体强化学习

DGN: Graph Convolutional Reinforencement Learning 论文地址代码地址代码（修正）摘要论文主要讨论协作的多智能体在部分可观测的场景下通过通信来最大化多智能体系统

Continue Reading

多智能体强化学习-爱代码爱编程

2022-11-01 分类: 人工智能机器学习多智能体强化学习

多智能体强化学习面临的挑战： 1. 环境不稳定性的挑战在多智能体系统中，站在每个智能体的角度，它的环境中包含了其他智能体。在学习过程中，每个智能体的策略在不断更新，这样导致了系统中的每个智能体所处的环境都是不平稳的，这

Continue Reading

多智能体强化学习-爱代码爱编程

2022-11-01 分类: 算法人工智能机器学习多智能体强化学习

论文地址：Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments. 代码地址：Multi-Agent Deep Determinist

Continue Reading

多智能体强化学习环境【星际争霸ii】smac环境配置-爱代码爱编程

2022-12-26 分类: marl 人工智能 smac 多智能体强化学习星际争霸多智能体强化学习pape

多智能体强化学习这个领域中，很多Paper都使用的一个环境是——星际争多智能体挑战(StarCraft Multi-Agent Challenge, SMAC)。最近也配置了这个环境，把中间一些步骤记录下来。2022.

Continue Reading

多智能体强化学习-爱代码爱编程

2022-11-03 分类: 算法人工智能强化学习多智能体强化学习

COMA：Counterfactual Multi-Agent Policy Gradients 论文地址：https://arxiv.org/pdf/1705.08926.pdf 代码地址：https://github

Continue Reading

icml 2022 不求甚解阅读笔记-爱代码爱编程

2022-09-01 分类: 人工智能多智能体强化学习

1. Individual Reward Assisted Multi-Agent Reinforcement Learning Li Wang, Yupeng Zhang, Yujing Hu, Weixun Wang,

Continue Reading

多智能体强化学习论文——seps（icml 2021)-爱代码爱编程

2021-09-11 分类: 深度学习自然语言处理多智能体强化学习

存在的问题&研究动机&研究思路参数共享作为多智能体里面的基本范式，但是其效果依赖于环境和智能体的奖励，当这些项不同的时候，naive的参数共享就变得不那么有效。文章将每个智能体编码到新的嵌入空间中，然后将

Continue Reading

pettingzoo：多智能体游戏环境库入门-爱代码爱编程

2022-08-06 分类: 游戏人工智能强化学习多智能体多智能体强化学习 posg

文章目录概述游戏环境安装 PettingZoo导入包初始化环境与环境交互概述 PettingZoo1 类似于 Gym 的多智能体版本。Gym2是 OpenAI 开发的一个著名的强化学习库，

Continue Reading

多智能体深度强化学习综述与批判——matthew e. taylor_多智能体强化学习方向综述英文-爱代码爱编程

2022-05-27 分类: 深度强化学习强化学习多智能体强化学习多智能体强化学习pape

这篇综述是华盛顿大学的Matthew E. Taylor总结的，“A Survey and Critique of Multiagent Deep Reinforcement Learning”。下载链接：http:/

Continue Reading

drl基础（一）——强化学习发展历史简述-爱代码爱编程

2022-09-12 分类: 深度强化学习人工智能深度学习强化学习多智能体强化学习深度强化学习极简入门与p

【摘要】介绍强化学习的起源、发展、主要流派、以及应用。强化学习理论和技术很早就被提出和研究了，属于人工智能三大流派中的行为主义。强化学习一度成为人工智能研究的主流，而最近十年多年随着以深度学习为基础的联结主义的兴起，强

Continue Reading

基于深度强化学习的柔性作业车间动态调度_基于多动作深度强化学习的柔性车间调度-爱代码爱编程

2022-04-14 分类: 深度强化学习强化学习车间调度 # 强化学习调度算法多智能体强化学习论文阅读与实现 # 柔性作业车间调度

文献来源：International Journal of Production Research（2022）南洋理工大学（IJPR/2022）Full article: Deep reinforcement learning for dynamic scheduling of a flexible job shop (tandfonline.com)

Continue Reading

多智能体强化学习论文——maac_maac算法-爱代码爱编程

2021-09-03 分类: 深度学习强化学习多智能体强化学习

存在的问题&研究动机&研究思路多智能体值函数逼近，本质上来说是一个多任务回归问题。MAAC从当前策略中采样动作值，而MADDPG从replay buffer中抽样更新（容易造成overgeneraliza

Continue Reading

简述fictitious play原理及实现-爱代码爱编程

2023-07-14 分类: 算法人工智能 python 多智能体强化学习

背景对博弈求均衡是算法博弈论的一个重要内容，这里介绍一个经典的求均衡算法：Fictitious Play（虚拟对弈）。在博弈论中，虚拟对弈（Fictitious Play）是由乔治·W·布朗（George W. Br

Continue Reading

maddpg-学习笔记(2)-爱代码爱编程

2023-05-19 分类: 深度强化学习强化学习 maddpg 多智能体强化学习 ddpg

注意：进行本文的实验前，为了加快训练速度，进行了参数调整 num-episodes：由60000改成了10000 lr:由0.01改成了0.1 batch-size:由1024改成了32 1.报错 1.1 AttributeError: 'Scenario' object has no attribute 'benchmark_data' (p

Continue Reading

maddpg-学习笔记(1)-爱代码爱编程

2023-05-16 分类: 深度强化学习强化学习 maddpg 多智能体强化学习 ddpg

文献链接：https://arxiv.org/abs/1706.02275 "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments"（作者：Lowe, Ryan等人，2017年）环境搭建：https://zhuanlan.zhihu.com/p/41954025

Continue Reading