Lovely Buggies

Miracles happen outside the comfort zone.

文学编程,让打码更优雅

编程文艺范儿

最近在研究Jupyter Notebook的时候发现了文学编程的这个概念。左手程序员,右手艺术家,文学编程是什么,编程又如何能编出文艺范儿呢? 文学编程的概念 文学编程是一种由Donald Knuth提出的编程范式。这种范式提供了用自然语言来解释程序逻辑的机会。当然你一定会想到Markdown或者源代码中的注释。 与之不同的是,文学编程中间穿插着宏片段和传统的源代码,从中可以生成...

2018夏——实习感受

我在中科院自动化所的实习感受

2018年7月至8月,我在中科院自动化所CASIA进行了关于强化学习方向的实习。实习主要是把open AI的一个新算法——MADDPG算法应用大暴雪游戏的星际争霸2强化学习环境中去。这次实习增加了我对机器学习的理解,同时也磨练了我应对困难的能力。 1 大北京啊 北京,这座城市,不仅仅给人带来车水马龙的喧嚣,也有劳碌过后的疲倦与孤独。 中科院自动化所CASIA,坐落于知春...

星际争霸II的强化学习环境(3)

CASIA实习结业报告

项目地址,一些公式可能无法查看,可以从这里查看。 目录 简介 功能 项目 Papers Document maddpg csv文件 load文件 train_maddpg.py ...

星际争霸II的强化学习环境(2)

算法篇

项目地址,一些公式可能无法查看,可以从这里查看。 本项目主要是将深度强化学习(RL)中的MADDPG——混合竞争合作环境下的多智体评论家算法接入到暴雪公司和Deepmind发布的针对星际争霸2的SC2LE环境下。本wiki介绍了该项目用到的基础算法——MADDPG算法,以及其在RL中的算法基础。 强化学习(RL) 强化学习是机器学习区别于监督式学习和无监督式学习的一种新的学习方...

星际争霸II的强化学习环境(1)

环境篇

项目地址,一些公式可能无法显示,可以从这里查看。 SC2LE——星际争霸2学习环境,是一种基于星际争霸2游戏的强化学习环境。是DeepMind和暴雪公司联合进行研究开发的。本文可以看作是对《迈向通用人工智能:星际争霸2人工智能研究环境SC2LE完全入门指南》的扩充,详细讲解了DeepMind发布的StarCraft II Paper。有关代码的GitHub是PYSC2,Blizzar...