Blog

基于dqn 的强化学习方法的梳理总结，从经典的DQN算法开始，总结不同方法的改进策略，到集大成者Rainbow算法。

May 13, 2019

梳理当前经典的强化学习开源库，以及一些经典的仿真环境。

Apr 23, 2019

强化学习问题的概述，从问题定义，到分类，以及传统强化学习算法（主要覆盖DQN之前的RL经典算法,包括：动态规划、蒙特卡洛、时序差分q-learning和sarsa 等）。

Apr 13, 2019

实验室深度学习服务器环境配置ubuntu14.04 && GTX1080 && Cuda8.0, 解决安装驱动后桌面重复登录问题。前面部分是配置ubuntu cuda 环境的记录，后面方案部分是成功安装驱动+桌面的正解。问题的焦点在于：安装cuda驱动后，登录不了桌面，停留在重复输入密码界面。

Nov 21, 2016

C++中的一些小知识点。包括：printf压栈顺序，指针引用，动态内存以及变量的存储位置，构造函数，this指针等问题的回顾

Aug 30, 2016

有关PyBrain 库中NFQ算法的流程图分析，包括数据处理和策略的优化pipeline.

May 27, 2016

有关Python中引用特性的一些分析记录，包括对象的初始化，值拷贝等特性。

May 21, 2016

Python中一些有用的内置函数，包括map，zip，filter，reduce，yield，instance等函数，以及异步IO库asyncio的使用记录

May 17, 2016