Blog

深度强化学习方法-DQN系列
深度强化学习方法-DQN系列

基于dqn 的强化学习方法的梳理总结,从经典的DQN算法开始,总结不同方法的改进策略,到集大成者Rainbow算法。

May 13, 2019

强化学习系统库及仿真环境
强化学习系统库及仿真环境

梳理当前经典的强化学习开源库, 以及一些经典的仿真环境。

Apr 23, 2019

强化学习基本问题回顾总结
强化学习基本问题回顾总结

强化学习问题的概述,从问题定义,到分类,以及传统强化学习算法(主要覆盖DQN之前的RL经典算法,包括:动态规划、蒙特卡洛、时序差分q-learning和sarsa 等)。

Apr 13, 2019

DL服务器主机环境配置 ubuntu14.04 && Cuda8.0
DL服务器主机环境配置 ubuntu14.04 && Cuda8.0

实验室深度学习服务器环境配置ubuntu14.04 && GTX1080 && Cuda8.0, 解决安装驱动后桌面重复登录问题。 前面部分是配置ubuntu cuda 环境的记录,后面方案部分是成功安装驱动+桌面的正解。 问题的焦点在于:安装cuda驱动后,登录不了桌面,停留在重复输入密码界面。

Nov 21, 2016

C_Cplus程序设计涉及的一些知识点
C_Cplus程序设计涉及的一些知识点

C++中的一些小知识点。包括:printf压栈顺序,指针引用,动态内存以及变量的存储位置,构造函数,this指针等问题的回顾

Aug 30, 2016

PyBrain库的example之NFQ流程图分析
PyBrain库的example之NFQ流程图分析

有关PyBrain 库中NFQ算法的流程图分析,包括数据处理和策略的优化pipeline.

May 27, 2016

Python 有关引用的一些问题
Python 有关引用的一些问题

有关Python中引用特性的一些分析记录,包括对象的初始化,值拷贝等特性。

May 21, 2016

Python内建函数
Python内建函数

Python中一些有用的内置函数,包括map,zip,filter,reduce,yield,instance等函数,以及异步IO库asyncio的使用记录

May 17, 2016