强化学习问题的概述,从问题定义,到分类,以及传统强化学习算法(主要覆盖DQN之前的RL经典算法,包括:动态规划、蒙特卡洛、时序差分q-learning和sarsa 等)。
Apr 13, 2019
实验室深度学习服务器环境配置ubuntu14.04 && GTX1080 && Cuda8.0, 解决安装驱动后桌面重复登录问题。 前面部分是配置ubuntu cuda 环境的记录,后面方案部分是成功安装驱动+桌面的正解。 问题的焦点在于:安装cuda驱动后,登录不了桌面,停留在重复输入密码界面。
Nov 21, 2016
C++中的一些小知识点。包括:printf压栈顺序,指针引用,动态内存以及变量的存储位置,构造函数,this指针等问题的回顾
Aug 30, 2016
有关PyBrain 库中NFQ算法的流程图分析,包括数据处理和策略的优化pipeline.
May 27, 2016
有关Python中引用特性的一些分析记录,包括对象的初始化,值拷贝等特性。
May 21, 2016
Python中一些有用的内置函数,包括map,zip,filter,reduce,yield,instance等函数,以及异步IO库asyncio的使用记录
May 17, 2016