Python变量=引用->对象

对于像我这种从C/C++到Python的人,有时候对于Python的变量机制容易忘记,看到别人写的代码会觉得有问题似得,这里写篇笔记记录一下自己的理解。

阅读全文

tensorflow的custom_getter

最近在研究代码的时候碰到了tensorflow的get_variable函数的custom_getter关键字参数,官方说明不是很清晰,google也没有清晰的答案,就自己研究了一下!

阅读全文

Prioritized Experience Replay

本文是论文《Prioritized Experience Replay》的阅读笔记,论文的主要思想是根据TD error来对transition的采样优先级进行调整,使得重要的样本被采样到和被学习的概率加大。

阅读全文

Self-Imitation-Learning

这是ICML2018论文《Self-Imitation Learning》的阅读笔记,该论文主要提出了使得智能体学习自己过去好的经验的算法,其中A2C+SIL的性能非常好,值得研究。

阅读全文

动态规划

这是《Reinforcement Learning: an introduction》的第三篇学习笔记,主要讲解了使用动态规划解决MDPs,策略迭代和值迭代等知识。

阅读全文

有限马尔科夫决策过程

这是强化《Reinforcement learning: an introduction》的第二篇学习笔记,主要讲解了马尔科夫性质和马尔科夫决策过程,以及由此定义的状态值函数和动作值函数.

阅读全文

强化学习概述

这是自己对于《Reinforcement learning: an introduction》学习的第一篇笔记,主要讲解了什么是强化学习,以及强化学习的特征和元素等等,还有一些基础的概念性知识。

阅读全文

电脑防病毒指南

自从我们拥有计算机开始,感染病毒的危险就一直如影随形。今天我们就来讲讲电脑如何防病毒,谈谈个人对杀毒软件的看法,以及自己使用的防病毒技巧!

阅读全文

为什么我的电脑这么卡网速这么慢

对于现代人来说,计算机是日常离不开的办公和娱乐工具,它给我们带来便利和快乐的同时也给我们带来了无尽的烦恼!这篇文章主要讲解我们的电脑为什么会这么卡,反应会这么慢,网速为甚么老是不够用的问题,以及缓解这些症状的方法。我希望的是通过这篇文章能改变各位使用计算机的某些不良习惯,哪怕改变一个我相信你的电脑也会流畅很多。

阅读全文

关于重装系统,你应该知道的事情

重装系统是我们经常会面对的问题,对于计算机专业的童鞋来说是再简单不过的事情了,但是对于非计算机专业又不太懂得这方面知识的童鞋,你可能需要花几分钟读一下这篇文章,知道一些基础性的简单知识!怎样重装系统暂时先不讲,网上教程很多,先只讲一些非常重要的知识!

阅读全文