目标

技术类

大数据+AI  
spark open
tf open
caffe open
统计学习方法 done
ng coursera ml done
ng cs 229 open
web,backends  
大话图解 http done
Mysql 必知必会 done
docker done
Nginx 开发从入门到精通 open
Redis 设计与实现 open
语言,基础  
python 廖雪峰 done
python opencv 官方教程 half done
c++11 并发编程 almost done
effective c++ open
算法导论 open

跑步

600km,1 全马 done

博客

100 篇以上 done

Updated

3.15

这个月主要是实践了基于 flasks 的 python 的 flask,nginx,RESTFUL API 这些. 另外就是 sql 的学习,了解所有的概念,包括 orm 这些. AI 还是停留在 HMM 的理解上,要加把油了

还有!马上就是 3.18 的全马了…跑的少,有点虚,但是还要试试.

3.28

这两个星期集中精力对统计学习方法开火了,监督学习先搞明白,后面再往深度学习过渡.

目前是在算法的研读阶段,恶补了很多数学知识,比较分散,不懂就去搜.当前已经看了: 感知机,朴素贝叶斯,决策树,KNN,SVM,最小二乘,Logistic regression

数学上理解起来还是不容易,以SVM作为主要的硬骨头…

决策树做了代码实现,初步实现了自己的想法,(算法实现,调优,特征处理,图形可视化)并接触到了 sklearn,kaggle,jupyer notebook 等工具,应该继续深入下去.

决策树涉及到更深的如剪枝,随机森林等

另外就是逐渐恢复数学基础知识,包括概率的,矩阵的,线性代数的,最优化理论的,等等.

思路还是要数学知根知底,工具熟练掌握,结合实际实战加深理解.

4.26

截至今天 Ng coursera machine learning ch1-ch6 完成,包括每章的 octave 作业,姿势大涨; 包括linear regression,Logistic regression,full bp netural work,如何处理high bias and high varience等等,工程实现经验果然比纯看算法来的干货要多.

统计学习方法的 ch10 的hmm搞透了,三种基本算法都用 python 做了代码实现,对比使用了下hmmlearn库,API 侠果然好简单…不过库的实现来说,人家考虑就是很全面,anyway,我对自己能实现 hmm 还是很满意的.

另外就是开始使用 jupyer notebook 做笔记,非常爽的体验.果断要坚持了

SVM算法的理论已经扫过两遍了,算法最后实现可能不难,中间的推到可谓蜀道难.对偶,KKT 条件,核函数,最终竟然也能和统一到一个比较完美的以 hingo 函数为代价函数加上 L2 正则化的路上来,不得不佩服数学的精美!

争取这个月底前完成 Ng coursera 的 ch7(即是 svm),ch8.

5.13

Ng 的课程全币完毕.

kagle 上的 titanic 深入研究了下,sklearn   seaborn 等也算是入了门。对 ensemable 有更直观的理解了.

jupyer notebook 真的好用。

另外决策树这块深入看了下,id3,c4.5,cart 到 adaboost,gbdt,xgboost,ensemble stacking, boosting.挺有意思.

一直在思考一个方向,data mining,npl,cv,vr.

从自己目前的从事来看,cv 好像是更合适的.这样以后的简历会更匹配.

kaggle 肯定是要练习的平台,计划每月打一个比赛。但是 kaggle 更偏向 data scientist,特征工程.

deeplearning 也要开始了.karas,ts

从台湾那个讲义开始?->fast.ai->deeplearning.ai->cs231

还有就是工程实践了,kafka,spark 都要慢慢熟悉,看起来

前路漫漫,上下求索。

5.28

到今天 fastai 上到 lesson4 了,top to down 的方式了解当今最好的 deep learning 的实践方法.确实很牛逼.

pytorch 算是入了门,tensor 和 numpy 的 narray 很接近.NNModule 定义 forward 计算,网络就是在这里体现,

几个很重要的思想:

利用好 pre-trained model; freeze/unfreeze learning rate 学习率的确定方法.lr_find / SGDR(with restart)/分层学习率

AWS 也用起来了,资费小贵,但值得继续深入。跑 fastai 到 kaggle 提交,也算是走过

CNN 着重理解了下,还需进一步实践.fast ai 里 做了2个例子. convolution layer,drop out, max pooling, full connection layer, softmax.

fastai 到 nlp,有点嚼不动了,因为英文的 nlp 本来就是另外一个领域.

6.19

house pricing regression 问题 kaggle 完整的做了一遍,重点提升是对回归问题的理解和 pandas 的进一步使用,及对特征工程的进一步熟悉。

用 fast-ai 的方式编程实现了 house price,但是效果不如 L2 线性回归(Lasso)

然后 fastai 上到了 lesson6,在进入 RNN 之前,进行了停顿。

开始了 nenural networking and deep learning 的课程学习 ,特别是对 bp 算法的推导和理解。

很多基础的知识好好加深,如 activation function, output layer, SGD 相关算法(min-batch SGD with momentum 以及衍生算法)

进展并不算快,得加油了。

工作上,主要做了微信后台,也算是更深入做了一些 python 后台的工作,有一些收获,但是也不是那么饱满。

对 nginx 的配置更熟悉了.

回家过端午,耽误了一些学习,继续加油

6.20

要爬 meta 视频,做推荐系统?这可是好机会.

6.25

效率有点低,算是把 graident boost 的原理吃透了.

心累,效率低,学习方法还是太撒网式的了,太注重原理的理解,费力

  • nenural networking and deep learning stoped by ch3

  • fastai stopped by RNN

  • 推荐系统实践,先暂停把

7 月份要开始 hadoop/spark 了,工程实践目前攒的太少了

前面 2 个,6 月份撸完!

6.29

  • nenural networking and deep learning done

目前对 CNN 的理解应该到位了.开启了 cs231 的学习之旅?

是不是该手动把最简单的 network + CNN 实现了?

7.30

这一个月很惭愧,没比上个月多看多少东西,心态有一点崩,东搞西搞,有点无头苍蝇.

继续坚持! 该捡起的捡起 ,该学习的新的继续学习

不拧巴, 不焦虑, 不勉强.

8.1

AF 完毕, 训练有素.英语比出乎意料的好, 技术没问题, 好像情商测试这方面不是太好

8.28

AF refused.

突然来的腰疼,打破了跑步的节奏,不敢多跑.

各种节奏就是不对了,整个 7 月和 8 月…

AI Paused. 遗憾

重新整理了设计模式,算法再看,进展较慢.

买了个新 ssd,折腾了 2 个星期的 win10 和 ubuntu18,差不多可以用了

pylink 已经能按既定目标实现好了,next…

9.26

AI paused !

这个月搞 STF 了. 核心收获是 docker 和 docker-compose 把玩.

一张 STF 的网络架构图把我唬住了,核心是 zeromq,于是好好看了一把

以前分布式没有概念,现在有一些感觉了,broker, load balancing 策略等是最吸引人的部分.

作者已仙逝,凭着对大神的敬仰,也要好好学下 zeromq.

于是横向扩展,消息队列还有 rabbit mq, kafka 等等.

这都是自己迫切想去了解,使用的东西.

折腾下来,好像路又走的不坚定了,web ? AI ? or together?

痛苦的是,工作并不能提供这些,只有自己摸索.

精力是有限的,新方向,基础能力,工作…自己一定要想清楚了.

工作让看浏览器插件?javascript? node.js?…哎

10.26

web celery 异步任务框架.

locust 性能测试框架以及概念.

gevent/协程学习

docker 技术培训.

11.30

push 策略

gevent

rabitmq 学习

itchat 源码和学习

12.30

leetcode.

开始看些前端了,h5+js 等

做了个简易 portal 网页.