写在2020年1月17日

能实现的,我称为梦想;不能实现的,我称为空想。

2019年1月1日,我写了不少年度计划,结果,多数没有实现。

刚刚跟我大学的朋友兼工作后的室友邵总聊完,感慨颇多;现在在从北京开往南京的火车上,想着记录一下今天的思考。

2019年回顾

2019年的忙碌主要原因是:项目耽搁了。

2020年,无论什么原因,要努力了。

阅读全文

Node.js 爬虫 crawler

做技术的,无论写没写过,但是一定都听说过:爬虫。

爬虫主要有两类:通用爬虫——主要用于搜索引擎;聚焦爬虫——主要用于特定信息的获取。

搜索引擎的爬虫的基本原理很简单,是个链接就爬;当然了背后的其他技术就很复杂了。聚焦爬虫则要对具体的页面,接口规则做处理,以求把各个场景下的数据都能够爬取下来。

昨晚熬夜学习了下爬虫,把国家统计局的中国行政区划码爬了一波,目前有两万多条数据,还没爬完呢,很多都是超时,应该是触发率了访问限制, IP 被封了。

目前爬到了4级行政区,两万多条数据

阅读全文

阿里云数据盘扩容记录

环境:CentOS 7.3 x64

为什么需要进行数据盘扩容呢?

由于我们的 cloud 和 git 的数据量越来越大,数据盘占用到了98%,因而需要立刻扩容。

本次扩容把数据盘的容量从20GB扩展到了30GB,本想扩大到更大的,但是更大不也就更贵的么,所以先加上10GB 再说,后续如果需要,可以再次扩容。

阅读全文

埃及的骗子和澳大利亚的女孩

北京出发,广州约见师兄,在沙特的利雅得转机,达到埃及的开罗,去赫尔格达,再去卢克索,再飞开罗最后离开埃及飞向莫斯科,再去海参崴,再回到北京,也算是一次折腾的旅程。

在埃及,有三个目的地:开罗——金字塔;赫尔格达——-红海潜水;卢克索——热气球和神庙。

现在是2018年10月5日的21:54,5个小时的时差,也就是北京时间10月6日的3:54;明早就要早起坐飞机回开罗然后离开埃及了,我觉得在酒店写点游记,算是对这一次有意义的旅程的交代。当然,一篇游记是很费事儿的,我觉得我可能写不完,可以在明天等飞机的时候接着写。

同行的小伙伴在金字塔的背影

阅读全文