磨刀不误砍柴功——聊聊个人IT基础设施的完善

2013-10-14IT 学习方法

★引子


◇最近俺在忙些啥?


  经常关注俺博客的读者肯定都发觉了,最近一个月,俺发博文的频度下降了一半。害得不少读者为俺担心,以为俺出了啥事儿。
  为了避免大伙儿担心,也为了满足某些人的好奇心,跟列位看官澄清一下:近期在对自己的一些 IT 基础设施进行升级,所以占用了很多业余时间。不过俗话说得好:磨刀不误砍柴功。这些时间是值付出的。

◇为啥选在这个时间点捏?


  其实俺每隔几年都要把自己的 IT 基础设施进行一次大的升级。这就如同 Google 每隔 2-3 年都要把搜索引擎的核心技术进行一次大的升级。IT 技术的发展太快了,这样做才能与时俱进,保持一个 Geek 的先进性。

  俺的上一次升级是在 2010 年。时光飞逝,转眼又是三年。而且最近又发生了两件事情,促使俺决定升级一把。
  其一是 Google Reader 在7月1日被关闭
  俺一直是 Google Reader 的重度用户,过去6、7年,大部分上网时间都是在阅读 GR 上的内容。
  GR 关闭之后,尝试了几个 RSS 阅读器(比如 Feedly、DiggReader)作为 GR 的替代品,都不太满意。所以最近1-2个月,俺一直在摸索,希望能找到一些新的手段,用来提升信息获取的效率。
  其二是 棱镜门丑闻
  棱镜门丑闻已经曝光3-4个月了,还一直有新的猛料出现。不得不佩服斯诺登,能搞到这么多猛料;也不得不佩服美国国安局(NSA),能够把触角伸到互联网的这么多角落。
  对于 NSA,俺倒不太担心(俺应该不是它的目标 );俺比较担心的是天朝的有关部门。有句俗话叫做:外行看热闹,内行看门道。天朝的有关部门一定会从这些曝光的材料中得到很多借鉴。不久的将来,它们也会效仿 NSA 的手法,加强对民众的信息监控。如此一来,像俺这种长期抹黑朝廷的人,风险大大滴。为了防范于未然,需要提前做好一些应对的措施。

★为啥要完善个人的IT基础设施?


  刚才讲的是俺本人的情况。其实捏,"完善个人的IT基础设施"对每个人都很有用(所以今天才单独写一篇博文,介绍这方面的经验)。
  对大多数人而言,完善自己的 IT 基础设施至少有如下几个好处。

◇基于时间管理的考虑


  在这个世界上,时间是相对比较公平的。每个人清醒的时间(刨掉1/3的睡眠时间),最多也不超过80年。在时间跨度有限的情况下,你能做的就是:提高时间的利用率和时间效率
  俺非常庆幸自己赶上了信息化的浪潮。在信息化时代,有两个利器:计算机和互联网。如果你善于利用这两个工具,可以极大地提升你的时间利用率和时间效率。

◇基于安全性的考虑


  很多人对"安全性"一词有误解。一提到"安全",都联想到骇客入侵。其实骇客入侵只是安全的一个方面而已。举例来说"容灾备份"也属于"信息安全"领域。感觉很多同学都缺乏"备份"的意识。那些不做备份的同学,万一哪天硬盘坏了、移动设备丢了,你就傻B了。
  另外,隐私问题也属于"信息安全"的范畴。如今这个问题已经越来越严重(包括 国家级别的监控 和 商业公司的监控),每个人都需要面对。

★关于"个人IT基础设施"的一些经验


  总的来说,可以分为软件和硬件两方面。俺觉得软件方面是关键,有更多值得说道的地方。所以下面重点聊软件方面。

◇网络方面


  主要包括:宽带接入和翻墙。
  如今宽带接入已经非常普及了,只可惜翻墙还是不够普及。所以最近3年来,俺一直在扫盲翻墙的各种姿势。关于翻墙的话题,之前已经聊了很多(到博客右侧栏点"翻墙"标签,就可以看到所有翻墙类的博文)。所以今天就不展开了。
  当然啦,宽带接入和翻墙只是最基本的两个必要条件。如果你属于"爱折腾技术"的人,还可以考虑搞一个 VPS 来玩玩。甚至还可以考虑搭建"个人云"。

◇操作系统方面


  目前的桌面操作系统,根据普及度分别是:Windows、Mac OS、Linux。三者中 Linux 最小众,但使用效率反而比 Windows 要高很多。这其实符合一个普遍规律——越牛的工具,上手的门槛越高,通常也就越"小众"。
  虽然 Linux 的门槛稍高,但并不是高不可攀。如果你是 IT 技术人员,肯定要尝试一下 Linux,或许会喜欢上它;如果你完全没有技术背景,但具有很高的热情,也可以去尝试一下。
  Linux 相对于 Windows 有很多优势,限于篇幅,先聊其中2点:

  1. 更好的"可定制化"
  大多数 Linux 的发行版都提供软件包管理工具,你可以只安装自己需要的软件包。比如俺装的 Linux 虚拟机(用来上网的),只占用不到 1GB 硬盘。哪怕装10个虚拟机,也只有不到 10GB。还有一些迷你型的 Linux 发行版,居然只有几十MB,而且功能齐全。再来看口碑不错的 Windows 7,动不动就用掉 20GB 硬盘;即使精简版的 Win Thin PC,至少也要用掉 6GB。
  可能有的同学会说,现在硬盘很便宜,用掉一点空间无所谓。但问题不仅仅在于硬盘空间,还包括安全性的问题。Windows 系统难以定制,系统中有一大堆你根本用不到的软件模块。虽然你本人用不到,但如果出现安全漏洞,就会被入侵者利用。而 Linux 具有高度可定制化,只装极少数你用到的软件包。系统中的软件包越少,出现安全漏洞的概率就越小。

  2. 更适合做"自动化"
  俺曾经写过一个系列《如何成为优秀开发人员》,里面有一篇是《正确地做事(善用自动化)》。这篇博文特别强调,要让电脑帮你做一些重复性的、枯燥的事情,以此来提升你本人的时间效率。而且很多枯燥的重复性的工作,如果让人去做,一旦时间长了,人比电脑更容易出差错。
  在"自动化"方面,Linux 比 Windows 具有明显的优势。Linux 具有更强的命令行功能和命令行的资源(比如各式各样的命令行工具),非常适合用来搞"自动化"。Windows 在最近几年有所改进(比如推出了 Power Shell),但是在命令行方面,跟 Linux 的差距依然很大。

  等忙完这阵,俺会抽空聊一下 Linux 相对 Windows 的其它一些优点。

◇虚拟化方面


  说完操作系统,再来说说"操作系统虚拟化"。所谓的"操作系统虚拟化",简单说就是"虚拟机"。
  关于"操作系统虚拟机"这个话题,俺在去年已经写了一个《扫盲操作系统虚拟机》系列(这是少数几个已经写完的系列:)。在这个系列中,有一篇专门介绍虚拟机带来的种种好处(包括效率方面,功能方面,安全性方面、等等)。没用过虚拟机的同学,可以先看看这篇。

◇存储/备份方面


  在 IT 行业中,存储设备(比如硬盘)的增长速度是超越摩尔定律的。最近两年,TB级别(1TB=1000GB)的硬盘也不过几百块钱。你可以花很少的银子卖到足够大的硬盘。所以,至少你可以做"跨硬盘备份"。所谓的"跨硬盘备份"有两种搞法:同一台机器的不同硬盘、不同机器的不同硬盘。

  关于"跨硬盘备份"的工具,俺强烈推荐 rsync(维基百科的介绍在"这里")。这是一款历史很悠久、成熟度很高,功能很强大的文件同步工具。限于篇幅,俺只介绍它的两个优点:

  1. 应用场合非常广
  支持各种操作系统(包括 Windows、Linux、BSD、等等)
  既可以用来做本机不同目录之间的同步备份,也可以用来做跨机器的同步备份。

  2. 飞快的速度——极强的差异备份功能
  为啥 rsync 的备份速度很快,因为它支持"字节级增量备份"。关于这玩意儿,上次介绍《文件备份技巧:组合"虚拟加密盘"和"网盘"》的时候,有介绍到过。

举个例子:
你有一个虚拟机的硬盘文件,有5GB。第一次备份的时候,rsync 跟传统的 copy 没有区别——都要把整个文件原样复制过去。但是之后的第 N 次备份就有差别了。
假设一个月之后,这个虚拟机硬盘文件只有其中的 100MB 发生改变。那么 rsync 在备份的时候,只会传输发生变化的这部分内容(即使变化的内容分散在文件的不同的位置,rsync 也可以准确定位)

  在大多数情况下,本地的跨硬盘备份基本够用——除非你遭遇某些小概率事件(比如:家中失火、家中失窃)。
  如果想要防范这些小概率事件,你还可以考虑"网盘备份"或者"同城异地备份"。对于网盘备份,可以参考《文件备份技巧:组合"虚拟加密盘"和"网盘"》。所谓的"同城异地备份",可能很多人没听说过。其实做法很简单:你把数据备份到一个硬盘,把硬盘放到公司的抽屉里。这样一来,即使你家遭遇失窃/失火,公司里还有一份数据。
  "同城异地备份"相比"网盘备份"的优点是:空间足够大(你可以买几 TB 的硬盘),备份速度足够快(硬盘传输速度比宽带还要高几个数量级)
  "同城异地备份"相比"网盘备份"的缺点是:无法防范某些非常非常小概率的事件(比如:城市遭到强地震、城市遭到核打击)

  另外,对安全性要求较高的同学,建议你采用加密的存储方式(俺个人长期推荐开源的 TrueCrypt 加密工具)。已经在用 TrueCrypt 的同学,可以看俺最近半年写的几篇高级教程(文章列表在"这里")。

◇内容管理/知识管理


  最后再来说说内容管理和知识管理——这才是俺今天想说的重点。
  前几周俺写了一篇《如何完善自己的知识结构》,里面有一节是:如何应对"知识爆炸"?当时俺提了几条经验,包括:
1. 你的大脑只记住核心的知识点,舍弃边缘的知识点
2. 对于边缘的知识点,可以在需要的时候临时去查(比如通过搜索引擎、维基百科、专门的文献检索工具、等等)
  今天再继续补充一下——如何用"内容管理"来应对"知识爆炸"。

  假如你已经有一个比较完善的内容管理系统(以下简称"知识库"),而且是高度个性化的。那么,你可以利用它来帮你存储那些边缘性的知识点,而你的头脑中只记住这些知识点的"线索"。当你需要用到这些知识点的时候,可以根据头脑中的"线索"到你的知识库中查找更具体的信息。

  举个切身的例子:
  去年写《谈谈三年大饥荒[3]:关于"苏联逼债"的谎言》一文,里面有一个章节是"苏联不但没逼债,还主动给援助"。在这个章节中,俺引用了《人民日报》1961年4月10日的一段话。
  其实这段话的原文和发表日期,俺的脑子里根本就记不住(这就是所谓的"边缘知识点")。但是俺曾经看过一篇相关报道,并且保存在知识库里面。所以俺的头脑中有一个模糊的印象,知道有这么一个讲话。到了要写这篇博文的时候,去知识库查一下,就可以查到原文和日期。然后再到 Google 搜,就可以查到很多相关的资料。
  假如没有知识库,俺又记不住标题和正文,要想在 Google 里搜,只能输入几个比较模糊的关键字。这样一来,可能要在搜索结果中翻很多页才能看到自己想要的(无形中就浪费了时间)。

  所以,如果你搭建了一个高度个性化的知识库,它起到的作用犹如你的"第二大脑"。
  为啥俺反复强调"高度个性化"这个定语?对于个人用的知识库,个性化的程度越高,对你本人的价值也越高。道理其实很简单:你的个人的知识库,无论如何都不可能比 Google 缓存的网页更丰富。但是 Google 缓存的网页是面向所有人,而你自己整理的知识库是面向你个人的。所以在"针对性"和"信噪比"两方面,你的个人知识库会远远好于 Google 的搜索结果。

  限于篇幅,关于"内容管理"/"知识管理"就先聊到这里。更多这方面的话题,俺会抽空写一个系列,分享俺的经验。

俺博客上,和本文相关的帖子(需翻墙)
如何完善自己的知识结构
扫盲操作系统虚拟机(系列)
文件备份技巧:组合"虚拟加密盘"和"网盘"
TrueCrypt 使用经验(系列)
如何挖掘网络资源(系列)