msgbartop
ChemHack.com中文版
msgbarbottom

20 四 11 十年学会编程【转】

注:这不是一篇原创作品,英文原文来自http://www.norvig.com/21-days.html。本文来自未知译者的中文翻译版

为何人人都这么着急?

信步走进任何一家书店,你会看到名为《如何在7天内学会Java》的书,还有各 种各样类似的书: 在几天内或几小时内学会Visual Basic, Windows, Internet等等,一眼望不到 尽头。我在Amazon 上做了如下的 强力检索

     pubdate: after 1992 and title: days and       (title: learn or title: teach yourself)

得到了248个结果。前78个都是计算机类书籍(第79个是 Learn Bengali in 30 days)。我用"hours"替换"days",得到了类似的结果: 更多的253书。前77本是计算机类书籍,第78本是 Teach Yourself Grammar and Style in 24 Hours。在前200本书中,有96% 是 计算机类书籍。

结论是:要么人们都在急急忙忙地学习计算机,要么计算机比其它任何东西都 容易学。没有书籍教你在几天内学会古典音乐、量子物理,或者是养狗。

让我们分析一下,象一本名为《三天内学会Pascal》的书意味着什么:

  • 学习: 在三天里,你没有时间写一些重大的程序,并从成功或失败中 得益。你没有时间与有经验的程序员合作,并理解在那样的环境下工作是怎么回 事。一句话,你不会有时间学到太多东西。因此他们只能谈论一些肤浅的东西,而 不是深入的理解。正如亚力山大教皇所说,浅尝辄止是危险的事情。
  • Pascal: 在三天时间里,你可能学会Pascal的语法(如果你 已经学过类似的语言),但你学不到更多的如何使用这些语法的知识。也就是说, 假如你曾是个BASIC程序员,你可以学着用Pascal语法写出BASIC风格的程序,但你不 可能了解Pascal真正的好处(和坏处)。那么关键是什么? Alan Perlis 说过:“一种不改变你编程的思维方式的语言,不值得去学。” 一种可 能的情况是:你必须学一点儿Pascal(或可能性更大的象Visual Basic 或 JavaScript之类),因为你为了完成某种特定的任务,需要与一个现存的工具建立 接口。不过那不是学习如何编程,而是在学习如何完成那个任务。
  • 三天内: 很不幸,这不够,原因由下一节告诉我们。

在十年里学会编程

研究表明 (HayesBloom)在 任何一种领域内,象下棋、作曲、绘画、钢琴演奏、游泳、网球、以及原子物理学和拓 扑学,等等,要达到专家水平大约都要化十年时间。没有真正的捷径:即使是莫扎 特,4岁时就是音乐神童,13年后才开始写出世界级的作品。在另一方面,披头 士似乎在1964年的Ed Sullivan表演上一炮走红。但他们从1957年就开始表演,在 获得大众青睐后,他们的第一个重大成功,Sgt. Peppers,是1967年发 行的。Samuel Johnson (塞缪尔·约翰逊,英国辞典编纂家及作家)认为要花比十年更长的时间:“在任何领域中出类拔萃都 要用毕生的劳作来取得;它不可能用较低的代价获得。” 而Chaucer(乔叟,英 国诗人)感叹到:“人生短暂,学海无涯。”

这是我为编程成功开出的方子:

  • 设法对编程感兴趣,并且因为它有趣而编一些程序。确保编程一直充满足够 乐趣,这样你才愿意投入十年宝贵时间。
  • 与其他程序员交流; 阅读其它程序。这比任何书本或训练课程都 重要。
  • 写程序。 最好的学习方式是 从实 践中学习。 用更技术性的话说,“在一个给定的领域内,个人的最大能力不 是自动地由扩展了的经验取得的,但即使是高度有经验的人也可以通过有意识的 努力来提高自己的能力” (p. 366) 和 “最有效的学习需要因人而异的适当难度,目标明确的任务,丰富的信息反 馈,以及重复的机会和错误修正。” (p. 20-21) 此书 Cognition in Practice: Mind,Mathematics,and Culture in Everyday Life 是阐明此观点的令人感兴趣的参考文献。
  • 如果愿意,在大学里呆上4年或更长(在研究生院里)。你会接触到 一些需要学历证明的工作,你会对此领域有更深的理解。如果你不喜欢学校, 你可以(通过一 些贡献)在工作中获得相似的经验。在任何情况下,光啃书本是不够的。Eric Raymond,The New Hacker’s Dictionary一书的作者,说过,“计算机科学不能把任何人变成编程 专家,就象光研究刷子和颜料不会使人变成画家一样。” 我雇佣过的最好的程序员 之一仅有高中程度;他做出了许多优秀的 软件,有他自己的新闻组, 而且通过股票期权,他无疑比我富有的多。
  • 和其他程序员一起做项目。在其中的一些项目中作为最好的程序 员; 而在另一些项目中是最差的。当你是最好的,你能测试领导项目的能力,用你 的观点激发别人。当你是最差的,你学习杰出者是怎么做的,了解他们不喜欢做 什么(因为他们吩咐你做事)。
  • 在其他程序员 之后接手项目。使自己理解别人写的程序。 当程序的原作者不在的时候,研究什么需要理解并且修改它。思考如何设计你的 程序以便后来者的维护。
  • 学习至少半打的编程语言。包括一种支持类抽象的语言(象Java 或C++),一种支持函数化抽象的语言(象Lisp或ML),一种支持语法抽象的语 言(象 Lisp),一种支持声明规格说明的语言(象Prolog或C++ 的模板),一种支持 共行程序(coroutine)的语言(象Icon或Scheme),一种支持并行的语言(象Sisal)。
  • 请记住“计算机科学”中有“计算机”一词。了解你的计算机要花多 长时间执行一条指令,从内存中取一个字(有cache),从磁盘中读取连续的字, 和在磁盘中找到新的位置。(答案
  • 参与一种语言标准化的工作。它可以是ANSI C++委员会, 也可以是决定你周围小范围内的编程风格是应该两个还是四个空格缩进。通 过任何一种方式,你了解到其他人在某种语言中的想法,他们的理解深度,甚至一 些他们这样想的原因。
  • 找到适当的理由尽快地从语言标准化的努力中脱身。

明白了这些,仅从书本中你能得到多少就成了一个问题。在我第一个孩子出生前, 我读了所有的(关于育儿的)How to 书籍,仍然感觉是个手足无措的新手。30个月以后,我 的第二个孩子快要出生了,我回头温习这些书了吗? 没有。相反,我依靠我的个人 经验,它比专家写的数千页书更有用和可靠。

Fred Brooks在他的随笔 《没有银弹》 中定出了一个寻找优秀软件设计者的三步计划:

  1. 尽可能早地,有系统地识别顶级的设计人员。
  2. 为设计人员指派一位职业导师,负责他们技术方面的成长,仔细地为他们规划 职业生涯。
  3. 为成长中的设计人员提供相互交流和学习的机会。

此计划假设某些人已经具备了杰出设计者的必要才能; 要做的只是如何恰当地诱 导他们。 Alan Perlis 说得更简明扼要:“每个人都能被教会雕刻:对米开朗其罗而言, 反倒是告诉他哪些事不要做。同样的道理也适用于优秀的程序员。”

所以尽管买那本Java的书吧。你可能会从中学到点儿东西。但作为一个程序员,你不会在 几天内或24小时内,哪怕是几个月内改变你的人生,或你实际的水平。

参考文献

Bloom, Benjamin (ed.) Developing Talent in Young People, Ballantine, 1985.

Brooks, Fred, No Silver Bullets, IEEE Computer, vol. 20, no. 4, 1987, p. 10-19.

Hayes, John R., Complete Problem Solver Lawrence Erlbaum, 1989.

Lave, Jean, Cognition in Practice: Mind, Mathematics, and Culture in Everyday Life, Cambridge University Press, 1988.

答案

2001年夏天典型的1GHz PC的各种操作要花的时间

执行一条指令

1 nsec = (1/1,000,000,000) sec

从L1 cache memory 中取一个字

2 nsec

从内存中取一个字

10 nsec

从磁盘的连续位置取一个字

200 nsec

从磁盘的新位置取一个字(seek)

8,000,000nsec = 8msec

附录:语言的选择

不少人问我,他们首先该学哪种编程语言。没有绝对的答案,不过请考虑以下几 点:

  • 用你的朋友的。当被问起“我该用哪种操作系统,Windows,Unix, 还是Mac?”,我总是回答:“你朋友用什么,你就用什么。” 你从朋友那能学 到知识,这种优势可以抵销不同操作系统或语言之间本质的差异。也考虑你将来 的朋友:程序员社区 — 你将成为它的一部分如果你继续往前走的话。你选择的 语言是否有一个成长中的社区,还是人数不多、即将消亡? 有没有书籍、网站、 在线论坛回答你的问题? 你喜欢论坛里的那些人吗?
  • Keep it simple, stupid. 象C++和Java这样的语言是为经验丰富的 程序员组成的团队进行专业开发而设计的,他们专注于代码运行时的效率。因此, 这些语言有些部分非常复杂。 而你关注的是如何编程,不需要那些复杂性。你 需要的是这样的语言: 对单个的编程新手来说,它易学易记。
  • 练习。你偏爱哪种学弹钢琴的方式:通常的交互式的方式,你一 按下琴键就能听到音符;还是“批量”模式,你只有弹完整首曲子才能听到音符? 显然,用交互模式学习弹钢琴更容易些,编程也一样。坚持用交互模式学习并使 用一种语言。

有了上面的准则,我推荐的第一个编程语言是PythonScheme。因人而异,还有其它 好的选择。如果你的年纪是10岁以下,你可能更喜欢Alice。关键是你要选择并开始实践。

附录:书籍和其它资源

不少人问我,他们该从什么书籍或网页开始学起。我重申“仅从书本里学习是不 够的。” 但我还是推荐:


脚注

This page also available in Japanese translation thanks to Yasushi Murakawa, in Spanish translation thanks to Carlos Rueda and in German translation thanks to Stefan Ram.

T. Capey points out that the Complete Problem Solver page on Amazon now has the "Teach Yourself Bengali in 21 days" and "Teach Yourself Grammar and Style" books under the "Customers who shopped for this item also shopped for these items" section. I guess that a large portion of the people who look at that book are coming from this page.


Peter Norvig(Copyright 2001)

18 四 11 语言即抽象,抽象即思想

今天哈欠@heqian说:“IT领域几大炸药桶:语言优劣、敏捷、企业级、山寨…”。跟人在推上掐了一会,掐的内容很没营养,C++有没有用。这哥们说的好像很有道理:

iceboundrock @chemhack 为啥说C++在计算机科学领域无法取代呢?要论绝对的执行效率,基本是C和汇编的天下。要说用OOP描述数据结构和算法,C#或者Java又去掉了很多繁冗的内存管理细节

iceboundrock @chemhack 这么精细的东西还是用C或者汇编好了,谁知道C++内部的对象模型给整出什么莫名的东东。如果是几十T数据,占几G内存,我觉得反而简单了,反正不是单机能搞定的,干脆用简单点的语言搞map reduce呗。twitter的搜索不也用java搞了么。

推上已经掐过了,这就不掐了。让我觉得有意思的事情不是语言的优劣,而是语言怎样影响人的思维方式。这里咱说的是编程语言,说不定自然语言也有一样的影响。跟我掐架的哥们应该是个Java/.Net控。同作为一个Java重度用户,我特别能理解的想法,巴不得全世界的代码都是Java的,就好象在美帝的片子里面哪怕外星人都讲英语一样。

像Java/C#这种高级语言,隐藏了很多细节。你不用知道内存是怎么分配的,不用关心什么时候释放内存,垃圾处理器会在你不需要的时候自动埋了它。这些细节让你安逸,可以集中精力在你需要解决的问题上。就常用的PC/服务器上跑的JVM来说,大家对性能不是很在乎。相比Java代码的执行时间而言,更长的时间往往浪费在网络、文件系统、数据库这些外部操作上。所以你也不会去想Java编译器把它编译成了什么样的字节码,Java虚拟机又是怎样执行了直接字节码,CPU用了几个cycle执行完成等等。如果做Web程序,输入是URL/表单,输出是HTML/CSS/JS,一个简单的系统。你会考虑选那个数据库、SQL怎么构造、怎么做缓存等等。你根本不会去考虑底层的优化技巧,因为即使在3年前的CPU上跑起来也毫无压力。

机器的执行细节完全就是另一个世界的东西,因为有人发明了Java,有人为所有主流平台开发了虚拟机,有人写了Web框架,有人制定了SQL标准。这就是抽象的力量,给你思考的平台。自动档的汽车拯救了多少女司机?差不多和Java程序员一样多吧。

接着说说汇编语言。从本质上来说,称之为“指令”恐怕要比“语言”更恰当些。只是汇编语言用了写类似英语单词的指令词,让它看起来像语言而已。现在已经很少有人用汇编写复杂的程序了。汇编快不快?快?不快?也许快。如果你是全知全能的上帝,你写出的程序也许会比再编译成C程序快。但是没有上帝,那么这个问题就变成了“是你聪明还是编译器聪明?”。大多数人没有编译器聪明,但是会耍一些在C/C++程序里嵌入一些汇编代码之类的小聪明。拿汇编语言写一个facebook如何?你不是人,你是编译器。

如同害怕排档杆和离合器的女司机一样,有人天生害怕指针、害怕内存管理。虽然你玩不转,但是总有人玩的转。

15 四 11 德国买菜记

这个其实没啥好记的,图都没有。昨天与一行人去了德国一趟买菜,一个传说中Waldshut的地方,从苏黎世火车一个小时,晚上七点后使用半价卡(135CHF/年)+Gleis 7卡(99CHF/年)坐SBB的S线过去是不要钱的。超市开门到晚上10点,在苏村呆长了觉得德国的物价真便宜啊真便宜,旁边某个广东餐馆吃了个叉烧饭,6欧元,不是一般的和谐。

然后就没了,微博。

14 四 11 生物信息学(Bioinformatics)?啥意思?

 

Paulien Hogeweg刚刚发了一篇Paper《The Roots of Bioinformatics in Theoretical Biology》,这个波大妈是是最早提出了Bioinformatics这个词的人之一,其实这个词的意思距离当时她所定义的有不少差别。

摘要中说:

从80年代末期开始,生物信息学(Bioinformatics)这个词就用来指代基因数据对比分析的计算方法。但是,这个词的本意更广泛一些,指的是生物系统中的信息处理。在这篇论文中,我会从我的个人视角回顾历史,并说明生物信息学一词的本义正在回归。

论文基本都在回顾光荣革命发家史,简单易懂,干脆就一天翻译一点,随便看看罢。。。

——————-以下是波大妈的论文————————-

70年代初期,我和Ben Hesper就开始使用生物信息学(Bioinformatics)一词来指代我们想要研究的东西。当时我们把它定义为“对生物系统中信息处理的研究”。虽然很多公开资源都把这个词的本源指向我们俩1978年时的论文,但是实际上早在1970年,在一篇不是那么公开的荷兰语论文中,我们提出了上述的定义。

对我们来说,生命的典型属性之一就是其多种形式的信息处理,比如进化过程中的信息积累,从DNA到细胞内/细胞间过程的信息传输,以及其中多个层面的信息翻译。起码来说,我们认为信息处理可以作为理解生命系统的一个有用比喻。因此,我们觉得把生物信息学和生物物理与生物化学分开来,作为一个单独的研究方向,也是有用的。

确实,在分子生物学诞生之初,它就被公认为生命系统如何收集、处理、储存、使用信息的中心研究问题。举例来说,正如术语“基因编码”中所反映的一样,信息相关概念的焦点正是信息单向流动的基本概念。一本名为《From Deoxyribonucleic Acid to Protein: Transfer of Genetic Information(从DNA到蛋白质,基因信息的传递)》的专著总结了“序列时代”到来前分子生物学的发展水平。这本书让我明白了,在当时本科遗传学课本中,这一重要过程本淹没在了“bead genetics”(球遗传学?经典遗传学??串珠遗传学理论)中。

——————-以上是波大妈的论文————————-

这个bead genetics,我猜指的是孟德尔那一套经典遗传学,因为都用画球来表示,Google了半天也没有查到啥意思,几乎没有别人用过这个词。球指点。

(以下省略n字,n>很多,上课去了,回头继续。。。)

Tags: