80岁还嗖嗖改代码:他是Unix命名人,说解决问题全靠拖

x
xiashang
楼主 (北美华人网)
今天,“Linux三剑客”中一个非常古老的工具突然登上了 GitHub今日热榜:——这竟是因为 80岁的原作者更新了。是的你没听错,有人都80岁了还在改代码!这位大神,就是加拿大计算机科学家—— 布莱恩·柯林汉(Brian Kernighan)。
与比尔盖茨、Java之父、Python之父等大佬齐名的他,开创的“Hello World”范式让每一位学编程的同学刻烟吸肺:不管你学的什么语言,第一个程序就是学会输出它。 printf(“Hello World!\n”); cout << “Hello World!\n”; print “Hello World!” ……
此外,C语言的第一本编程著作,作者之一有他;Unix系统的早期开发人员、AWK (Linux及Unix中的文本数据处理工具)的共同创造者名单中,他也赫然在列。

如今老爷子已经满头白发,还活跃在“一线”——今年5月,AWK的GitHub仓库中,老爷子提交了新的pull request,给AWK添加了一直没法做到的Unicode支持。
对此,网友的态度是这样的:是什么让这位大佬常年保持编程热情的呢?
事情还得从柯林汉的大学时代说起。柯林汉于1942年出生于加拿大,本科就读于多伦多大学工程物理学。他形容这是一个给那些自己也不知道想学什么的人准备的“大杂烩”专业,但很幸运,刚上大一他就对编程开始感兴趣,学起了Fortran语言。当时,计算机的发展还处于初期。他直到大三才见到全校唯一的一台晶体管计算机:IBM 7094。由于太贵 (时值300万美元),学生们并没有机会碰到它。

由此可见彼时工具的稀缺,所以正在学编程的柯林汉也就只是拜读了丹尼尔·麦克拉肯的大作,获得了“颇丰”的理论知识, 实际并没有真正上手写过一行代码
大一暑假,不知道他如何在一家石油公司找了个实习,任务是用COBOL语言给精炼厂开发优化软件。鉴于这个语言他不熟,也没有编程经验,所以最后也没写出个像样的程序来。虽然受了一点小挫折,但他对编程的热情并没有退却,回到学校继续研究。大四毕业后,柯林汉决定继续深造,并拿到了MIT和普林斯顿大学的offer。由于去MIT要7年才能完成博士学业,且每周需做30小时的研究助理工作,而普林斯顿只要3年且提供全额奖学金,再加上柯林汉的好友就在普林斯顿,他毫不犹豫地选了后者。
在普林斯顿大学,柯林汉读的是电子工程专业,因为当时同样还没有专门的计算机系。这完全没妨碍他前进。读博期间,他先是得到了MIT的实习机会,有幸在后来的图灵奖得主费尔南多·科巴托 (Fernando Corbató)门下干活,给一种叫作Multics的分时操作系统项目写代码。转年夏天,他又得到了 贝尔实验室的实习机会,在那里写汇编语言。为了方便在Fortran程序中做列表处理,他还写出了一套函数库,他形容这份工作“十分过瘾”。转眼到了博士毕业,柯林汉被直接留校任教,并在没有进行面试和研究成果展示的情况下,成为了贝尔实验室的正式成员,足以见其优秀。而他和Unix的渊源也就此展开。
我们现在的大部分服务器、手机系统和物联网系统的底层基本都是基于Unix。而三大系统之一的Linux也是一种类Unix系统,可以说,Unix是现代操作系统的源头之一。
说起来比较意外,这么一个重要的操作系统,其初代版本被后来的图灵奖得主Ken Thompson仅花3周的时间就搞定了。当时的Unix还叫UNICS (Uniplexed Information and Computing System),后来被柯林汉改成了现在的名字。Unix中有一个核心工具,叫做AWK,柯林汉就是其发明者之一(名称中的“K”正是代表他)。
AWK作为一种文本处理语言,只做过滤和转换文本行这一件事,却成为Unix/Linux平台上现有功能最强大的数据处理引擎之一。
在Linux系统中,它和grep、sed命令并称为“三剑客”,并占据“老大”席位,掌握了它,处理日常操作可以6到飞起。如今,AWK已经分化出三个版本,依然受到人们的欢迎,诞生45年仍未“退休”。除了AWK,柯林汉还发明了AMPL,一种描述并求解大规模复杂数学问题的建模语言,支持世界上大部分的求解器。还有编译器Ratfor、文档编制预处理器Pic、Grap和数学排版语言Eqn等这些重要研究成果背后都有他的身影。除了写代码,柯林汉还很爱写书,且诞生了不少经典之作。
比如你想了解Unix的历史,就可以看《Unix传奇》,作为参与者和见证人之一,他写的这本书可以让没有足够专业技术背景的人也能欣赏Unix的思想。而文章开头所说的“Hello World”范式,则是出自于他与C语言之父丹尼斯·里奇 (Dennis Ritchie)合写的开山之作《C程序设计语言》。
再比如柯林汉的第一本著作《The Elements of Programming Style》 (《编程格调》),则留下了一个以他名字命名的定律—— 柯林汉定律,即:调试一段代码的难度是编写它们的两倍。按照这个定义,如果你的代码写得非常巧妙,那你可能没有足够的能力来调试它。(相比于复杂代码,简单的代码更可取。因为调试复杂代码的过程中,任何问题都会十分棘手,甚至无法解决。)
那么,柯林汉本身是个什么性格的人呢?2021年他接受《程序员》采访时,曾被问了这么一个问题:肯(Ken)用3周创造了Unix,道格 (Doug)在几天内就提出了“管道 (pipe)”的想法,你们工作效率这么高,有什么诀窍吗?(以上两人都是他在贝尔实验室的同事) 对此,柯林汉连连摆手:他们是“别人家的程序员”,我可从没这么高效过!
老爷子说了,遇到新问题,他的解决方案通常简单粗暴,那就是 尽可能地拖延,以及祈祷问题消失,或者祈祷问题自己解决自己。这个玄学办法本身是不能解决问题的,但这样做,柯林汉有足够时间消化问题,然后想出对策。而且,他其实会选择直接动手搞定问题。
今年1月1日,柯林汉刚好过80岁生日。上个月,油管频道Computerphile对他进行了采访,大伙儿才知道,老爷子 还在改代码!柯林汉说,没有任何一种计算机语言或工具是万能的,AWK也不例外。此前,AWK只适用于ASCII或8位输入,不能处理Unicode (统一码)。 几个月前,柯林汉花了点时间,折腾了一下AWK——他称它是“一个非常古老的程序”——现在AWK可以 处理UTF-8输入和输出了。现在,用户已经能用正则表达式提取日语字符以及类似的东西。视频中柯林汉还顺口提了一嘴,他修补了一些“又快又脏”的东西,让AWK可以处理CSV文件。
整个采访过程,老爷子依然健谈,精神面貌也不赖。话说回来,精力充沛的他,对几十岁的“古老程序”改改改,还有啥原因呢?柯林汉的回答是这样的:今天的计算环境,和三、四十年前非常不同,内存量也大大扩充了,“这会改变你对AWK的思考方式,尤其是AWK运行不起来的部分”。所以,老爷子一直偷偷在后台玩儿新版本的AWK,目的是尽可能做拓展,让AWK 更容易实践和使用。
这其实是柯林汉一以贯之的行事准则,此前,他就在播客CoRecursive中表示过:如果做些能对自己有帮助,又对他人工作有所改善的事,何乐而不为呢?有意思的是,世界上没有万能工具,也没有万能通才。老爷子自己就承认说,他的bug是 还没完全搞懂Git怎么用。所以他只能通过电子邮件,把更改发送给当前的维护人员。
80岁高龄还要修改几十年前写下的代码,这位程序员届卷王的故事再次引起了网友关注。自面世起,AWK就广受欢迎。看到AWK在今天依然能得到完善,变得更强,不少人对老爷子的敲代码热情表示respect。有的网友表示了对老爷子的感激。还有人觉得,为改善程序员写代码的环境不断付出,是一件很鼓舞人心的事情。当然少不了玩梗的人。
Hacker永不退休!

最后,让我们回到“Hello, world”。这句“万物开头”其实最早是在柯林汉1974年撰写的《Programming in C: A Tutorial》中首次出现,后来才被合写进那本经典之作。 该书中两位作者形成的写代码风格,也被称为 K&R风格(K&R即指柯林汉Kernighan和里奇Ritchie)。有意思的是,柯林汉表示这本书是自己强行拉着丹尼斯写的。至于为什么选择用“Hello, world”而不是别的,柯林汉自己都记不清了。在接受福布斯杂志访谈时,他模模糊糊回忆:可能是因为看了个动画片,里面有一个鸡蛋和一只小鸡,小鸡说了句:Hello,World!

c
claireliu
awk偶尔用用。