程序员,找工作前读一读《CSAPP》

《CSAPP》全称《Computer Systems A Programmer’s perspective》,国内通常的书名翻译是《深入理解计算机系统》,然而有人认为这本书叫做《程序员所需要了解的计算机知识》更为合适。因为本书非常巧妙的把程序设计及优化、数字电路基础、指令集体系、汇编语言、存储器体系结构、链接与装载、进程、虚存这一摊来自各不同的学科的核心知识点糅合在一起,并以程序员的视角呈现。它能让程序员对平时用到的计算机核心知识拥有一个全局观,所以有人说,找到满意的工作,这本书功不可没。

具体来看看,作为一个程序员,如果想从事底层开发或在Linux平台下开发,究竟要对硬件掌握到什么程度,硬件之外的东西,又有哪些需要掌握呢?以下内容摘自 madongfly 读书标记 及部分yasker 评论

引子

在我刚刚进入中科院计算所读研的时候,同宿舍的师兄便向我推荐了一本《深入理解计算机系统》,这本书从一个程序员的视角详细剖析了整个计算机系统,涵盖了组成原理、汇编语言、体系结构、操作系统、网络等计算机基础知识。
由于时间所限,我并没有立刻阅读,而是将其列入了找工作前的复习书单。2010年8月,我用了一个月的时间读完了这本书的原版《Computer System:A programmer’s perspective》。后来的事实证明,读完这本书对我找工作的历程帮助很大。

正文

在阅读的过程中,我对该书的各个章节做了一些标注,以备将来重新翻阅的时候参考。这些标注主要从两个角度进行,一是对我找工作应试(包括笔试和面试)有没有用,二是对我自身的技术提高有没有用,所以分为应试和修炼两个指标,参照流行的打分标准将其分为从★到★★★★★五个等级。
在找工作顺利结束之后,我又回顾了一下之前的标注,结合自己的笔试、面试经历,重新修订了一下。其中应试指标的评分主要是以我的求职目标(互联网行业偏算法的软件工程师)为参照,和其他职位的要求会有些出入。

第一章 计算机系统漫游 A Tour of Computer System
本章对计算机系统做了一个总体的介绍,用简单明了的语言概括了一些后续章节将要重点展开的概念。
应试 ★★:在笔试中可能会碰到一些整体上的概念题。
修炼 ★:属于计算机最基本的概念。

第二章 信息的表示和处理 Representing and Manipulating Information
本章介绍了信息在计算机中的表示形式,重点讲述整数和浮点数的表示形式。
应试 ★:应试中很少会考到。
修炼 ★★★:有很多人可能写了多年的代码都不知道浮点数是如何用那4(8)个字节存储的,不知道其实表达式(x-y<0)并不能替代(x<y)。

第三章 程序的机器级表示 Machine-Level Representation of Program
本章其实就是汇编语言课程的复习。也是全书的精华之一。剖析编译器产生的汇编代码,以此来加深对具体代码实现的理解。大量的习题都是根据汇编来猜源程序是什么,有趣极了。这一章还覆盖了缓冲区攻击——但是这点讲得太少了,不解渴。
应试:重要程度依赖于求职目标,如果是和我一样偏算法的工程师,汇编语言是不会考到的。
修炼 ★★★★★:理解汇编语言和寄存器结构是后面很多内容的基础。

第四章 处理器体系结构 Processor Architecture
本章其实就是计算机体系结构课程的内容。主要介绍的内容有处理器结构,各种逻辑门、功能单元,指令集;指令的执行,指令执行的流水线等。
应试 ★: 对于软件相关职位来说,很少会考到这么底层的东西的。
修炼 ★★★: 对于从事软件层面的技术人员来说,不用深入,但是也应该理解,知道是怎么回事。

第五章 优化程序性能 Optimizing Program Performance
本章讲述如何优化程序的执行效率,包括代码的优化,编译器的优化,以及CPU级别的优化。是全书最闪光的章节。作者对一个例子不断优化,讲循环效率和过程调用,到讲存储器引用,一直讲到现代处理器的结构,讲到IA32处理器的局限,一路下来,畅快淋漓。
5.1-5.6节 主要介绍了几种能有效提高代码性能的方法。
应试 ★★★★: 经常会有一些让你寻找程序瑕疵的问题,如果你能看出代码在哪些细节上可以优化,必定能加分不少。
修炼 ★★★★★: 你当然需要知道编译器在什么层面上能自动帮你优化代码,在编译器无法优化时你自己又如何在小细节上进行优化。
5.7节以后 主要介绍了CPU级别的优化,微指令的概念,功能单元上微指令的并行,程序分支的预测等。
应试 ★: 对于软件相关职位来说,基本不会考这些东西的。
修炼 ★★★: 不用深入,但是应该知道并能够理解。

第六章 存储器层次结构 The Memory Hierarchy
本章详细介绍了计算机系统中的存储结构。实际上可以看作是“优化程序性能”一章的延伸,以及为之后的“虚拟存储器”做铺垫。

6.1 介绍了不同种类的存储设备以及对应的存取数据的方式。
应试和修炼 ★: 很少会考到,了解一下即可。
6.2-6.7 介绍了存储设备的组织形式,着重介绍了Cache及其工作方式,程序是如何和cache打交道的,不同的循环嵌套顺序、遍历方向等对cache命中的影响。
应试 ★★★★: 在面试中,经常会考到跟cache相关的题目;修改循环嵌套顺序以提高cache命中率也是一些程序改错题的高级玩法。
修炼 ★★★★: 存储结构和cache是计算机中很基础也很重要的概念。

第七章 链接 Linking
顾名思义,本章详细讲解了程序的链接过程,主要分为静态链接和动态链接,以及链接过程中使用到的技术如符号解析、重定位等。
应试 ★★:知道一些基本概念即可。
修炼 ★★★★★:一个软件工程师应该懂得自己写出来的程序是怎么成为一个可执行文件的,有的时候,你很可能会被一个链接错误折磨好几天。

第八章 异常控制流 Exceptional Control Flow
顾名思义,本章主要讲解异常控制,不过这里的“异常”并不是Java或者C++里狭义的异常,而是一个广义的“Exceptions”的概念,包括中断(Interrupt),陷阱(Trap),错误(Falut),中止(Abort)等。本章同时引入了进程的概念,介绍了进程级别的 Exception:信号(signal)以及操作系统处理这个异常的手段–上下文切换(context switch)。
应试 ★★: 主要掌握进程的概念即可。
修炼 ★★★: 知道异常控制流是怎么回事,用户程序和系统交互(如系统调用)的原理和方式即可,不用太深入。

第九章 虚拟存储器 Virtual Memory
非常重要的一章,虚拟存储机制是计算机实现多任务的一项重要技术。计算机正是通过时间片技术使得每个进程在执行时仿佛独占CPU,进而又通过虚拟存储机制使得每一个进程在执行时仿佛独占内存。
10.1介绍了虚拟地址和物理地址,CPU进行寻址操作产生的是虚拟地址,通过存储管理单元(memory management unit)转换为实际的物理内存地址。
10.3~10.5讲述了虚拟存储机制的优点:使得内存可以作为硬盘的cache;能够更方便的管理内存;能更好的提供内存保护机制。
10.6 介绍了虚拟地址如何转换为物理地址。
10.7 很精彩的一节,通过Intel Pentium和Linux的实例讲述了整个存储管理机制。记得以前上操作系统课的时候,各种理论、机制学了一大堆,但就是不知道实际的操作系统到底用的哪套方法,而本节内容正是通过实例让你对刚学的理论机制有一个直观的了解。
10.8~10.10 讲述了存储映射(Memory Mapping)、动态内存分配和垃圾回收机制。
10.11 很实用的一节,列举了一些C编程中容易犯的内存引用错误。
应试 ★★★★★: 本章内容是操作系统课程的重点内容,如果考操作系统,几乎肯定会考到;10.11节的知识也能帮你应对一些程序挑错题。
修炼 ★★★★★: 操作系统中重要的基础内容,即使你只使用Java这样的高级编程语言,至少也应该弄懂垃圾回收机制吧。

第十章 系统级I/O System-Level I/O
介绍类Unix系统下的I/O读写,主要介绍系统层面的I/O接口。由于我们日常编程所用的I/O接口都是各种高级语言提供的经过封装的标准接口,故而如果不进行底层开发的话这部分知识不是必须的,我便跳过没读。

第十一章 网络编程 Network Progranmming
本章简单介绍了网络模型,TCP/IP协议,类Unix系统的socket接口等。
应试和修炼 ★★: 因为篇幅限制,本章只做了简单讲解,要掌握网络编程知识还需要参考专门的网络技术书籍。

第十二章 并发编程 Concurrent Programming
本章简单介绍了并发程序设计的内容,主要包括:
1.进程级别的并发,各子进程拥有不同的虚拟地址空间,需要IPC(InterProcess Communication)机制共享数据,切换开销大。
2.I/O复用,事件驱动,单进程运行,共享虚拟地址空间,并发效果不理想。
3.线程,介于上述两种中间,各子线程共享进程的虚拟地址空间,切换开销较小。
另外介绍了并发编程中访问共享变量的信号量机制,并给出了4类容易引起线程不安全的函数。
应试 ★★: 除应聘相关职位外,并发编程考的比较少,不过需要清楚锁机制和信号量机制等。
修炼 ★★★: 多线程程序在现今的开发中还是很常见的,但是本章介绍的比较简单,需要参考另外专门的书籍。

小结

总的来说,我觉得这本书很适合在找工作之前读一读,因为从网上流传的各种笔试和面试题中,我们就能看出各大IT公司在招聘工程师的时候是很看重基础知识的,而对于像我这样上了三年研究生的同学来说,很多知识由于长时间没用早就忘了,所以需再要再复习一下。但是我们可能没有时间按照课程一门一门地去复习,即使一门一门去看了,也不一定能把知识都联系起来,而这本书正好提供了这样一个视角,从程序员的角度把计算机专业最重要的基础知识都串了起来,形成了一个完整的计算机系统的概念。

相关资源

中文版豆瓣点评

中文电子书免费下载

英文版豆瓣点评

目录