OSTEP – JciX ~

OSTEP笔记3–持久化存储

February 24, 2018 by JayceeZ·0 Comments

大部分截图来自原书，贴出书的官方主页：《Operating Systems: Three Easy Pieces》 (作者Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau)。感谢原作者这么好的书。本篇笔记是书的第三部分(Persistence)，讲述了操作系统和外存系统相关的内容。第一节 I/O Device 1.1 IO 总线一般情况下， IO设备的性能较差(慢)，所以用Peripheral IO Bus，为什么不用像显卡一样用的PCI呢？因为1)越快的总线越短，这样空间不够插；2)越快的总线制作成本越高，如果存储设备照总线的性能差的远，没必要用高性能总线。这张图为总线的层次结构，memory bus是最快的也是最近的，IO Bus比较远，也是最慢的，中间有用于显卡的PCI等总线。 1.2 典型设备的组成部分一个典型的外围设备如图所示，包括两部分：接口和内部结构。接口：类似软件接口的功能，硬件接口是留给OS和设备交互的。内部结构：比如㓟CPU、MEM等基本组件，还有称为固件(firmware)的软件来实现内部功能。 1.3 两种IO模式(Polling和Interrupt) Polling的形式，而interrupt。一种典型的协议是 Polling (轮询)，称为programmed IO，步骤有4: 循环等待STATUS寄存器直到设备状态为不busy 写数据到DATA寄存器写命令到COMMAND寄存器循环等待STATUS直到设备为不busy Polling显著的缺点就是太浪费CPU时间，这是因为IO相对于CPU是很慢的，大量的CPU时间被用在了等待上。 Interrupt (中断)方法（也称为interrupt-handling IO）可以解决这个问题，用Interrupt方法进行IO时，当设备完成操作时，会raise一个硬件interrupt。但是这样的话，如果设备很快(比如现在的NVMe SSD设备)，Interrupt由于需要进程上下文的切换、以及中断的控制等原因，会拖慢IO的速度。所以两种方法各有利弊： Polling […]

OSTEP笔记2–内存虚拟化

February 24, 2018 by JayceeZ·0 Comments

大部分截图来自原书，贴出书的官方主页：《Operating Systems: Three Easy Pieces》 (作者Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau)。感谢原作者这么好的书。本篇笔记是书的第一部分(Virtualization)的下半部分，讲述了操作系统是怎么通过地址空间的抽象，将内存资源进行虚拟化的。第一节地址空间 1.1 内存虚拟化多进程OS的资源共享策略本书上半部分讲了CPU的共享策略：通过进程(process)这个抽象，OS将时间片分给进程。对于内存资源的共享：为了让昂贵的计算机能够支持多个程序同时运行，如果在切换某个进程时将内存数据从磁盘换入（进程共享磁盘，内存和寄存器都不共享），由于磁盘IO太慢，不现实。所以现在的系统，都是将相对较快的寄存器换入换出，所有进程数据共享内存资源（寄存器不共享，内存共享）。为了实现这种想法，并更好地管理内存，地址空间(Address Space) 的抽象被引入（如下图），相对为每个程序固定分配一定大小的内存空间更灵活，用地址空间进行管理更加灵活。地址空间在结构上主要分为Code、Heap和Stack，Code部分用来存程序运行的代码，Heap是用户程序动态分配内存(malloc/free)所使用空间，Stack是变量使用的空间。除非程序递归很多，一般Stack都是够用的；如果程序视图访问非法地址，可能出现Segmentation fault的错误。每个进程都会有一个自己地址空间，且每个进程都认为自己的地址空间是从0开始的，并且地址空间的地址也不必和物理地址相等，甚至地址空间的总大小可以大于物理内存大小，这就体现了一种内存虚拟化的概念，OS的内存管理系统也可以称为虚拟内存系统(virtual memory system, VM) 。因此，我们编写的程序中，所有我们可以得到的地址也都是虚拟地址，并非物理地址。 VM系统设计的三个目标：透明(transparency)、高效(efficency) 和保护(protection) 。其中保护即隔离(isolation)，进程间的地址空间需要隔离，进程和OS间也需要隔离，（甚至在有些微内核操作系统中，OS的一部分和OS的另一部分也进行了隔离），这样可以保证安全性。 1.2. memory API 对于用户程序，Stack中的变量是自动管理的，比如用int声明一个整数变量，而Heap中的内存是由程序（程序员）负责的，什么时候malloc/free都要程序员进行考虑，所以要格外小心一些常见的malloc错误，比如忘记分配内存、分配的不够导致buffer overflow、忘记初始化所分配内存内容、忘记free等。 purify 和 valgrind 这两个工具可以协助检测内存分配的问题。 1.3. malloc、free和mmap的关系** 要注意 […]

OSTEP笔记1–CPU虚拟化

February 24, 2018 by JayceeZ·0 Comments

截图来自原书，贴出书的官方主页：《Operating Systems: Three Easy Pieces》 (作者Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau)。感谢原作者这么好的书。本篇笔记是书的第一部分(Virtualization)的上半部分，讲述了操作系统是怎么通过进程的抽象，将CPU计算资源进行虚拟化的。第一节进程的抽象 1.1. 策略和机制 Policy在mechanism（策略和机制）在操作系统中通常是分开设计的。比如如何切换上下文是一个low-level的mechanism，指底层的方法或者协议。当前时刻应该让哪个进程运行更好是一个high-level的policy的问题，指一些“智能”的调度。 1.2. 虚拟化和OS OS本身就可以看做是“虚拟机”(virtual machine)。系统通过在可以被接受的合理开销（时间、空间）范围内，将计算机CPU、内存、存储等资源进行虚拟化（抽象），目的是为了用户的方便使用。 CPU虚拟化主要体现在将任务抽象为进程(process) ，将资源按进程隔离，然后多个进程轮转使用计算资源；内存虚拟化主要体现在虚拟地址空间(virtual address space 或 adress space) ；而对于持久化的存储，OS让文件共享，没有那么多私有隔离，OS假定用户会用文件来共享数据。 (？？？？) 第二节进程API 2.1. fork和exec exec()函数组和fork()的区别是：fork()复制当前进程为一个子进程执行，exec()会执行一个新的程序；exec()执行以后就再也不会返回。 2.2. shell和stdout redirect 例如shell就是一个普通的用户程序，利用了fork和exec的组合。给出一个提示符，你输入可执行程序时，会先fork()，然后在fork出的子进程中exec()这个命令，然后调用wait()来结束。这种fork和exec的组合使用，可以在让shell在fork后运行一些其他代码：fork后的子进程可以redirect操作再exec；fork后的父进程可以执行wait操作在exec结束后再显示提示符prompt。 stdout redirect的原理很简单，stdout一般的fd都是0，在fork后的子进程中close掉stdout，然后打开要redirect到的文件，这个文件就会获得为0的fd，这时执行新命令的exec，则会把这个为0的文件看做stdout进行输出，程序清单如下图： 2.3. 其他 kill()可以向进程发送信号，让程序sleep, die。第三节 […]

JciX ~

Jc's Blog

Tag: OSTEP

OSTEP笔记3–持久化存储

OSTEP笔记2–内存虚拟化

OSTEP笔记1–CPU虚拟化