Tag: 操作系统

关于通用和专用系统的一些思考

June 28, 2018 by JayceeZ·0 Comments

日记式的个人胡扯，没有一句话保证正确，谢谢围观，欢迎指正。。通用与专用，没有好坏首先举两个极端的例子：深度学习应用十分重要，因此人们愿意专门为它花钱设计新型专用芯片和硬件架构，甚至可能为了它的性能，没准以后会重新写了一个叫”DnnOS”（我自己瞎编的名字）操作系统；而Jc写的helloworld.py程序无论在Linux, Windows 95还是Win 10上怎么折腾，都是打印一行hello, world，没有任何区别的。哪个更好的问题没有绝对的答案，也许深度学习的新型硬件没有键盘鼠标和显示器，DnnOS也只要实现一套新型硬件的驱动，复杂程度远远小于Linux和Windows。但是Jc的helloworld.py无论运行在多么复杂的系统上，都无法到一个好的深度学习模型所带来的价值；反过来说，即使这套新型深度学习工具再牛逼，可能都无法运行Jc的helloworld.py程序。所以，废话就是，当然是各有利弊。什么应用需要专用系统，首先当然是嵌入式设备，有些嵌入式设备并没有操作系统，有些有经过精简的操作系统。为实际应用量身定做的硬件和软件，对权衡性能和成本应该是最有利的！另一种是，在我看来，是专用服务器，比如一台专门的数据库服务器，那么首先它的硬件选型是很重要的，比如存储设备要选高端的，显卡就不要了；它的操作系统的很多东西就用不上了，比如DBMS通常会关掉OS的文件缓存page cache，甚至不用OS的文件系统，来自己管理缓存和裸块设备，包括很多多余的硬件驱动都是不必要的。什么应用需要通用系统最易想到应该使用通用系统的例子，就是每个人的手机还有个人电脑了，由于每个人的爱好和工作习惯不同，它们的任务多种多样，资源利用的特点也各不相同。80年代的PC、00年代的手机，都是以计数器、画图、记事本功能齐全作为卖点，后来随着系统的发展，甚至会搞出应用商店这种来增加系统的功能，这时，工作负载就更不唯一。这样，在为每个用户量身定做系统不现实的情况下，只有系统更通用才会更满足消费者的多样需求（比如有人爱拍照，有人爱打王者荣耀）。另一种，可能是云，也就是各种虚拟化和分布式技术。原因很简单，租用云服务的用户所需要的不只是一种服务（可能是云主机、云数据库或者云存储），更重要的是负载也是无法预测的。最典型的例子是云虚拟机，这时，一个“需要通用”的操作系统运行在云上，那么这个云更通用，比通用OS还要通用。比如，一个可以称为“云操作系统”的系统，要保证计算、存储、内存的可伸缩性，这时一般OS是不提供的，还要保证运行和数据可靠，这都是通用（通用虚拟机）之外的通用（伸缩性、可靠性）。通用也是专用讨论了什么时候应该通用和专用，及其原因之后，突然觉得：通用也是专用，因为不管是通用的还是专用的。因为专用的本来就是专用的；而通用的，开发它们多数都是专用来赚钱的，不管是手机还是云。

OSTEP笔记3–持久化存储

February 24, 2018 by JayceeZ·0 Comments

大部分截图来自原书，贴出书的官方主页：《Operating Systems: Three Easy Pieces》 (作者Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau)。感谢原作者这么好的书。本篇笔记是书的第三部分(Persistence)，讲述了操作系统和外存系统相关的内容。第一节 I/O Device 1.1 IO 总线一般情况下， IO设备的性能较差(慢)，所以用Peripheral IO Bus，为什么不用像显卡一样用的PCI呢？因为1)越快的总线越短，这样空间不够插；2)越快的总线制作成本越高，如果存储设备照总线的性能差的远，没必要用高性能总线。这张图为总线的层次结构，memory bus是最快的也是最近的，IO Bus比较远，也是最慢的，中间有用于显卡的PCI等总线。 1.2 典型设备的组成部分一个典型的外围设备如图所示，包括两部分：接口和内部结构。接口：类似软件接口的功能，硬件接口是留给OS和设备交互的。内部结构：比如㓟CPU、MEM等基本组件，还有称为固件(firmware)的软件来实现内部功能。 1.3 两种IO模式(Polling和Interrupt) Polling的形式，而interrupt。一种典型的协议是 Polling (轮询)，称为programmed IO，步骤有4: 循环等待STATUS寄存器直到设备状态为不busy 写数据到DATA寄存器写命令到COMMAND寄存器循环等待STATUS直到设备为不busy Polling显著的缺点就是太浪费CPU时间，这是因为IO相对于CPU是很慢的，大量的CPU时间被用在了等待上。 Interrupt (中断)方法（也称为interrupt-handling IO）可以解决这个问题，用Interrupt方法进行IO时，当设备完成操作时，会raise一个硬件interrupt。但是这样的话，如果设备很快(比如现在的NVMe SSD设备)，Interrupt由于需要进程上下文的切换、以及中断的控制等原因，会拖慢IO的速度。所以两种方法各有利弊： Polling […]

OSTEP笔记2–内存虚拟化

February 24, 2018 by JayceeZ·0 Comments

大部分截图来自原书，贴出书的官方主页：《Operating Systems: Three Easy Pieces》 (作者Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau)。感谢原作者这么好的书。本篇笔记是书的第一部分(Virtualization)的下半部分，讲述了操作系统是怎么通过地址空间的抽象，将内存资源进行虚拟化的。第一节地址空间 1.1 内存虚拟化多进程OS的资源共享策略本书上半部分讲了CPU的共享策略：通过进程(process)这个抽象，OS将时间片分给进程。对于内存资源的共享：为了让昂贵的计算机能够支持多个程序同时运行，如果在切换某个进程时将内存数据从磁盘换入（进程共享磁盘，内存和寄存器都不共享），由于磁盘IO太慢，不现实。所以现在的系统，都是将相对较快的寄存器换入换出，所有进程数据共享内存资源（寄存器不共享，内存共享）。为了实现这种想法，并更好地管理内存，地址空间(Address Space) 的抽象被引入（如下图），相对为每个程序固定分配一定大小的内存空间更灵活，用地址空间进行管理更加灵活。地址空间在结构上主要分为Code、Heap和Stack，Code部分用来存程序运行的代码，Heap是用户程序动态分配内存(malloc/free)所使用空间，Stack是变量使用的空间。除非程序递归很多，一般Stack都是够用的；如果程序视图访问非法地址，可能出现Segmentation fault的错误。每个进程都会有一个自己地址空间，且每个进程都认为自己的地址空间是从0开始的，并且地址空间的地址也不必和物理地址相等，甚至地址空间的总大小可以大于物理内存大小，这就体现了一种内存虚拟化的概念，OS的内存管理系统也可以称为虚拟内存系统(virtual memory system, VM) 。因此，我们编写的程序中，所有我们可以得到的地址也都是虚拟地址，并非物理地址。 VM系统设计的三个目标：透明(transparency)、高效(efficency) 和保护(protection) 。其中保护即隔离(isolation)，进程间的地址空间需要隔离，进程和OS间也需要隔离，（甚至在有些微内核操作系统中，OS的一部分和OS的另一部分也进行了隔离），这样可以保证安全性。 1.2. memory API 对于用户程序，Stack中的变量是自动管理的，比如用int声明一个整数变量，而Heap中的内存是由程序（程序员）负责的，什么时候malloc/free都要程序员进行考虑，所以要格外小心一些常见的malloc错误，比如忘记分配内存、分配的不够导致buffer overflow、忘记初始化所分配内存内容、忘记free等。 purify 和 valgrind 这两个工具可以协助检测内存分配的问题。 1.3. malloc、free和mmap的关系** 要注意 […]

OSTEP笔记1–CPU虚拟化

February 24, 2018 by JayceeZ·0 Comments

截图来自原书，贴出书的官方主页：《Operating Systems: Three Easy Pieces》 (作者Remzi H. Arpaci-Dusseau and Andrea C. Arpaci-Dusseau)。感谢原作者这么好的书。本篇笔记是书的第一部分(Virtualization)的上半部分，讲述了操作系统是怎么通过进程的抽象，将CPU计算资源进行虚拟化的。第一节进程的抽象 1.1. 策略和机制 Policy在mechanism（策略和机制）在操作系统中通常是分开设计的。比如如何切换上下文是一个low-level的mechanism，指底层的方法或者协议。当前时刻应该让哪个进程运行更好是一个high-level的policy的问题，指一些“智能”的调度。 1.2. 虚拟化和OS OS本身就可以看做是“虚拟机”(virtual machine)。系统通过在可以被接受的合理开销（时间、空间）范围内，将计算机CPU、内存、存储等资源进行虚拟化（抽象），目的是为了用户的方便使用。 CPU虚拟化主要体现在将任务抽象为进程(process) ，将资源按进程隔离，然后多个进程轮转使用计算资源；内存虚拟化主要体现在虚拟地址空间(virtual address space 或 adress space) ；而对于持久化的存储，OS让文件共享，没有那么多私有隔离，OS假定用户会用文件来共享数据。 (？？？？) 第二节进程API 2.1. fork和exec exec()函数组和fork()的区别是：fork()复制当前进程为一个子进程执行，exec()会执行一个新的程序；exec()执行以后就再也不会返回。 2.2. shell和stdout redirect 例如shell就是一个普通的用户程序，利用了fork和exec的组合。给出一个提示符，你输入可执行程序时，会先fork()，然后在fork出的子进程中exec()这个命令，然后调用wait()来结束。这种fork和exec的组合使用，可以在让shell在fork后运行一些其他代码：fork后的子进程可以redirect操作再exec；fork后的父进程可以执行wait操作在exec结束后再显示提示符prompt。 stdout redirect的原理很简单，stdout一般的fd都是0，在fork后的子进程中close掉stdout，然后打开要redirect到的文件，这个文件就会获得为0的fd，这时执行新命令的exec，则会把这个为0的文件看做stdout进行输出，程序清单如下图： 2.3. 其他 kill()可以向进程发送信号，让程序sleep, die。第三节 […]

JciX ~

Jc's Blog

Tag: 操作系统

关于通用和专用系统的一些思考

OSTEP笔记3–持久化存储

OSTEP笔记2–内存虚拟化

OSTEP笔记1–CPU虚拟化