Author: JayceeZ

计算机科学可以分为几个方向

December 15, 2024 by JayceeZ·0 Comments

“计算机学科的基础理论从根本上来说可以分为哪几个方向?” 这个问题我最近偶有新的思考，记录下来。首先看下 chatgpt 怎么说：计算机学科的基础理论可以分为多个方向，主要包括以下几个方面：计算理论：包括图灵机、可计算性理论、复杂性理论等，研究计算的本质和计算过程中的复杂性。算法理论：研究算法的设计、分析和优化，包括算法的效率、最优性和应用问题。数据结构：研究如何组织和存储数据，以便高效地进行访问和修改，常见的数据结构包括树、图、哈希表等。自动机理论：涉及自动机的定义和性质，研究语言的识别和生成，相关内容包括形式语言、正则语言和上下文无关语言等。逻辑与证明理论：研究计算机科学中的逻辑基础，包括命题逻辑、谓词逻辑和自动证明等。编程语言理论：研究编程语言的设计、实现以及其语义和类型系统的理论基础。计算机系统理论：关注计算机系统的结构和运行机制，包括操作系统、分布式系统和网络协议等。以上每个方向都有其独特的研究问题和应用场景，构成了计算机科学的理论基础。其次，国内的计算机专业也早就分了三个子学科，计算机系统结构、计算机软件与理论和计算机应用技术。这些分类肯定各有道理，我先不去替他们解释，先记录下我的想法：系统结构系统架构：既包括计算机的硬件组成架构设计，也包括多个计算机组成的分布式系统设计。这里涉及到很多经典问题，包括容错、一致性、缓存系统、扩展性等等。控制系统：既包括单个计算机的操作系统设计，也包括分布式系统中的控制节点设计。这里也会有很多经典的问题，比如调度公平与效率的权衡，资源碎片和利用率问题等等。通信系统：包括计算机之间的网络通信架构和通信协议设计。通信协议分为多个层次，可以参考 OSI 模型。编程语言编程语言：人要将自己的语言转换为机器指令，设计介于人和机器间的编程语言必不可少的。编译器：要把编程语言转成机器码，也就有了编译器这种特殊的软件。软件工程软件工程也许更多是与人相关的，一个成功软件也是一个成功的项目，项目的规模、生命周期、开发进程，都会相当重要。计算机应用不必多说，正是人们需要应用计算机，才有了计算机。一些热门的方向例如：人工智能互联网通信科学计算数据存储和数据挖掘形成“闭环” 人们写了程序（软件工程），转换成了机器语言（编程语言），程序就以人们设计的方式（系统结构）运行于计算机上，这个运行的系统也就为人们提供了他们想要的各种服务（计算机应用）。因此，这四个研究方向”闭环“了：

Virtual Machine Types without KVM

July 19, 2024 by JayceeZ·0 Comments

Technically, KVM-based VM is a special type of virtual machine which relies on physical machine features. Following lists some popular VM types that do not use KVM. Hope you also find it interesting. VM Name Translation Technologies Executable Format Runtime Dalvik VM (Register based VM) Interpretation Android (<2.2, 2008) Dalvik VM JIT + Interpretation (Just […]

Given one of the PID, Container ID, or Pod ID, How to Find the Other Two (PID、Container ID、 Pod ID 间的互查)

July 13, 2024 by JayceeZ·0 Comments

Container Runtime Alternatives to runc

July 7, 2024 by JayceeZ·0 Comments

What is a “Container Runtime” ? As already explained in a previous blog (容器生态技术栈 – JciX ~), container runtimes are the components that will take the responsibility to run the container. They will be invoked by container engines (like containerd, and CRI-O), and will create the containers using Linux kernel primitives (like cgroups, and namespaces). […]

Flavors and Types of IPC Mechanisms in Linux (Linux 中到底有多少种 IPC)

July 1, 2024 by JayceeZ·0 Comments

In the Linux world, there are many interprocess communication (IPC) methods available for system programmers. After some web searching, I found that there are rarely blogs or books that summarize them all. This article roughly lists them all with minimal explanation and some links to official manuals. POSIX IPCs POSIX-flavor IPCs include semaphores, shared memory, […]

Paper Recap 3: 云原生文件系统 (Cloud-Native File Systems)

April 4, 2024 by JayceeZ·0 Comments

本文概述 HotCloud ’18 中的一篇讲云原生文件系统的论文，来回顾下存储领域大佬 Arpaci-Dusseau 在 6 年前对云原生文件系统的想法。论文链接 hotcloud18-paper-arpaci-dusseau.pdf (usenix.org) 文章的贡献主要有两点：提出一些云原生文件系统所应该遵循的设计原则；提出一种云原生文件系统 CNFS 的大概设计。云原生文件系统的设计原则作者把设计的原则分为存储和计算两个层次，但总体来讲都聚焦于成本和性能的权衡。这种权衡是云环境相对传统环境更容易做到的，也是云原生文件系统设计的核心。存储原则可靠性已经通过更底层的云存储服务得到保障。云存储比如对象存储 S3 或者块存储 EBS，已经提供了多副本等可靠性功能，因此云原生文件系统可以把这部分功能卸载到更底层的云存储。云存储空间便宜且可以无限扩展。云原生文件系统的设计应该尽量利用这些便宜的存储空间对数据建立索引，用空间换时间。云存储与本地存储有很大差异：带宽通常较高；延迟根据服务分级不同差异明显；更快分级的云存储访问成本反而更低。因此云原生文件系统应该按冷热层次化地放置数据，来兼顾成本和高性能。 CPU 原则云上 A 个 CPU 计算 B 秒和 B 个 CPU 计算 A 秒（A * B = B * A）的成本相同。因此，云原生文件系统的计算任务应该尽量并行起来，这样可以在尽可能短的时间内完成任务。类似于云存储的空间，云上的 CPU 数量也很容易扩展。云原生文件系统应该按需地使用 CPU，但也需要注意根据负载的变化对之前扩容的 CPU 数进行缩容，来控制成本。由于云存储可以在计算节点间共享，可以适当的将与文件系统相关后台任务从计算节点分离出来，让计算节点的 CPU 资源更多地用于计算任务。云服务中 […]

用 MinIO 和 s3fs 快速部署对象及文件存储服务

March 11, 2024 by JayceeZ·0 Comments

MinIO 是一个用 Golang 编写的对象存储 server 开源实现。s3fs 是一个基于 FUSE 框架的以 s3 存储服务作为后端并导出 POSIX 文件系统挂载的开源实现。本文首先基于 MinIO 搭建一个简单的对象存储服务。然后进一步借助 s3fs 将这个对象存储服务挂载为一个文件系统目录。搭建 MinIO 对象存储安装 Minio go install github.com/minio/minio@latest 启动 mkdir minio_dir minio server minio_dir CLI 操作 curl https://dl.min.io/client/mc/release/linux-amd64/mc \ –create-dirs \ -o $HOME/minio-binaries/mc chmod +x $HOME/minio-binaries/mc export PATH=$PATH:$HOME/minio-binaries/ # 设置 alias，之后就可以将 myminio 作为第一级目录操作了 mc alias set myminio […]

从内核到用户空间(2) — 初探 ublk

February 8, 2024 by JayceeZ·0 Comments

本文以我的视角对 ublk 进行了最基本的分析，希望也为你带来帮助。 ublk ublk 是一个 6.X 内核全新的实现用户态块设备驱动的内核框架，之前的类似框架还有 TCMU、vdpa-user (VDUSE) 和 NBD。ublk 框架中，一个额外的 ublk Server 用户态进程作为 ublk 块设备的服务后端，实现了主要的存储逻辑。区别于其他用户态块设备框架，ublk 采用 io_uring 作为内核与用户态通信的传输机制。ublk 架构图如下：使用 ublk 框架，内核会多出几种设备，包括一个唯一的 ublk_ctl 设备，多个名为 /dev/ublkcN 的字符设备，以及同样数量的 /dev/ublkbN 块设备。其中，块设备是实际的存储服务设备，可以格式化文件系统或者作为裸设备使用，这也是 ublk 存在的最终目的；字符设备是 ublk 框架的数据面接口，主要被用户态 ublk Server 进程用于与内核通信，处理块设备的实际 IO 请求； ublk_ctl 设备(/dev/ublk-control)则可以看作的是 ublk 框架的控制面通道，ublk Server 通过请求 ublk_ctl 设备来创建出多对字符设备和块设备，类似于其他用户态驱动框架，ublk 为了方便用户态 ublk-server 的开发，也提供了用户态 SDK […]

探索 ChatGPT 的 Python 沙盒

January 12, 2024 by JayceeZ·0 Comments

容器生态技术栈

January 9, 2024 by JayceeZ·0 Comments

汇总一些容易混淆的容器领域技术概念，希望对你有所帮助。技术栈架构生态对比 Ecosystem Orchestration Service Orchestration Agent Container Engine ContainerRuntime CLItools OCI / CNCF k8s kubelet containerd(CRI runtimes) runc / kata(OCI runtimes) ctr,crictl Docker docker swarm dockerd(docker CLI) containerd runc docker LXD /Canonical clusterd lxd lxd lxd lxc lxc OpenShift / Redhat k8s kubelet CRI-O runc podman 当然，这里列出的只是各个生态的默认技术栈，开源社区中还有各种项目让不同生态的组件互相组合协同工作。比如：Mirantis/cri-dockerd: dockerd as a compliant Container Runtime […]