在服务器内部

服务器到底是什么

服务器本质上就是一个持续运行的程序，它监听请求并对其作出响应。

🧑 客户端

传入

📦

🧑 客户端

传出

📤

🖥️

服务器进程

80443

📦

📤

服务器持续监听请求

请求进入服务器 → 在内部被处理 → 响应返回给客户端

服务器只是一个在操作系统控制下运行的程序。
它监听某个特定端口，并等待传入请求。
它会长时间保持运行，在一段时间内处理很多请求。

详情

“server” 这个词听起来像某种特殊机器，但从技术上讲，它只是一个程序。当你启动一个后端应用时，操作系统会创建一个进程，并让它持续运行在内存中。

与只运行一次然后退出的短脚本不同，服务器的设计目标是长时间存活。它会打开一个网络 socket，绑定到某个端口（例如 80 或 443），并等待传入连接。

当请求到达时，服务器会读取数据、处理数据，然后发送响应。完成之后，它不会关闭，而是继续监听下一个请求。

核心的心智模型是：后端 = 在操作系统控制下持续运行的程序。其他一切——框架、数据库、API——都是建立在这个简单基础之上的。

网络层

你的服务器通过 socket 与操作系统通信，而操作系统负责实际的网络通信。

原始信号

来自网络的电信号

⚡ 模拟信号

NIC 转换

信号变成二进制位

01011010 10100101

帧创建

NIC 将位封装成以太网帧

MACIPDATA

内核处理

内核检查 IP 和端口

IP端口 80

套接字传递

数据进入套接字缓冲区

socket()

server.read()

你的服务器不会直接与网络硬件通信。
操作系统接收网络数据并管理连接。
socket 是你的服务器用来发送和接收数据的接口。

详情

当你启动一个服务器并“监听某个端口”时，你实际上是在创建一个叫做 socket 的东西。socket 本质上只是操作系统提供的一个通信通道。

当数据从 Internet 到达时，它会先到达你机器的网络硬件。然后，操作系统的内核会处理这些数据，并根据端口号决定应该由哪个程序接收。

接着，操作系统会把数据放入与正确 socket 连接的缓冲区中。你的服务器在准备好处理请求时，就会从这个 socket 中读取数据。

这意味着你的服务器从不直接处理原始电信号或物理数据包。它通过操作系统提供的干净软件接口来读写数据。

socket 是你的后端代码与外部世界之间的桥梁，而操作系统则在底层默默管理复杂的网络细节。

操作系统

你的服务器之所以能工作，是因为操作系统在幕后管理硬件、资源和隔离。

🌐 Web 服务器

🖥️

操作系统决定哪个应用可以使用硬件

🧠

CPU

💾

内存

💽

存储

📡

网络

操作系统控制对 CPU、内存、存储和网络的访问。
它会隔离各个进程，确保一个程序不会破坏另一个程序。
它负责调度执行并管理资源分配。

详情

操作系统（OS）位于你的服务器和物理硬件之间。你的后端代码不会直接控制 CPU、RAM、磁盘或网卡——这些都由操作系统来控制。

当你的服务器运行时，操作系统会为它分配 CPU 时间、分配内存、打开网络 socket，并允许它读写文件。如果没有这种中介，程序就会混乱地争夺硬件访问权。

操作系统还会强制执行隔离。每个服务器进程都会获得自己的虚拟内存空间，从而防止与其他正在运行的程序发生意外干扰。

即使是高性能后端系统，也完全依赖操作系统调度器来决定它们何时运行以及运行多长时间。没有任何服务器可以绕过这一层。

简单来说，操作系统是让服务器执行成为可能的隐形基础。

并发模型

服务器必须同时处理许多请求，而它的并发模型决定了它如何做到这一点。

传入队列（CPU 任务和 I/O 任务）

💤

空闲

💤

空闲

💤

空闲

工作线程并行处理 CPU 密集型请求

⏳

空闲

事件循环一次处理一个 I/O 任务（节奏更慢）

多个请求可能同时到达。
服务器使用线程或事件循环来管理并发工作。
并发模型会直接影响性能和可扩展性。

详情

在真实系统中，请求不会一个接一个地到达。成百上千个客户端可能会同时发送请求。服务器必须能够在处理多个请求的同时继续推进，而不会冻结或阻塞其他请求。

一种常见的方法是 基于线程的模型，其中多个线程并行运行，每个线程处理一个请求。这种方式很直接，但如果创建过多线程，可能会消耗大量内存和 CPU。

另一种方法是 事件驱动模型，其中单个线程使用非阻塞 I/O 并异步处理请求。它不会等待缓慢的操作（例如数据库调用），而是继续处理其他任务，并在准备好后再恢复。

这两种模型都旨在最大化吞吐量，同时尽量减少资源浪费。并发模型的选择会影响服务器在高负载下的表现。

理解并发非常重要，因为高效处理多个请求，正是把一个简单程序变成可扩展后端系统的关键。

请求生命周期

从服务器的角度看，请求会经过操作系统、框架、你的处理代码，然后作为响应返回。

🌐

网络

请求敲响你服务器的门 🚪

🧠

操作系统内核

操作系统接待员把它送到正确的应用工位

🧰

框架

框架读取它并选择正确的路由映射

⚙️

处理器

你的代码完成真正的工作并做出决定

🗄️

数据库

如果需要，它会从存储中获取或保存数据

📤

响应

完成！响应已发送回用户 🎉

操作系统接收网络数据，并将其传递给你的服务器进程。
框架解析请求，并将其路由到正确的处理函数。
你的代码执行逻辑，可能会与数据库交互，然后返回响应。

详情

当客户端发送一个 HTTP 请求时，它首先到达你机器的网络接口。操作系统处理数据包，并将数据放入与你的服务器关联的 socket buffer 中。

你的服务器读取传入的数据，然后 framework（例如 Express、Django 或 FastAPI）对其进行解析。这包括提取 headers、URL path、query parameters 和 request body。

接着，框架会将请求路由到合适的 handler function —— 也就是你编写的那部分代码。业务逻辑就在这里运行：验证输入、执行计算、查询数据库，或者调用外部服务。

当你的处理函数完成后，它会返回一个 response object。框架将其格式化为 HTTP response，操作系统通过网络栈发送出去，然后它再返回给客户端。

从服务器的角度看，这个生命周期会持续重复：接收 → 处理 → 响应。每个后端请求都遵循这种结构化流程。

处理程序内部

处理程序是服务器实际业务逻辑运行的地方，它会把请求转换为有意义的响应。

📥验证输入

if (!req.body.email) {
  return error("missing email")
}

if (!user.canPurchase) {
  return error("permission denied")
}

检查格式、字段、权限

🧠业务逻辑

const price = cart.total()

if (price > creditLimit) {
  throw new Error("limit")
}

applyDiscount(cart)

规则、计算、决策

🗄️数据访问

const user = await db.users.find(id)

await cache.set(
  "cart:" + user.id,
  cart
)

数据库、缓存或服务

📤返回响应

return {
  status: "success",
  orderId: order.id,
  total: price
}

将 JSON 发送回客户端

处理程序会验证并解析传入的请求数据。
它会执行业务逻辑，例如计算或规则检查。
在返回响应之前，它可能会与缓存、数据库或外部服务交互。

详情

在框架解析请求之后，它会调用一个 handler function —— 也就是你实际编写的那部分代码。真正的工作就在这里发生。

处理程序通常从验证输入开始。它会检查是否存在必需字段、值的格式是否正确，以及用户是否有权限执行该操作。

接下来是业务逻辑。这可能包括计算、执行规则、转换数据，或者准备查询。如果需要，处理程序还可能调用数据库、访问缓存，或与其他服务通信。

当工作完成后，处理程序会构造一个响应对象。这可能包含 JSON 数据、成功消息，或者错误描述。

处理程序是后端系统的核心。它前面的部分负责准备请求，后面的部分负责返回结果——而真正做出决策的地方就在处理程序内部。

缓存层

缓存将经常使用的数据存储在高速内存中，这样服务器就不需要每次都查询数据库。

🌐 服务器

缓存内存

🗄️ 数据库

缓存命中

缓存未命中 → 数据库 → 存储

服务器在查询数据库之前，会先检查缓存。
缓存命中可以快速返回数据，而无需进行昂贵的数据库操作。
缓存未命中会触发数据库查询，然后将结果存储起来供以后使用。

详情

数据库功能强大，但与内存相比速度相对较慢。如果每个请求都直接查询数据库，在高流量下系统很快就会成为瓶颈。

缓存将最近访问或频繁访问的数据存储在高速内存中（通常是 RAM）。当请求到达时，服务器会先检查所需数据是否已经存在于缓存中。

如果找到了数据（即 cache hit），服务器就可以立即返回结果。这会显著降低延迟并减轻数据库负载。

如果没有找到数据（即 cache miss），服务器会查询数据库，获取结果，将其存入缓存，然后再返回给客户端。

缓存可以提升性能和可扩展性，但也会带来一些复杂性，例如需要保持缓存数据与数据库一致。只要实现得当，它就能显著减轻系统压力。

数据库交互

当数据不在内存或缓存中可用时，服务器会查询数据库以检索或修改持久化信息。

🖥️

应用服务器

SELECT user FROM users WHERE id=42

➡️

👤 用户数据

⬅️

查询 ↔ 结果

🗄️

数据库引擎

当 handler 需要存储的数据时，会向数据库发送查询。
数据库处理查询并返回结果。
数据库速度和设计会直接影响服务器性能。

详情

数据库负责永久存储数据——例如用户账户、订单、消息或应用状态。当服务器需要的信息不在内存或缓存中时，它会向数据库发送查询。

数据库会解析查询，搜索其存储结构（例如索引和表），并返回请求的数据。这个过程通常比内存操作更慢，因为它可能涉及磁盘访问或复杂查找。

在接收到结果后，服务器可能会转换数据、应用业务逻辑，或将其格式化为响应，然后再发送回客户端。

优化不佳的查询、缺失的索引或高流量都可能让数据库成为瓶颈。这就是为什么数据库设计和查询效率对后端性能至关重要。

在大多数真实系统中，数据库交互是请求生命周期中最昂贵的部分之一。

进程生命周期与资源管理

服务器进程有一个生命周期：它启动，获取诸如 socket 和文件描述符之类的资源，持续运行，并且必须干净地关闭。

🚀

启动时初始化配置和套接字

🧹

优雅关闭释放资源

🖥️

运行中的进程持有活动资源

🔌

套接字： 1

🧠

内存使用量

📂

文件描述符： 1

在启动时，服务器会初始化配置、打开 socket，并连接到依赖项。
在运行期间，它会持有内存、文件描述符和网络连接等资源。
在关闭期间，它应该安全地关闭连接并释放资源。

详情

当服务器进程启动时，它会执行初始化步骤。这通常包括加载配置、打开监听 socket、连接数据库以及准备缓存。

在运行过程中，该进程会拥有多个 文件描述符，它们是指向网络 socket、打开的文件和管道等资源的句柄。操作系统会跟踪这些资源，并且系统对同时打开的数量有上限。

如果服务器泄漏文件描述符，或者没有正确关闭连接，最终可能会达到系统限制，并停止接受新的请求。

在关闭时——无论是由于部署、扩缩容还是故障——设计良好的服务器都会执行 优雅关闭。它会停止接受新请求，完成正在进行中的工作，关闭数据库连接，并释放资源。

正确的生命周期管理可以防止内存泄漏、描述符耗尽以及在重启期间出现不一致状态。稳定的后端系统在很大程度上依赖于严格的资源管理。

服务器故障场景

服务器会因为不同原因而失败，理解故障发生的位置有助于你设计更稳定的系统。

🧠

200 OK

应用崩溃或运行时错误

⚙️

CPU

内存

CPU / 内存耗尽

🗄️

🖥️

➜

📦

查询成功

外部依赖故障

应用错误可能导致崩溃或返回 500 响应。
资源耗尽（CPU、内存、文件描述符）会导致服务器无法正常工作。
数据库等外部依赖可能成为瓶颈，甚至完全失效。

详情

故障可能发生在服务器栈的多个层级。在 应用层，未处理的异常或逻辑 bug 可能导致 500 错误，甚至让进程崩溃。

在 资源层，高流量可能耗尽 CPU、内存或文件描述符限制。例如，过多的打开连接可能会阻止新客户端连接。过高的内存使用可能会触发操作系统的内存不足（OOM）杀死进程。

并发问题也会引发故障。阻塞操作可能导致请求超时，而竞态条件可能产生不一致的行为。

外部系统会引入额外的故障点。如果数据库变慢或不可用，请求可能会堆积，并增加整个系统的延迟。

理解这些故障场景至关重要，因为真实世界中的后端系统并不是按理想条件下的表现来评判的，而是看它们在出问题时如何表现。

问题部分

先尝试用你自己的话回答，然后再翻卡片查看。

1 / 5

服务器到底是什么

服务器本质上就是一个持续运行的程序，它监听请求并对其作出响应。

🧑 客户端

传入

📦

🧑 客户端

传出

📤

🖥️

服务器进程

80443

📦

📤

服务器持续监听请求

请求进入服务器 → 在内部被处理 → 响应返回给客户端

服务器只是一个在操作系统控制下运行的程序。
它监听某个特定端口，并等待传入请求。
它会长时间保持运行，在一段时间内处理很多请求。

详情

当请求到达时，服务器会读取数据、处理数据，然后发送响应。完成之后，它不会关闭，而是继续监听下一个请求。

核心的心智模型是：后端 = 在操作系统控制下持续运行的程序。其他一切——框架、数据库、API——都是建立在这个简单基础之上的。

网络层

你的服务器通过 socket 与操作系统通信，而操作系统负责实际的网络通信。

原始信号

来自网络的电信号

⚡ 模拟信号

NIC 转换

信号变成二进制位

01011010 10100101

帧创建

NIC 将位封装成以太网帧

MACIPDATA

内核处理

内核检查 IP 和端口

IP端口 80

套接字传递

数据进入套接字缓冲区

socket()

server.read()

你的服务器不会直接与网络硬件通信。
操作系统接收网络数据并管理连接。
socket 是你的服务器用来发送和接收数据的接口。

详情

当你启动一个服务器并“监听某个端口”时，你实际上是在创建一个叫做 socket 的东西。socket 本质上只是操作系统提供的一个通信通道。

当数据从 Internet 到达时，它会先到达你机器的网络硬件。然后，操作系统的内核会处理这些数据，并根据端口号决定应该由哪个程序接收。

接着，操作系统会把数据放入与正确 socket 连接的缓冲区中。你的服务器在准备好处理请求时，就会从这个 socket 中读取数据。

这意味着你的服务器从不直接处理原始电信号或物理数据包。它通过操作系统提供的干净软件接口来读写数据。

socket 是你的后端代码与外部世界之间的桥梁，而操作系统则在底层默默管理复杂的网络细节。

操作系统

你的服务器之所以能工作，是因为操作系统在幕后管理硬件、资源和隔离。

🌐 Web 服务器

🖥️

操作系统决定哪个应用可以使用硬件

🧠

CPU

💾

内存

💽

存储

📡

网络

操作系统控制对 CPU、内存、存储和网络的访问。
它会隔离各个进程，确保一个程序不会破坏另一个程序。
它负责调度执行并管理资源分配。

详情

操作系统（OS）位于你的服务器和物理硬件之间。你的后端代码不会直接控制 CPU、RAM、磁盘或网卡——这些都由操作系统来控制。

操作系统还会强制执行隔离。每个服务器进程都会获得自己的虚拟内存空间，从而防止与其他正在运行的程序发生意外干扰。

即使是高性能后端系统，也完全依赖操作系统调度器来决定它们何时运行以及运行多长时间。没有任何服务器可以绕过这一层。

简单来说，操作系统是让服务器执行成为可能的隐形基础。

并发模型

服务器必须同时处理许多请求，而它的并发模型决定了它如何做到这一点。

传入队列（CPU 任务和 I/O 任务）

💤

空闲

💤

空闲

💤

空闲

工作线程并行处理 CPU 密集型请求

⏳

空闲

事件循环一次处理一个 I/O 任务（节奏更慢）

多个请求可能同时到达。
服务器使用线程或事件循环来管理并发工作。
并发模型会直接影响性能和可扩展性。

详情

这两种模型都旨在最大化吞吐量，同时尽量减少资源浪费。并发模型的选择会影响服务器在高负载下的表现。

理解并发非常重要，因为高效处理多个请求，正是把一个简单程序变成可扩展后端系统的关键。

请求生命周期

从服务器的角度看，请求会经过操作系统、框架、你的处理代码，然后作为响应返回。

🌐

网络

请求敲响你服务器的门 🚪

🧠

操作系统内核

操作系统接待员把它送到正确的应用工位

🧰

框架

框架读取它并选择正确的路由映射

⚙️

处理器

你的代码完成真正的工作并做出决定

🗄️

数据库

如果需要，它会从存储中获取或保存数据

📤

响应

完成！响应已发送回用户 🎉

操作系统接收网络数据，并将其传递给你的服务器进程。
框架解析请求，并将其路由到正确的处理函数。
你的代码执行逻辑，可能会与数据库交互，然后返回响应。

详情

当客户端发送一个 HTTP 请求时，它首先到达你机器的网络接口。操作系统处理数据包，并将数据放入与你的服务器关联的 socket buffer 中。

你的服务器读取传入的数据，然后 framework（例如 Express、Django 或 FastAPI）对其进行解析。这包括提取 headers、URL path、query parameters 和 request body。

当你的处理函数完成后，它会返回一个 response object。框架将其格式化为 HTTP response，操作系统通过网络栈发送出去，然后它再返回给客户端。

从服务器的角度看，这个生命周期会持续重复：接收 → 处理 → 响应。每个后端请求都遵循这种结构化流程。

处理程序内部

处理程序是服务器实际业务逻辑运行的地方，它会把请求转换为有意义的响应。

📥验证输入

if (!req.body.email) {
  return error("missing email")
}

if (!user.canPurchase) {
  return error("permission denied")
}

检查格式、字段、权限

🧠业务逻辑

const price = cart.total()

if (price > creditLimit) {
  throw new Error("limit")
}

applyDiscount(cart)

规则、计算、决策

🗄️数据访问

const user = await db.users.find(id)

await cache.set(
  "cart:" + user.id,
  cart
)

数据库、缓存或服务

📤返回响应

return {
  status: "success",
  orderId: order.id,
  total: price
}

将 JSON 发送回客户端

处理程序会验证并解析传入的请求数据。
它会执行业务逻辑，例如计算或规则检查。
在返回响应之前，它可能会与缓存、数据库或外部服务交互。

详情

在框架解析请求之后，它会调用一个 handler function —— 也就是你实际编写的那部分代码。真正的工作就在这里发生。

处理程序通常从验证输入开始。它会检查是否存在必需字段、值的格式是否正确，以及用户是否有权限执行该操作。

接下来是业务逻辑。这可能包括计算、执行规则、转换数据，或者准备查询。如果需要，处理程序还可能调用数据库、访问缓存，或与其他服务通信。

当工作完成后，处理程序会构造一个响应对象。这可能包含 JSON 数据、成功消息，或者错误描述。

处理程序是后端系统的核心。它前面的部分负责准备请求，后面的部分负责返回结果——而真正做出决策的地方就在处理程序内部。

缓存层

缓存将经常使用的数据存储在高速内存中，这样服务器就不需要每次都查询数据库。

🌐 服务器

缓存内存

🗄️ 数据库

缓存命中

缓存未命中 → 数据库 → 存储

服务器在查询数据库之前，会先检查缓存。
缓存命中可以快速返回数据，而无需进行昂贵的数据库操作。
缓存未命中会触发数据库查询，然后将结果存储起来供以后使用。

详情

数据库功能强大，但与内存相比速度相对较慢。如果每个请求都直接查询数据库，在高流量下系统很快就会成为瓶颈。

缓存将最近访问或频繁访问的数据存储在高速内存中（通常是 RAM）。当请求到达时，服务器会先检查所需数据是否已经存在于缓存中。

如果找到了数据（即 cache hit），服务器就可以立即返回结果。这会显著降低延迟并减轻数据库负载。

如果没有找到数据（即 cache miss），服务器会查询数据库，获取结果，将其存入缓存，然后再返回给客户端。

缓存可以提升性能和可扩展性，但也会带来一些复杂性，例如需要保持缓存数据与数据库一致。只要实现得当，它就能显著减轻系统压力。

数据库交互

当数据不在内存或缓存中可用时，服务器会查询数据库以检索或修改持久化信息。

🖥️

应用服务器

SELECT user FROM users WHERE id=42

➡️

👤 用户数据

⬅️

查询 ↔ 结果

🗄️

数据库引擎

当 handler 需要存储的数据时，会向数据库发送查询。
数据库处理查询并返回结果。
数据库速度和设计会直接影响服务器性能。

详情

数据库负责永久存储数据——例如用户账户、订单、消息或应用状态。当服务器需要的信息不在内存或缓存中时，它会向数据库发送查询。

数据库会解析查询，搜索其存储结构（例如索引和表），并返回请求的数据。这个过程通常比内存操作更慢，因为它可能涉及磁盘访问或复杂查找。

在接收到结果后，服务器可能会转换数据、应用业务逻辑，或将其格式化为响应，然后再发送回客户端。

优化不佳的查询、缺失的索引或高流量都可能让数据库成为瓶颈。这就是为什么数据库设计和查询效率对后端性能至关重要。

在大多数真实系统中，数据库交互是请求生命周期中最昂贵的部分之一。

进程生命周期与资源管理

服务器进程有一个生命周期：它启动，获取诸如 socket 和文件描述符之类的资源，持续运行，并且必须干净地关闭。

🚀

启动时初始化配置和套接字

🧹

优雅关闭释放资源

🖥️

运行中的进程持有活动资源

🔌

套接字： 1

🧠

内存使用量

📂

文件描述符： 1

在启动时，服务器会初始化配置、打开 socket，并连接到依赖项。
在运行期间，它会持有内存、文件描述符和网络连接等资源。
在关闭期间，它应该安全地关闭连接并释放资源。

详情

当服务器进程启动时，它会执行初始化步骤。这通常包括加载配置、打开监听 socket、连接数据库以及准备缓存。

如果服务器泄漏文件描述符，或者没有正确关闭连接，最终可能会达到系统限制，并停止接受新的请求。

正确的生命周期管理可以防止内存泄漏、描述符耗尽以及在重启期间出现不一致状态。稳定的后端系统在很大程度上依赖于严格的资源管理。

服务器故障场景

服务器会因为不同原因而失败，理解故障发生的位置有助于你设计更稳定的系统。

🧠

200 OK

应用崩溃或运行时错误

⚙️

CPU

内存

CPU / 内存耗尽

🗄️

🖥️

➜

📦

查询成功

外部依赖故障

应用错误可能导致崩溃或返回 500 响应。
资源耗尽（CPU、内存、文件描述符）会导致服务器无法正常工作。
数据库等外部依赖可能成为瓶颈，甚至完全失效。

详情

故障可能发生在服务器栈的多个层级。在 应用层，未处理的异常或逻辑 bug 可能导致 500 错误，甚至让进程崩溃。

并发问题也会引发故障。阻塞操作可能导致请求超时，而竞态条件可能产生不一致的行为。

外部系统会引入额外的故障点。如果数据库变慢或不可用，请求可能会堆积，并增加整个系统的延迟。

理解这些故障场景至关重要，因为真实世界中的后端系统并不是按理想条件下的表现来评判的，而是看它们在出问题时如何表现。

问题部分

先尝试用你自己的话回答，然后再翻卡片查看。

1 / 5

在服务器内部

服务器到底是什么

网络层

操作系统

并发模型

请求生命周期

处理程序内部

缓存层

数据库交互

进程生命周期与资源管理

服务器故障场景

问题部分

相关课程

Cookie 同意

在服务器内部

服务器到底是什么

网络层

操作系统

并发模型

请求生命周期

处理程序内部

缓存层

数据库交互

进程生命周期与资源管理

服务器故障场景

问题部分

相关课程