服务器技术基础

服务器是通过网络对外提供够高性能高可用的计算机

服务器分类

服务器的四种类型

服务器就像不同款式的电脑主机，根据外形和功能分为四大类：

塔式服务器
👉 像普通电脑主机一样独立放置，体积较大
✨ 优点：方便升级硬件（加硬盘 / 内存）
📌 适合：小公司或不需要太多设备的场景
缺点：
机架式服务器
👉 安装在标准机柜里的扁平主机（类似抽屉）
✨ 优点：省空间，适合集中管理
📌 常见规格：
- 1U（约 4.445 厘米高）：最多装 4-8 块小硬盘
- 2U（约 8.89 厘米高）：最多装 8-24 块小硬盘
刀片式服务器
👉 像插卡片一样集中安装在机箱里
✨ 优点：省空间，适合同时处理大量数据
📌 适合：云计算、大数据中心等需要高算力的场景
高密度服务器
👉 把很多电脑组件塞进更小的空间
✨ 优点：单位面积算力最强
📌 适合：对空间和性能要求极高的场景

服务器的关键特性

高可用性（7×24 小时不罢工）
✅ 技能：自动恢复故障，全年无休
🔧 原理：心跳检测 + 快速重启机制
🌰 场景：电商大促时网站不崩溃
高可靠性（带病坚持工作）
✅ 技能：关键部件双备份
🔧 原理：冗余电源 / 硬盘 / 网络
🌰 场景：银行系统单硬盘损坏仍能运行
可扩展性（随时升级装备）
✅ 技能：按需添加硬件
🔧 原理：模块化设计
🌰 操作：插入新硬盘 / 内存 / CPU
可管理性（远程操控大师）
✅ 技能：千里之外掌控全局
🔧 工具：BMC 管理系统
🌰 功能：手机查看服务器温度 / 远程重装系统

BMC 管理控制器（物理）

BMC（Baseboard Management Controller）即基板管理控制器，遵循 IPMI 2.0 规范，实现了系统硬件健康状况的远程监控和管理。

带外管理：BMC 拥有独立的系统（两颗核心），控制数据和业务数据相互分离。即使业务网络中断或系统宕机，只要设备有电，就可以通过独立的通道进行管理。管理员可以对系统进行远程开机关机操作，查看硬件的状态，如温度、风扇转速、电压等。
带内管理：设备管理网络和业务网络使用同一个网络链路，主要用于对系统内部进行操作，如安装软件、配置服务、配置网络参数等。
xcc：ThinkSystem 系列服务器的 web 控制管理程序，可提供远程控制台、镜像挂载远程操作功能，便于远程进行服务器安装、维护等操作，大大提高了管理的便捷性。

主板

主板（Motherboard），又称为母板，是整个服务器系统的核心载体，承载着 CPU、内存、扩展卡等关键组件的安装和管理。主板的性能在很大程度上决定了整个系统的性能表现，其稳定性和兼容性对于服务器的正常运行至关重要。

BIOS（基本输入输出系统）：BIOS 是主板控制芯片的底层控制程序，存储在 ROM（只读存储器）中，不会丢失。它负责在计算机启动时初始化硬件设备、检测硬件故障并加载操作系统。与之相对的是 RAM（随机存取存储器），如果长时间不用，BIOS 数据可能会丢失，此时开机就会直接进入 BIOS 界面。
UEFI & EFI：UEFI（统一可扩展固件接口）是优化升级之后的 BIOS，具有更高的处理效率。而 EFI（可扩展固件接口）处理效率相对较低。在一些特殊情况下，如系统维护和故障排除时，会用到 PE（便携式操作系统）和 LIVE CD（救援模式，标准系统环境）。
MT：是产品线内部命名，用于标识服务器的类型，方便生产和管理。
SN：即序列号，是设备的唯一编码，也是保修编码。通过序列号可以查询设备的保修日期、配置等详细信息，便于设备的维护和管理。
VGA：是一种免驱的模拟信号接口，由于志强处理器不支持集显，所以服务器的 VGA 功能由 BMC 控制，主板本身不自带。
LOM 插槽：用于安装板载网卡，自带 OCP热插拔功能（但不建议频繁热插拔）。板载网卡的英文缩写为 NIC（Network Interface Card）。
NMI 接口：即强制中断接口，用于生成错误日志。但使用该接口可能会导致数据丢失或系统无法开机，一般不建议使用。
PCIE：即拓展卡，又名 RiSER 卡。PCIE 接口的传输速率不断提升，从 PCIE 1.0 的 2.5GHz 发展到 PCIE 5.0 的 32GHz。常见的插槽规格有 x2、x4、x8、x16，不同规格的插槽支持的带宽和性能也有所不同。

前置灯

服务器前置灯用于显示服务器的运行状态，方便管理员进行监控和故障排查。

电源灯：通电即亮，根据不同的闪烁状态（常亮、闪烁、快闪）表示不同的电源状态。
系统 ID 按钮：用于在多台服务器中定位特定的服务器，方便维护和管理。
网络灯：显示板载网卡的网络连接状态，如连接、断开、数据传输等。
错误灯：当系统出现问题时亮起，提示管理员服务器存在故障，需要进行检查和修复。

硬盘

硬盘是服务器存储数据的重要设备，常见的硬盘类型包括 2.5 寸的机械盘、固态盘（HDD、SSD）和 3.5 寸的机械盘（部分采用叠瓦技术）。此外，还有硬盘转接卡 KIT、直通盘 - jbod、HDD SED 加密盘等特殊类型的硬盘设备。

接口类型：常见的硬盘接口包括 SATA/NL SAS、SAS、M.2、PCIE、FC、SCSI、ATA/IDE 等。不同的接口类型具有不同的传输速度和性能特点，用户可根据需求选择合适的接口。
外观类型
- 条 M.2：最大容量可达 3.84TB，具有体积小、传输速度快等优点。
- 卡 AIC：容量可达 7.68TB，适用于一些对性能要求较高的应用场景。
- 盘 U.2：容量最大可达 30TB，常用于数据中心和大型服务器。
- 短条 E1.S：容量为 7.68TB，具有较高的密度和性能。
- 尺子 E1.L：容量可达 30T，适用于需要大量存储的应用场景。
硬盘指标：硬盘的性能指标主要包括硬盘容量、转速、平均访问时间和传输速率。这些指标直接影响硬盘的读写速度和数据存储能力。
规格：以 m.2 硬盘为例，常见的规格有 2242、2280、2110 等，不同规格的硬盘适用于不同的设备和应用场景。
速率：SATA 接口的速率从 SATA 1.0 的 1.5Gbit 发展到 SATA 3.0 的 6Gbit，而 SAS 3.0 接口的速率为 12Gbit，具有更好的扩展性和更快的传输速度，并且 SAS 接口兼容 SATA 接口。

CPU

CPU（中央处理器）是服务器的核心组件，其性能直接决定了服务器的计算能力。目前，英特尔的 CPU 型号通过铂金、金、银、铜牌来区分性能等级，
其中 3 代表铜牌，
4 代表银牌，
5、6 代表金牌，
8、9 代表铂金。
第二位数字表示处理器代数，
第三、四位数字表示不同的产品型号。

CPU 通过 DMI 总线、I/O 总线、upi、qpi 等与主板芯片组进行通信。IPMITOO 是一种命令行协议，用于远程管理服务器；ONECLI 是联想特有的管理工具，方便用户对服务器进行配置和管理。

缓存（Cache）：缓存是位于 CPU 和内存之间的临时存储器，分为 1、2、3 级缓存。其中，L1 缓存速度最快，L3 缓存容量最大。缓存的存在可以提高 CPU 访问数据的速度，减少数据读取时间，从而提高整个系统的性能。

内存

内存是服务器运行时存储数据和程序的重要组件，其性能对服务器的运行速度和响应能力有着重要影响。

介绍
- 容量：常见的内存容量有 4GB、8GB、16GB、32GB、64GB、128GB、512GB 等，用户可根据服务器的应用需求选择合适的容量。
- 电压：随着技术的发展，内存电压逐渐降低，从 DDR1 的 2.5V，到 DDR2 的 1.8V，DDR3 的 1.5V，DDR4 的 1.2V，再到 DDR5 的 1.1V。较低的电压可以降低功耗，提高内存的稳定性。
- 频率：内存的频率从 1333MHz 发展到 3200MHz 及以上，频率越高，内存的数据传输速度越快，系统性能也越好。主流的内存厂商包括三星、海力士、镁光、记忆等。
分类：内存可分为动态随机存取 DRAM 和静态随机存取 SRAM。目前，主流的内存类型为 DDR4 和 DDR5，其中 DDR4 支持 2133 - 3600 频率，DDR5 支持 3600 频率以上。
动态随机存取 DRAM：根据不同的技术和应用场景，DRAM 可分为 DIMM、URDIMM 和 LRDIMM。其中，ecc 内存（带有校验颗粒 Registered，条上写有 RE 标识）和非 ecc 内存的主要区别在于 ecc 内存具有差错校验机制，能够在出现错误时纠正错误。每 8bit 数据可以纠正一次 1bit 错误，之后会重启系统以确保数据的准确性。LRDIMM 的数据和地址控制信号都经过校验颗粒，具有更高的稳定性和可靠性。

服务器内存三种模式

独立模式：每个内存模块独立工作，互不影响，适用于对内存性能要求较高的应用场景。
热备模式：当一个内存模块出现故障时，热备内存模块会自动接管其工作，确保系统的正常运行，提高了系统的可靠性。
镜像模式：将数据同时写入两个内存模块，实现数据的镜像备份，进一步提高了数据的安全性和可靠性。

内存填入规则

不支持混合使用不同类型的 DMM（内存模块），以确保系统的稳定性和兼容性。
只支持 ECC DIMM，以提供更高的数据可靠性和错误纠正能力。
可以采用不同内存供应商的产品，但只采用联想认为合格的产品，以保证内存的质量和性能。
支持混合内存容量，但首先应安装更高容量的 DMM，以充分利用内存资源。
支持混合内存列，但首先在插槽 0 中安装更高的列，以优化内存的性能和稳定性。
只支持 2666DMM 的内存频率，以确保系统的兼容性和稳定性。
混合使用不同 DMM 时的填入优先级为：列 > 容量，即优先考虑内存列的配置，其次是内存容量。

GPU

GPU（图形处理器）主要由 MBC 芯片厂商信骅（aspeed）以及 AMD、英特尔、英伟达等厂商生产。

NVS：常用于 LED 广告屏等场景，具有较好的图形处理能力和显示效果。
SXM：没有独立的卡本体，GPU 芯片直接封装在主板上，适用于一些对空间要求较高的应用场景。
RTX 架构：由英伟达推出，广泛应用于图形渲染、游戏等领域，具有强大的图形处理能力和计算性能。
GEFORCE：英伟达的游戏卡产品线，专为游戏玩家和图形设计师设计，提供出色的图形性能和游戏体验。
A H 系列（tesla 特斯拉）：主要用于高性能计算和人工智能领域，但受到一些制裁。

网卡

网卡是服务器与网络连接的关键设备，常见的网卡品牌和型号包括：

英特尔：AX、AC 系列网卡，如 X722 板载网卡（LOM 卡），但不支持自适应功能；X710、X810、X820 等型号，具有较高的性能和稳定性。
Mellanox：cx4、cx5、cx6、cx7 等系列网卡，广泛应用于数据中心和高性能计算环境，具有低延迟、高带宽的特点。
NIC：即网络接口卡，是网卡的通用名称。
HBA：支持 FC 协议，具有光纤接口，常用于直通外接盘柜，实现高速数据传输。
HCA：即 IB 卡，可以串联服务器 GPU，提高系统的计算性能。

光口是网卡常见的接口类型，常见的光口规格包括：

SFP+：支持 GE（千兆以太网）和 10GB（万兆以太网）的传输速率。
SPF28：支持 GE、10GE 和 25GE 的传输速率。
QSFP：支持 GE、40GE 和 100GE 的传输速率。
最快的铜缆是 DAC 线缆，具有较高的传输速度和稳定性。

阵列卡

阵列卡用于协助 CPU 和主板对硬盘进行单独管理，提高硬盘的性能和可靠性。

license 授权：一些高级功能需要 license 授权才能使用，用户需要根据实际需求购买相应的授权。
ibbu 连接器和电池：ibbu 连接器用于连接阵列卡和电池，电池在异步模式下为缓存供电，确保数据在缓存处理过程中的安全性。此外，还有 super cap（超级电容）作为备用电源，提高系统的可靠性。
Whitler VROC：是 CPU 上面的英特尔虚拟 RAID，为虚拟的 RAID 解决方案，性能相对较弱（需要 CPU 分出算力），非英特尔的 nvme 设备需要授权才能使用。目前，windows 和 linux 操作系统支持 VROC，而 vmware ESXI 不支持。
430HBA：不带 raid 功能，仅支持直通卡 JBOD（Just A Bunch Of Disks），即将多个物理磁盘在逻辑上串联在一起，增加硬盘容量，但没有数据安全保护功能。
SAS 3408-3416-3408 芯片组：是阵列卡常用的芯片组，不同型号具有不同的性能和功能特点。
530、730、930：530 无缓存；730 配备 1GB 缓存；930 标配 2 - 4 闪存（ddr4）。其中，i 标志表示内部，e 表示外部。730 是中国特供卡，其前身为 M5210。
4350：性能相对较弱，适用于一些对性能要求不高的应用场景。

m.2KIT 卡卡托

m.2KIT 卡卡托支持多种 RAID 模式，包括 M.2 RAID、SATARAID、NVMERAID、STAT/NVMERAID 等，同时也支持 M.2 NORAID 模式（完全不支持 RAID，仅支持 sata 或 nvme 单盘）。

电源

电源是服务器正常运行的重要保障，其规格和性能直接影响服务器的稳定性和可靠性。

规格：常见的电源规格包括 ATX 和 PSU（服务器方形电源）。塔式服务器可以选择 ATX 和 PSU 电源，PSU 电源可以直接接在背板上供电，为服务器提供稳定的电力支持。
电源功率：服务器电源的功率根据服务器的配置和需求而定，不同的服务器型号需要不同功率的电源。
80PLUS 认证：该认证用于衡量电源在不同负载下的功率转换效率，认证等级越高，电源的效率越高，越节能。
电源指示灯
- AC：表示交流电源输入端，当电源接通时，AC 指示灯亮起。
- DC：表示直流电源输出端，为精密元器件供电，DC 指示灯亮起表示电源输出正常。
冗余特性：一些服务器配备了两个电源，实现冗余供电。当一个电源承载 500w 功率时，另一个电源的 AC 指示灯会闪烁，以提示管理员电源的工作状态。当一个电源出现故障时，另一个电源可以继续为服务器供电，确保服务器的正常运行。

风扇

风扇用于为服务器散热，保持服务器内部的温度在合理范围内，确保服务器的稳定运行。服务器风扇通常具有智能调速功能，可以根据服务器的负载和温度自动调节转速，提高散热效率并降低噪音。

可信计算

可信计算是一种保障计算机系统安全的技术，通过 TPM（可信平台模块）和 TCM（中国可信密码模块，类似于 cfc 的 TPM）实现。联想公认的操作系统包括 windows、redhat、suse、vmware、openstart、xenserver、麒麟等。其中，vmwaer 操作系统需要官方授权和联想授权才能使用。联想对操作系统的支持定义为：受支持（操作系统能够正常运行并获得联想的技术支持）、通过认证（操作系统经过联想的严格测试和认证，确保与服务器的兼容性和稳定性）。

磁盘阵列

磁盘阵列技术详解

一、核心概念

磁盘阵列系统由物理盘和逻辑盘组成：

物理盘：实际存在的存储介质（如 HDD/SSD）
逻辑盘：操作系统可见的虚拟存储设备（即 VD 虚拟阵列盘）

二、基础存储模式

1. JBOD（Just A Bunch Of Disks）

技术原理：将多个物理磁盘以直连方式逻辑串联
核心特性：
✓ 线性扩展存储容量
✓ 无冗余保护机制
✓ 单盘故障不影响其他磁盘
适用场景：纯容量扩展需求，对数据安全无要求

2. RAID（Redundant Array of Independent Disks）

技术定义：通过条带化技术将多块磁盘整合成单一虚拟磁盘
核心价值：
✓ 提升数据访问性能
✓ 提供冗余容错能力
✓ 突破单盘容量限制

三、关键技术解析

1. 条带化（Spanning）

技术实现：数据按固定块大小分布在多个磁盘
技术优势：
✓ 并行读写提升 IOPS
✓ 突破单盘容量限制
技术局限：
✗ 无数据保护机制
✗ 单盘故障导致数据丢失

2. 奇偶校验（Parity）

技术原理：通过异或运算生成校验数据
典型应用：
✓ RAID5：单盘容错
✓ RAID6：双盘容错
运算规则：A ⊕ B = C，其中 C 为校验值

3. 镜像技术（Mirroring）

技术实现：数据同时写入两个磁盘
典型应用：RAID1
故障处理：
✓ 单盘故障时进入降级模式
✓ 替换新盘后自动重建数据

四、主流 RAID 级别对比

级别	容错能力	冗余类型	最小盘数	可用空间	适用场景
0	无	无	1+	100%	高性能无保护场景
1	单盘	镜像	2	50%	关键数据保护
5	单盘	校验	3	(N-1)/N	平衡性能与成本场景
6	双盘	双重校验	4	(N-2)/N	高可靠性需求场景
10	多盘	镜像 + 条带	4	50%	高性能高可靠场景
50	多盘	校验 + 条带	6	(N-2)/N	企业级存储阵列

五、关键技术细节

RAID0 特殊应用：支持单盘配置（无冗余），用于纯性能加速
重建过程：故障盘替换后，系统自动同步数据，期间性能下降约 30%
写惩罚：RAID5/6 写入时需计算校验值，导致约 30% 性能损耗
混合模式：RAID10=RAID1+RAID0，兼具高性能与高可靠性

RAID级别	RAIDO	RAID1	RAID5	RAID6	RAID10	RAID50
容错性	无	有	有	有	有	很高
冗余类型	无	镜像	奇偶校验	奇偶校验	镜像冗余	奇偶较验
备份盘	无	有	有	有	有	有
读性能	高	低	高	高	普通	高
随机写性能	高	低	低	低	普通	低
连续写性能	高	低	低	低	普通	低
最少磁盘数	2个	2个	3个	4个	4个	6个
可用空间	100%	50%	(N-1)/N	(N-2)/N	50%	(N-2)/N