服务器基础知识
服务器技术基础
服务器是通过网络对外提供够高性能 高可用的计算机
服务器分类
服务器的四种类型
服务器就像不同款式的电脑主机,根据外形和功能分为四大类:
-
塔式服务器
👉 像普通电脑主机一样独立放置,体积较大
✨ 优点:方便升级硬件(加硬盘 / 内存)
📌 适合:小公司或不需要太多设备的场景
缺点: -
机架式服务器
👉 安装在标准机柜里的扁平主机(类似抽屉)
✨ 优点:省空间,适合集中管理
📌 常见规格:- 1U(约 4.445 厘米高):最多装 4-8 块小硬盘
- 2U(约 8.89 厘米高):最多装 8-24 块小硬盘
-
刀片式服务器
👉 像插卡片一样集中安装在机箱里
✨ 优点:省空间,适合同时处理大量数据
📌 适合:云计算、大数据中心等需要高算力的场景 -
高密度服务器
👉 把很多电脑组件塞进更小的空间
✨ 优点:单位面积算力最强
📌 适合:对空间和性能要求极高的场景
服务器的关键特性
-
高可用性(7×24 小时不罢工)
✅ 技能:自动恢复故障,全年无休
🔧 原理:心跳检测 + 快速重启机制
🌰 场景:电商大促时网站不崩溃 -
高可靠性(带病坚持工作)
✅ 技能:关键部件双备份
🔧 原理:冗余电源 / 硬盘 / 网络
🌰 场景:银行系统单硬盘损坏仍能运行 -
可扩展性(随时升级装备)
✅ 技能:按需添加硬件
🔧 原理:模块化设计
🌰 操作:插入新硬盘 / 内存 / CPU -
可管理性(远程操控大师)
✅ 技能:千里之外掌控全局
🔧 工具:BMC 管理系统
🌰 功能:手机查看服务器温度 / 远程重装系统
BMC 管理控制器(物理)
BMC(Baseboard Management Controller)即基板管理控制器,遵循 IPMI 2.0 规范,实现了系统硬件健康状况的远程监控和管理。
- 带外管理:BMC 拥有独立的系统(两颗核心),控制数据和业务数据相互分离。即使业务网络中断或系统宕机,只要设备有电,就可以通过独立的通道进行管理。管理员可以对系统进行远程开机关机操作,查看硬件的状态,如温度、风扇转速、电压等。
- 带内管理:设备管理网络和业务网络使用同一个网络链路,主要用于对系统内部进行操作,如安装软件、配置服务、配置网络参数等。
- xcc:ThinkSystem 系列服务器的 web 控制管理程序,可提供远程控制台、镜像挂载远程操作功能,便于远程进行服务器安装、维护等操作,大大提高了管理的便捷性。
主板
主板(Motherboard),又称为母板,是整个服务器系统的核心载体,承载着 CPU、内存、扩展卡等关键组件的安装和管理。主板的性能在很大程度上决定了整个系统的性能表现,其稳定性和兼容性对于服务器的正常运行至关重要。
- BIOS(基本输入输出系统):BIOS 是主板控制芯片的底层控制程序,存储在 ROM(只读存储器)中,不会丢失。它负责在计算机启动时初始化硬件设备、检测硬件故障并加载操作系统。与之相对的是 RAM(随机存取存储器),如果长时间不用,BIOS 数据可能会丢失,此时开机就会直接进入 BIOS 界面。
- UEFI & EFI:UEFI(统一可扩展固件接口)是优化升级之后的 BIOS,具有更高的处理效率。而 EFI(可扩展固件接口)处理效率相对较低。在一些特殊情况下,如系统维护和故障排除时,会用到 PE(便携式操作系统)和 LIVE CD(救援模式,标准系统环境)。
- MT:是产品线内部命名,用于标识服务器的类型,方便生产和管理。
- SN:即序列号,是设备的唯一编码,也是保修编码。通过序列号可以查询设备的保修日期、配置等详细信息,便于设备的维护和管理。
- VGA:是一种免驱的模拟信号接口,由于志强处理器不支持集显,所以服务器的 VGA 功能由 BMC 控制,主板本身不自带。
- LOM 插槽:用于安装板载网卡,自带 OCP热插拔功能(但不建议频繁热插拔)。板载网卡的英文缩写为 NIC(Network Interface Card)。
- NMI 接口:即强制中断接口,用于生成错误日志。但使用该接口可能会导致数据丢失或系统无法开机,一般不建议使用。
- PCIE:即拓展卡,又名 RiSER 卡。PCIE 接口的传输速率不断提升,从 PCIE 1.0 的 2.5GHz 发展到 PCIE 5.0 的 32GHz。常见的插槽规格有 x2、x4、x8、x16,不同规格的插槽支持的带宽和性能也有所不同。
前置灯
服务器前置灯用于显示服务器的运行状态,方便管理员进行监控和故障排查。
- 电源灯:通电即亮,根据不同的闪烁状态(常亮、闪烁、快闪)表示不同的电源状态。
- 系统 ID 按钮:用于在多台服务器中定位特定的服务器,方便维护和管理。
- 网络灯:显示板载网卡的网络连接状态,如连接、断开、数据传输等。
- 错误灯:当系统出现问题时亮起,提示管理员服务器存在故障,需要进行检查和修复。
硬盘
硬盘是服务器存储数据的重要设备,常见的硬盘类型包括 2.5 寸的机械盘、固态盘(HDD、SSD)和 3.5 寸的机械盘(部分采用叠瓦技术)。此外,还有硬盘转接卡 KIT、直通盘 - jbod、HDD SED 加密盘等特殊类型的硬盘设备。
- 接口类型:常见的硬盘接口包括 SATA/NL SAS、SAS、M.2、PCIE、FC、SCSI、ATA/IDE 等。不同的接口类型具有不同的传输速度和性能特点,用户可根据需求选择合适的接口。
- 外观类型
- 条 M.2:最大容量可达 3.84TB,具有体积小、传输速度快等优点。
- 卡 AIC:容量可达 7.68TB,适用于一些对性能要求较高的应用场景。
- 盘 U.2:容量最大可达 30TB,常用于数据中心和大型服务器。
- 短条 E1.S:容量为 7.68TB,具有较高的密度和性能。
- 尺子 E1.L:容量可达 30T,适用于需要大量存储的应用场景。
- 硬盘指标:硬盘的性能指标主要包括硬盘容量、转速、平均访问时间和传输速率。这些指标直接影响硬盘的读写速度和数据存储能力。
- 规格:以 m.2 硬盘为例,常见的规格有 2242、2280、2110 等,不同规格的硬盘适用于不同的设备和应用场景。
- 速率:SATA 接口的速率从 SATA 1.0 的 1.5Gbit 发展到 SATA 3.0 的 6Gbit,而 SAS 3.0 接口的速率为 12Gbit,具有更好的扩展性和更快的传输速度,并且 SAS 接口兼容 SATA 接口。
CPU
CPU(中央处理器)是服务器的核心组件,其性能直接决定了服务器的计算能力。目前,英特尔的 CPU 型号通过铂金、金、银、铜牌来区分性能等级,
其中 3 代表铜牌,
4 代表银牌,
5、6 代表金牌,
8、9 代表铂金。
第二位数字表示处理器代数,
第三、四位数字表示不同的产品型号。
CPU 通过 DMI 总线、I/O 总线、upi、qpi 等与主板芯片组进行通信。IPMITOO 是一种命令行协议,用于远程管理服务器;ONECLI 是联想特有的管理工具,方便用户对服务器进行配置和管理。
- 缓存(Cache):缓存是位于 CPU 和内存之间的临时存储器,分为 1、2、3 级缓存。其中,L1 缓存速度最快,L3 缓存容量最大。缓存的存在可以提高 CPU 访问数据的速度,减少数据读取时间,从而提高整个系统的性能。
内存
内存是服务器运行时存储数据和程序的重要组件,其性能对服务器的运行速度和响应能力有着重要影响。
- 介绍
- 容量:常见的内存容量有 4GB、8GB、16GB、32GB、64GB、128GB、512GB 等,用户可根据服务器的应用需求选择合适的容量。
- 电压:随着技术的发展,内存电压逐渐降低,从 DDR1 的 2.5V,到 DDR2 的 1.8V,DDR3 的 1.5V,DDR4 的 1.2V,再到 DDR5 的 1.1V。较低的电压可以降低功耗,提高内存的稳定性。
- 频率:内存的频率从 1333MHz 发展到 3200MHz 及以上,频率越高,内存的数据传输速度越快,系统性能也越好。主流的内存厂商包括三星、海力士、镁光、记忆等。
- 分类:内存可分为动态随机存取 DRAM 和静态随机存取 SRAM。目前,主流的内存类型为 DDR4 和 DDR5,其中 DDR4 支持 2133 - 3600 频率,DDR5 支持 3600 频率以上。
- 动态随机存取 DRAM:根据不同的技术和应用场景,DRAM 可分为 DIMM、URDIMM 和 LRDIMM。其中,ecc 内存(带有校验颗粒 Registered,条上写有 RE 标识)和非 ecc 内存的主要区别在于 ecc 内存具有差错校验机制,能够在出现错误时纠正错误。每 8bit 数据可以纠正一次 1bit 错误,之后会重启系统以确保数据的准确性。LRDIMM 的数据和地址控制信号都经过校验颗粒,具有更高的稳定性和可靠性。
服务器内存三种模式
- 独立模式:每个内存模块独立工作,互不影响,适用于对内存性能要求较高的应用场景。
- 热备模式:当一个内存模块出现故障时,热备内存模块会自动接管其工作,确保系统的正常运行,提高了系统的可靠性。
- 镜像模式:将数据同时写入两个内存模块,实现数据的镜像备份,进一步提高了数据的安全性和可靠性。
内存填入规则
- 不支持混合使用不同类型的 DMM(内存模块),以确保系统的稳定性和兼容性。
- 只支持 ECC DIMM,以提供更高的数据可靠性和错误纠正能力。
- 可以采用不同内存供应商的产品,但只采用联想认为合格的产品,以保证内存的质量和性能。
- 支持混合内存容量,但首先应安装更高容量的 DMM,以充分利用内存资源。
- 支持混合内存列,但首先在插槽 0 中安装更高的列,以优化内存的性能和稳定性。
- 只支持 2666DMM 的内存频率,以确保系统的兼容性和稳定性。
- 混合使用不同 DMM 时的填入优先级为:列 > 容量,即优先考虑内存列的配置,其次是内存容量。
GPU
GPU(图形处理器)主要由 MBC 芯片厂商信骅(aspeed)以及 AMD、英特尔、英伟达等厂商生产。
- NVS:常用于 LED 广告屏等场景,具有较好的图形处理能力和显示效果。
- SXM:没有独立的卡本体,GPU 芯片直接封装在主板上,适用于一些对空间要求较高的应用场景。
- RTX 架构:由英伟达推出,广泛应用于图形渲染、游戏等领域,具有强大的图形处理能力和计算性能。
- GEFORCE:英伟达的游戏卡产品线,专为游戏玩家和图形设计师设计,提供出色的图形性能和游戏体验。
- A H 系列(tesla 特斯拉):主要用于高性能计算和人工智能领域,但受到一些制裁。
网卡
网卡是服务器与网络连接的关键设备,常见的网卡品牌和型号包括:
-
英特尔:AX、AC 系列网卡,如 X722 板载网卡(LOM 卡),但不支持自适应功能;X710、X810、X820 等型号,具有较高的性能和稳定性。
-
Mellanox:cx4、cx5、cx6、cx7 等系列网卡,广泛应用于数据中心和高性能计算环境,具有低延迟、高带宽的特点。
-
NIC:即网络接口卡,是网卡的通用名称。
-
HBA:支持 FC 协议,具有光纤接口,常用于直通外接盘柜,实现高速数据传输。
-
HCA:即 IB 卡,可以串联服务器 GPU,提高系统的计算性能。
光口是网卡常见的接口类型,常见的光口规格包括:
- SFP+:支持 GE(千兆以太网)和 10GB(万兆以太网)的传输速率。
- SPF28:支持 GE、10GE 和 25GE 的传输速率。
- QSFP:支持 GE、40GE 和 100GE 的传输速率。
最快的铜缆是 DAC 线缆,具有较高的传输速度和稳定性。
阵列卡
阵列卡用于协助 CPU 和主板对硬盘进行单独管理,提高硬盘的性能和可靠性。
- license 授权:一些高级功能需要 license 授权才能使用,用户需要根据实际需求购买相应的授权。
- ibbu 连接器和电池:ibbu 连接器用于连接阵列卡和电池,电池在异步模式下为缓存供电,确保数据在缓存处理过程中的安全性。此外,还有 super cap(超级电容)作为备用电源,提高系统的可靠性。
- Whitler VROC:是 CPU 上面的英特尔虚拟 RAID,为虚拟的 RAID 解决方案,性能相对较弱(需要 CPU 分出算力),非英特尔的 nvme 设备需要授权才能使用。目前,windows 和 linux 操作系统支持 VROC,而 vmware ESXI 不支持。
- 430HBA:不带 raid 功能,仅支持直通卡 JBOD(Just A Bunch Of Disks),即将多个物理磁盘在逻辑上串联在一起,增加硬盘容量,但没有数据安全保护功能。
- SAS 3408-3416-3408 芯片组:是阵列卡常用的芯片组,不同型号具有不同的性能和功能特点。
- 530、730、930:530 无缓存;730 配备 1GB 缓存;930 标配 2 - 4 闪存(ddr4)。其中,i 标志表示内部,e 表示外部。730 是中国特供卡,其前身为 M5210。
- 4350:性能相对较弱,适用于一些对性能要求不高的应用场景。
m.2KIT 卡卡托
m.2KIT 卡卡托支持多种 RAID 模式,包括 M.2 RAID、SATARAID、NVMERAID、STAT/NVMERAID 等,同时也支持 M.2 NORAID 模式(完全不支持 RAID,仅支持 sata 或 nvme 单盘)。
电源
电源是服务器正常运行的重要保障,其规格和性能直接影响服务器的稳定性和可靠性。
- 规格:常见的电源规格包括 ATX 和 PSU(服务器方形电源)。塔式服务器可以选择 ATX 和 PSU 电源,PSU 电源可以直接接在背板上供电,为服务器提供稳定的电力支持。
- 电源功率:服务器电源的功率根据服务器的配置和需求而定,不同的服务器型号需要不同功率的电源。
- 80PLUS 认证:该认证用于衡量电源在不同负载下的功率转换效率,认证等级越高,电源的效率越高,越节能。
- 电源指示灯
- AC:表示交流电源输入端,当电源接通时,AC 指示灯亮起。
- DC:表示直流电源输出端,为精密元器件供电,DC 指示灯亮起表示电源输出正常。
- 冗余特性:一些服务器配备了两个电源,实现冗余供电。当一个电源承载 500w 功率时,另一个电源的 AC 指示灯会闪烁,以提示管理员电源的工作状态。当一个电源出现故障时,另一个电源可以继续为服务器供电,确保服务器的正常运行。
风扇
风扇用于为服务器散热,保持服务器内部的温度在合理范围内,确保服务器的稳定运行。服务器风扇通常具有智能调速功能,可以根据服务器的负载和温度自动调节转速,提高散热效率并降低噪音。
可信计算
可信计算是一种保障计算机系统安全的技术,通过 TPM(可信平台模块)和 TCM(中国可信密码模块,类似于 cfc 的 TPM)实现。联想公认的操作系统包括 windows、redhat、suse、vmware、openstart、xenserver、麒麟等。其中,vmwaer 操作系统需要官方授权和联想授权才能使用。联想对操作系统的支持定义为:受支持(操作系统能够正常运行并获得联想的技术支持)、通过认证(操作系统经过联想的严格测试和认证,确保与服务器的兼容性和稳定性)。
磁盘阵列
磁盘阵列技术详解
一、核心概念
磁盘阵列系统由物理盘和逻辑盘组成:
- 物理盘:实际存在的存储介质(如 HDD/SSD)
- 逻辑盘:操作系统可见的虚拟存储设备(即 VD 虚拟阵列盘)
二、基础存储模式
1. JBOD(Just A Bunch Of Disks)
- 技术原理:将多个物理磁盘以直连方式逻辑串联
- 核心特性:
✓ 线性扩展存储容量
✓ 无冗余保护机制
✓ 单盘故障不影响其他磁盘 - 适用场景:纯容量扩展需求,对数据安全无要求
2. RAID(Redundant Array of Independent Disks)
- 技术定义:通过条带化技术将多块磁盘整合成单一虚拟磁盘
- 核心价值:
✓ 提升数据访问性能
✓ 提供冗余容错能力
✓ 突破单盘容量限制
三、关键技术解析
1. 条带化(Spanning)
- 技术实现:数据按固定块大小分布在多个磁盘
- 技术优势:
✓ 并行读写提升 IOPS
✓ 突破单盘容量限制 - 技术局限:
✗ 无数据保护机制
✗ 单盘故障导致数据丢失
2. 奇偶校验(Parity)
- 技术原理:通过异或运算生成校验数据
- 典型应用:
✓ RAID5:单盘容错
✓ RAID6:双盘容错 - 运算规则:
A ⊕ B = C
,其中 C 为校验值
3. 镜像技术(Mirroring)
- 技术实现:数据同时写入两个磁盘
- 典型应用:RAID1
- 故障处理:
✓ 单盘故障时进入降级模式
✓ 替换新盘后自动重建数据
四、主流 RAID 级别对比
级别 | 容错能力 | 冗余类型 | 最小盘数 | 可用空间 | 适用场景 |
---|---|---|---|---|---|
0 | 无 | 无 | 1+ | 100% | 高性能无保护场景 |
1 | 单盘 | 镜像 | 2 | 50% | 关键数据保护 |
5 | 单盘 | 校验 | 3 | (N-1)/N | 平衡性能与成本场景 |
6 | 双盘 | 双重校验 | 4 | (N-2)/N | 高可靠性需求场景 |
10 | 多盘 | 镜像 + 条带 | 4 | 50% | 高性能高可靠场景 |
50 | 多盘 | 校验 + 条带 | 6 | (N-2)/N | 企业级存储阵列 |
五、关键技术细节
- RAID0 特殊应用:支持单盘配置(无冗余),用于纯性能加速
- 重建过程:故障盘替换后,系统自动同步数据,期间性能下降约 30%
- 写惩罚:RAID5/6 写入时需计算校验值,导致约 30% 性能损耗
- 混合模式:RAID10=RAID1+RAID0,兼具高性能与高可靠性
RAID级别 | RAIDO | RAID1 | RAID5 | RAID6 | RAID10 | RAID50 |
---|---|---|---|---|---|---|
容错性 | 无 | 有 | 有 | 有 | 有 | 很高 |
冗余类型 | 无 | 镜像 | 奇偶校验 | 奇偶校验 | 镜像冗余 | 奇偶较验 |
备份盘 | 无 | 有 | 有 | 有 | 有 | 有 |
读性能 | 高 | 低 | 高 | 高 | 普通 | 高 |
随机写性能 | 高 | 低 | 低 | 低 | 普通 | 低 |
连续写性能 | 高 | 低 | 低 | 低 | 普通 | 低 |
最少磁盘数 | 2个 | 2个 | 3个 | 4个 | 4个 | 6个 |
可用空间 | 100% | 50% | (N-1)/N | (N-2)/N | 50% | (N-2)/N |