服务器技术基础

服务器是通过网络对外提供够高性能 高可用的计算机

服务器分类

服务器的四种类型

服务器就像不同款式的电脑主机,根据外形和功能分为四大类:

  1. 塔式服务器
    👉 像普通电脑主机一样独立放置,体积较大
    ✨ 优点:方便升级硬件(加硬盘 / 内存)
    📌 适合:小公司或不需要太多设备的场景
    缺点:

  2. 机架式服务器
    👉 安装在标准机柜里的扁平主机(类似抽屉)
    ✨ 优点:省空间,适合集中管理
    📌 常见规格:

    • 1U(约 4.445 厘米高):最多装 4-8 块小硬盘
    • 2U(约 8.89 厘米高):最多装 8-24 块小硬盘
  3. 刀片式服务器
    👉 像插卡片一样集中安装在机箱里
    ✨ 优点:省空间,适合同时处理大量数据
    📌 适合:云计算、大数据中心等需要高算力的场景

  4. 高密度服务器
    👉 把很多电脑组件塞进更小的空间
    ✨ 优点:单位面积算力最强
    📌 适合:对空间和性能要求极高的场景

服务器的关键特性

  1. 高可用性(7×24 小时不罢工)
    ✅ 技能:自动恢复故障,全年无休
    🔧 原理:心跳检测 + 快速重启机制
    🌰 场景:电商大促时网站不崩溃

  2. 高可靠性(带病坚持工作)
    ✅ 技能:关键部件双备份
    🔧 原理:冗余电源 / 硬盘 / 网络
    🌰 场景:银行系统单硬盘损坏仍能运行

  3. 可扩展性(随时升级装备)
    ✅ 技能:按需添加硬件
    🔧 原理:模块化设计
    🌰 操作:插入新硬盘 / 内存 / CPU

  4. 可管理性(远程操控大师)
    ✅ 技能:千里之外掌控全局
    🔧 工具:BMC 管理系统
    🌰 功能:手机查看服务器温度 / 远程重装系统

BMC 管理控制器(物理)

BMC(Baseboard Management Controller)即基板管理控制器,遵循 IPMI 2.0 规范,实现了系统硬件健康状况的远程监控和管理。

  1. 带外管理:BMC 拥有独立的系统(两颗核心),控制数据和业务数据相互分离。即使业务网络中断或系统宕机,只要设备有电,就可以通过独立的通道进行管理。管理员可以对系统进行远程开机关机操作,查看硬件的状态,如温度、风扇转速、电压等。
  2. 带内管理:设备管理网络和业务网络使用同一个网络链路,主要用于对系统内部进行操作,如安装软件、配置服务、配置网络参数等。
  3. xcc:ThinkSystem 系列服务器的 web 控制管理程序,可提供远程控制台、镜像挂载远程操作功能,便于远程进行服务器安装、维护等操作,大大提高了管理的便捷性。

主板

主板(Motherboard),又称为母板,是整个服务器系统的核心载体,承载着 CPU、内存、扩展卡等关键组件的安装和管理。主板的性能在很大程度上决定了整个系统的性能表现,其稳定性和兼容性对于服务器的正常运行至关重要。

  1. BIOS(基本输入输出系统):BIOS 是主板控制芯片的底层控制程序,存储在 ROM(只读存储器)中,不会丢失。它负责在计算机启动时初始化硬件设备、检测硬件故障并加载操作系统。与之相对的是 RAM(随机存取存储器),如果长时间不用,BIOS 数据可能会丢失,此时开机就会直接进入 BIOS 界面。
  2. UEFI & EFI:UEFI(统一可扩展固件接口)是优化升级之后的 BIOS,具有更高的处理效率。而 EFI(可扩展固件接口)处理效率相对较低。在一些特殊情况下,如系统维护和故障排除时,会用到 PE(便携式操作系统)和 LIVE CD(救援模式,标准系统环境)。
  3. MT:是产品线内部命名,用于标识服务器的类型,方便生产和管理。
  4. SN:即序列号,是设备的唯一编码,也是保修编码。通过序列号可以查询设备的保修日期、配置等详细信息,便于设备的维护和管理。
  5. VGA:是一种免驱的模拟信号接口,由于志强处理器不支持集显,所以服务器的 VGA 功能由 BMC 控制,主板本身不自带。
  6. LOM 插槽:用于安装板载网卡,自带 OCP热插拔功能(但不建议频繁热插拔)。板载网卡的英文缩写为 NIC(Network Interface Card)。
  7. NMI 接口:即强制中断接口,用于生成错误日志。但使用该接口可能会导致数据丢失或系统无法开机,一般不建议使用。
  8. PCIE:即拓展卡,又名 RiSER 卡。PCIE 接口的传输速率不断提升,从 PCIE 1.0 的 2.5GHz 发展到 PCIE 5.0 的 32GHz。常见的插槽规格有 x2、x4、x8、x16,不同规格的插槽支持的带宽和性能也有所不同。

前置灯

服务器前置灯用于显示服务器的运行状态,方便管理员进行监控和故障排查。

  1. 电源灯:通电即亮,根据不同的闪烁状态(常亮、闪烁、快闪)表示不同的电源状态。
  2. 系统 ID 按钮:用于在多台服务器中定位特定的服务器,方便维护和管理。
  3. 网络灯:显示板载网卡的网络连接状态,如连接、断开、数据传输等。
  4. 错误灯:当系统出现问题时亮起,提示管理员服务器存在故障,需要进行检查和修复。

硬盘

硬盘是服务器存储数据的重要设备,常见的硬盘类型包括 2.5 寸的机械盘、固态盘(HDD、SSD)和 3.5 寸的机械盘(部分采用叠瓦技术)。此外,还有硬盘转接卡 KIT、直通盘 - jbod、HDD SED 加密盘等特殊类型的硬盘设备。

  1. 接口类型:常见的硬盘接口包括 SATA/NL SAS、SAS、M.2、PCIE、FC、SCSI、ATA/IDE 等。不同的接口类型具有不同的传输速度和性能特点,用户可根据需求选择合适的接口。
  2. 外观类型
    • 条 M.2:最大容量可达 3.84TB,具有体积小、传输速度快等优点。
    • 卡 AIC:容量可达 7.68TB,适用于一些对性能要求较高的应用场景。
    • 盘 U.2:容量最大可达 30TB,常用于数据中心和大型服务器。
    • 短条 E1.S:容量为 7.68TB,具有较高的密度和性能。
    • 尺子 E1.L:容量可达 30T,适用于需要大量存储的应用场景。
  3. 硬盘指标:硬盘的性能指标主要包括硬盘容量、转速、平均访问时间和传输速率。这些指标直接影响硬盘的读写速度和数据存储能力。
  4. 规格:以 m.2 硬盘为例,常见的规格有 2242、2280、2110 等,不同规格的硬盘适用于不同的设备和应用场景。
  5. 速率:SATA 接口的速率从 SATA 1.0 的 1.5Gbit 发展到 SATA 3.0 的 6Gbit,而 SAS 3.0 接口的速率为 12Gbit,具有更好的扩展性和更快的传输速度,并且 SAS 接口兼容 SATA 接口。

CPU

CPU(中央处理器)是服务器的核心组件,其性能直接决定了服务器的计算能力。目前,英特尔的 CPU 型号通过铂金、金、银、铜牌来区分性能等级,
其中 3 代表铜牌,
4 代表银牌,
5、6 代表金牌,
8、9 代表铂金。
第二位数字表示处理器代数,
第三、四位数字表示不同的产品型号。

CPU 通过 DMI 总线、I/O 总线、upi、qpi 等与主板芯片组进行通信。IPMITOO 是一种命令行协议,用于远程管理服务器;ONECLI 是联想特有的管理工具,方便用户对服务器进行配置和管理。

  1. 缓存(Cache):缓存是位于 CPU 和内存之间的临时存储器,分为 1、2、3 级缓存。其中,L1 缓存速度最快,L3 缓存容量最大。缓存的存在可以提高 CPU 访问数据的速度,减少数据读取时间,从而提高整个系统的性能。

内存

内存是服务器运行时存储数据和程序的重要组件,其性能对服务器的运行速度和响应能力有着重要影响。

  1. 介绍
    • 容量:常见的内存容量有 4GB、8GB、16GB、32GB、64GB、128GB、512GB 等,用户可根据服务器的应用需求选择合适的容量。
    • 电压:随着技术的发展,内存电压逐渐降低,从 DDR1 的 2.5V,到 DDR2 的 1.8V,DDR3 的 1.5V,DDR4 的 1.2V,再到 DDR5 的 1.1V。较低的电压可以降低功耗,提高内存的稳定性。
    • 频率:内存的频率从 1333MHz 发展到 3200MHz 及以上,频率越高,内存的数据传输速度越快,系统性能也越好。主流的内存厂商包括三星、海力士、镁光、记忆等。
  2. 分类:内存可分为动态随机存取 DRAM 和静态随机存取 SRAM。目前,主流的内存类型为 DDR4 和 DDR5,其中 DDR4 支持 2133 - 3600 频率,DDR5 支持 3600 频率以上。
  3. 动态随机存取 DRAM:根据不同的技术和应用场景,DRAM 可分为 DIMM、URDIMM 和 LRDIMM。其中,ecc 内存(带有校验颗粒 Registered,条上写有 RE 标识)和非 ecc 内存的主要区别在于 ecc 内存具有差错校验机制,能够在出现错误时纠正错误。每 8bit 数据可以纠正一次 1bit 错误,之后会重启系统以确保数据的准确性。LRDIMM 的数据和地址控制信号都经过校验颗粒,具有更高的稳定性和可靠性。

服务器内存三种模式

  1. 独立模式:每个内存模块独立工作,互不影响,适用于对内存性能要求较高的应用场景。
  2. 热备模式:当一个内存模块出现故障时,热备内存模块会自动接管其工作,确保系统的正常运行,提高了系统的可靠性。
  3. 镜像模式:将数据同时写入两个内存模块,实现数据的镜像备份,进一步提高了数据的安全性和可靠性。

内存填入规则

  1. 不支持混合使用不同类型的 DMM(内存模块),以确保系统的稳定性和兼容性。
  2. 只支持 ECC DIMM,以提供更高的数据可靠性和错误纠正能力。
  3. 可以采用不同内存供应商的产品,但只采用联想认为合格的产品,以保证内存的质量和性能。
  4. 支持混合内存容量,但首先应安装更高容量的 DMM,以充分利用内存资源。
  5. 支持混合内存列,但首先在插槽 0 中安装更高的列,以优化内存的性能和稳定性。
  6. 只支持 2666DMM 的内存频率,以确保系统的兼容性和稳定性。
  7. 混合使用不同 DMM 时的填入优先级为:列 > 容量,即优先考虑内存列的配置,其次是内存容量。

GPU

GPU(图形处理器)主要由 MBC 芯片厂商信骅(aspeed)以及 AMD、英特尔、英伟达等厂商生产。

  1. NVS:常用于 LED 广告屏等场景,具有较好的图形处理能力和显示效果。
  2. SXM:没有独立的卡本体,GPU 芯片直接封装在主板上,适用于一些对空间要求较高的应用场景。
  3. RTX 架构:由英伟达推出,广泛应用于图形渲染、游戏等领域,具有强大的图形处理能力和计算性能。
  4. GEFORCE:英伟达的游戏卡产品线,专为游戏玩家和图形设计师设计,提供出色的图形性能和游戏体验。
  5. A H 系列(tesla 特斯拉):主要用于高性能计算和人工智能领域,但受到一些制裁。

网卡

网卡是服务器与网络连接的关键设备,常见的网卡品牌和型号包括:

  1. 英特尔:AX、AC 系列网卡,如 X722 板载网卡(LOM 卡),但不支持自适应功能;X710、X810、X820 等型号,具有较高的性能和稳定性。

  2. Mellanox:cx4、cx5、cx6、cx7 等系列网卡,广泛应用于数据中心和高性能计算环境,具有低延迟、高带宽的特点。

  3. NIC:即网络接口卡,是网卡的通用名称。

  4. HBA:支持 FC 协议,具有光纤接口,常用于直通外接盘柜,实现高速数据传输。

  5. HCA:即 IB 卡,可以串联服务器 GPU,提高系统的计算性能。

光口是网卡常见的接口类型,常见的光口规格包括:

  1. SFP+:支持 GE(千兆以太网)和 10GB(万兆以太网)的传输速率。
  2. SPF28:支持 GE、10GE 和 25GE 的传输速率。
  3. QSFP:支持 GE、40GE 和 100GE 的传输速率。
    最快的铜缆是 DAC 线缆,具有较高的传输速度和稳定性。

阵列卡

阵列卡用于协助 CPU 和主板对硬盘进行单独管理,提高硬盘的性能和可靠性。

  1. license 授权:一些高级功能需要 license 授权才能使用,用户需要根据实际需求购买相应的授权。
  2. ibbu 连接器和电池:ibbu 连接器用于连接阵列卡和电池,电池在异步模式下为缓存供电,确保数据在缓存处理过程中的安全性。此外,还有 super cap(超级电容)作为备用电源,提高系统的可靠性。
  3. Whitler VROC:是 CPU 上面的英特尔虚拟 RAID,为虚拟的 RAID 解决方案,性能相对较弱(需要 CPU 分出算力),非英特尔的 nvme 设备需要授权才能使用。目前,windows 和 linux 操作系统支持 VROC,而 vmware ESXI 不支持。
  4. 430HBA:不带 raid 功能,仅支持直通卡 JBOD(Just A Bunch Of Disks),即将多个物理磁盘在逻辑上串联在一起,增加硬盘容量,但没有数据安全保护功能。
  5. SAS 3408-3416-3408 芯片组:是阵列卡常用的芯片组,不同型号具有不同的性能和功能特点。
  6. 530、730、930:530 无缓存;730 配备 1GB 缓存;930 标配 2 - 4 闪存(ddr4)。其中,i 标志表示内部,e 表示外部。730 是中国特供卡,其前身为 M5210。
  7. 4350:性能相对较弱,适用于一些对性能要求不高的应用场景。

m.2KIT 卡卡托

m.2KIT 卡卡托支持多种 RAID 模式,包括 M.2 RAID、SATARAID、NVMERAID、STAT/NVMERAID 等,同时也支持 M.2 NORAID 模式(完全不支持 RAID,仅支持 sata 或 nvme 单盘)。

电源

电源是服务器正常运行的重要保障,其规格和性能直接影响服务器的稳定性和可靠性。

  1. 规格:常见的电源规格包括 ATX 和 PSU(服务器方形电源)。塔式服务器可以选择 ATX 和 PSU 电源,PSU 电源可以直接接在背板上供电,为服务器提供稳定的电力支持。
  2. 电源功率:服务器电源的功率根据服务器的配置和需求而定,不同的服务器型号需要不同功率的电源。
  3. 80PLUS 认证:该认证用于衡量电源在不同负载下的功率转换效率,认证等级越高,电源的效率越高,越节能。
  4. 电源指示灯
    • AC:表示交流电源输入端,当电源接通时,AC 指示灯亮起。
    • DC:表示直流电源输出端,为精密元器件供电,DC 指示灯亮起表示电源输出正常。
  5. 冗余特性:一些服务器配备了两个电源,实现冗余供电。当一个电源承载 500w 功率时,另一个电源的 AC 指示灯会闪烁,以提示管理员电源的工作状态。当一个电源出现故障时,另一个电源可以继续为服务器供电,确保服务器的正常运行。

风扇

风扇用于为服务器散热,保持服务器内部的温度在合理范围内,确保服务器的稳定运行。服务器风扇通常具有智能调速功能,可以根据服务器的负载和温度自动调节转速,提高散热效率并降低噪音。

可信计算

可信计算是一种保障计算机系统安全的技术,通过 TPM(可信平台模块)和 TCM(中国可信密码模块,类似于 cfc 的 TPM)实现。联想公认的操作系统包括 windows、redhat、suse、vmware、openstart、xenserver、麒麟等。其中,vmwaer 操作系统需要官方授权和联想授权才能使用。联想对操作系统的支持定义为:受支持(操作系统能够正常运行并获得联想的技术支持)、通过认证(操作系统经过联想的严格测试和认证,确保与服务器的兼容性和稳定性)。

磁盘阵列

磁盘阵列技术详解

一、核心概念

磁盘阵列系统由物理盘和逻辑盘组成:

  • 物理盘:实际存在的存储介质(如 HDD/SSD)
  • 逻辑盘:操作系统可见的虚拟存储设备(即 VD 虚拟阵列盘)

二、基础存储模式

1. JBOD(Just A Bunch Of Disks)

  • 技术原理:将多个物理磁盘以直连方式逻辑串联
  • 核心特性
    ✓ 线性扩展存储容量
    ✓ 无冗余保护机制
    ✓ 单盘故障不影响其他磁盘
  • 适用场景:纯容量扩展需求,对数据安全无要求

2. RAID(Redundant Array of Independent Disks)

  • 技术定义:通过条带化技术将多块磁盘整合成单一虚拟磁盘
  • 核心价值
    ✓ 提升数据访问性能
    ✓ 提供冗余容错能力
    ✓ 突破单盘容量限制

三、关键技术解析

1. 条带化(Spanning)

  • 技术实现:数据按固定块大小分布在多个磁盘
  • 技术优势
    ✓ 并行读写提升 IOPS
    ✓ 突破单盘容量限制
  • 技术局限
    ✗ 无数据保护机制
    ✗ 单盘故障导致数据丢失

2. 奇偶校验(Parity)

  • 技术原理:通过异或运算生成校验数据
  • 典型应用
    ✓ RAID5:单盘容错
    ✓ RAID6:双盘容错
  • 运算规则A ⊕ B = C,其中 C 为校验值

3. 镜像技术(Mirroring)

  • 技术实现:数据同时写入两个磁盘
  • 典型应用:RAID1
  • 故障处理
    ✓ 单盘故障时进入降级模式
    ✓ 替换新盘后自动重建数据

四、主流 RAID 级别对比

级别容错能力冗余类型最小盘数可用空间适用场景
01+100%高性能无保护场景
1单盘镜像250%关键数据保护
5单盘校验3(N-1)/N平衡性能与成本场景
6双盘双重校验4(N-2)/N高可靠性需求场景
10多盘镜像 + 条带450%高性能高可靠场景
50多盘校验 + 条带6(N-2)/N企业级存储阵列

五、关键技术细节

  • RAID0 特殊应用:支持单盘配置(无冗余),用于纯性能加速
  • 重建过程:故障盘替换后,系统自动同步数据,期间性能下降约 30%
  • 写惩罚:RAID5/6 写入时需计算校验值,导致约 30% 性能损耗
  • 混合模式:RAID10=RAID1+RAID0,兼具高性能与高可靠性
RAID级别RAIDORAID1RAID5RAID6RAID10RAID50
容错性
很高
冗余类型镜像奇偶校验奇偶校验镜像冗余奇偶较验
备份盘
读性能普通
随机写性能普通
连续写性能普通
最少磁盘数2个2个3个4个4个6个
可用空间100%50%(N-1)/N(N-2)/N50%(N-2)/N
文章作者: 叫我狗蛋
本文链接:
版权声明: 本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 我要肝网络
服务器
喜欢就支持一下吧