服务器已经成为多数企业必不可少的组成部分。服务器需要像其他设备一样进行维护。保持服务器运行比加载最新的补丁程序和更新要复杂得多。使用我们的服务器维护清单来确保服务器的平稳运行并避免停机。
这是我们的15个服务器维护提示列表,可帮助您更好地管理硬件并避免最常见的问题。
1.仔细检查并验证您的备份如果您曾经不得不从灾难性的驱动器故障中恢复过来,那么您就会知道数据对于企业顺利运营至关重要。
通过良好的备份策略,拥有它们而不需要它们比需要它们而不需要它们更好。每周(或每天)安排几分钟以检查服务器备份。或者,您可以将服务器环境镜像到云中的虚拟机并定期进行测试。
2.检查RAID阵列许多专用服务器运行RAID(独立磁盘冗余阵列)阵列。基本上,如果单个磁盘发生故障,多个硬盘驱动器将充当一个存储设备。
某些类型的RAID是为提高性能而设计的,而其他类型则是出于冗余的目的。在大多数情况下,现代RAID阵列具有高级监视工具。快速浏览RAID监视实用程序可以提醒您潜在的驱动器故障。这使您可以计划驱动器更换和重建,以最大程度地减少停机时间。
3.验证存储利用率定期检查服务器的硬盘使用情况。服务器会生成大量日志文件,旧电子邮件和过时的软件包。
如果保留旧的日志文件很重要,请考虑将其归档到外部存储中。旧电子邮件也可以存档或删除。某些应用程序更新程序不会删除旧文件。幸运的是,某些程序包管理器具有内置的清除协议,您可以使用它们。您还可以找到用于管理旧软件文件的第三方实用程序。
硬盘驱动器不仅用于存储。他们还使用 交换文件,其作用类似于物理内存。如果磁盘利用率超过90%,则可能会影响交换文件,从而严重降低性能。
软件和服务器系统检查 4.查看服务器资源使用情况除了查看磁盘空间外,观察其他服务器使用情况也很聪明。
内存和处理器的使用情况可以显示服务器的使用量。如果CPU和内存使用率经常接近100%,则表明您的服务器可能负担过重。考虑通过升级或添加其他服务器来减轻硬件负担。
5.更新您的控制面板必须手动更新控制面板软件(例如cPanel)。更新cPanel时,仅控制面板被更新。您仍然需要更新其管理的应用程序,例如Apache和PHP。
6.更新软件应用程序根据您的服务器配置,您可能具有许多不同的软件应用程序。某些系统具有可以自动更新软件的程序包管理器。对于那些没有的人,请创建时间表以查看可用的软件更新。
对于基于Web的应用程序尤其如此,因为它占了绝大多数违规行为。请记住,某些操作系统可能特别需要较旧的应用程序版本,例如CentOS7的Python 2。如果必须在生产环境中使用较旧的软件,请注意避免将此类软件暴露在开放的网络中。
7.检查远程管理工具检查远程管理工具,包括远程控制台,远程重启和救援模式。如果您运行基于云的虚拟服务器环境或正在远程管理服务器,则这些尤为重要。
定期检查这些实用程序,以确保它们可以正常运行。重新启动可以自行解决许多问题。远程控制台使您无需物理登录即可登录服务器。救援模式是Red Hat解决方案,但是大多数服务器操作系统都具有管理或“安全”模式,您可以远程引导进行维修。
8.验证网络利用率就像内存和CPU使用率一样,服务器负载具有网络容量。如果您的服务器已接近网络硬件的最大容量,请考虑安装升级。除了网络的容量之外,您还可以考虑使用网络监视工具。这些工具可以监视您的网络流量是否有异常或有问题的使用。
监控流量模式可以帮助您优化网络流量。例如,您可以将经常访问的资源迁移到速度更快的服务器。您可能还会跟踪异常行为,以识别入侵尝试和数据泄露,并主动进行管理。
9.验证操作系统更新操作系统更新可能是一个棘手的领域。一方面,修补程序和更新可以解决安全问题,扩展功能并提高性能。黑客经常计划围绕“零日”漏洞进行网络安全攻击。也就是说,他们查看发布的OS修补程序,并在企业修补漏洞之前先攻击这些弱点。
另一方面,自定义软件可能会因软件更新而发生冲突和不稳定。定期花时间检查操作系统更新。如果您有敏感的生产环境,请考虑创建测试环境以测试更新,然后再将其发布到生产中。
10.物理清洁服务器硬件
定期安排时间以物理方式清洁和检查服务器,以防止硬件故障。这有助于防止灰尘和碎屑进入电路板和风扇。
灰尘堆积会干扰热量管理,热量是服务器性能的敌人。清洁时,目视检查服务器和服务器环境。确保机柜通风良好。检查连接是否有异常接线。意外的闪存驱动器可能是安全漏洞。未经授权的网络电缆可能会引起数据隐私问题。
11.检查硬件错误现代服务器操作系统维护硬件错误日志。
硬件错误可能是发生故障的硬盘驱动器上的SMART错误,发生故障的设备的驱动程序错误或可能指示内存问题的随机错误。检查错误日志可以帮助您查明并解决硬件问题,然后再升级为系统崩溃。
安全监控 12.查看密码安全性定期评估您的密码策略。如果您没有使用企业密码管理系统,请立即开始。
您应该拥有一个自动执行良好密码卫生的系统。如果您不这样做,那么这是指示用户手动更改密码的好时机。
13.评估用户帐户大多数企业都有一定程度的营业额,很容易忽略用户帐户。
定期查看用户帐户列表,并删除不再需要的任何用户帐户。您还可以检查帐户权限,以确保它们适合每个用户。在查看这些数据时,您还应该检查客户数据和帐户。您可能需要手动删除旧客户端的数据,以避免法律或安全复杂性
14.考虑整体服务器安全性评估您的服务器安全策略,以确保它们是最新的并且可以正常运行。考虑使用第三方网络安全工具从外部测试您的网络。这可以帮助您识别被忽略的区域,并帮助您防止违规行为发生。
15.定期检查服务器日志服务器维护跟踪服务器上访问和错误的日志。这些日志可能很广泛,但是某些工具和过程使它们更易于管理。
定期查看日志,以熟悉服务器的操作。记录的错误可能会标识出硬件问题,您可以在此问题失败之前予以解决。访问日志中的异常可能意味着用户未经授权的使用或入侵者的未经授权的访问。
定期服务器维护可减少停机时间和故障使用此清单,您应该对如何执行例行服务器维护有更好的了解。
定期维护可确保较小的服务器问题不会升级为灾难性的系统故障。由于规划不良,可预防的情况导致许多服务器故障。