企業 企業はどのようにアップタイムを最大化しますか?

企業はどのようにアップタイムを最大化しますか?

Anonim

Q:

企業はどのようにアップタイムを最大化しますか?

A:

ITサービスを稼働し続けることは明らかに重要です。 システム製造業者はこのテーマに多くの考えを与えてきました。 いくつかの重要な金融コンピューターは何年も継続的に実行されています。 インターネットには、16年後にようやくシャットダウンされたNovell Netware 3コンピューターに関する話があります。 ネットワークの稼働時間を考慮する場合、標準は「ファイブナイン」、つまり99.999%の可用性です。 最大のアップタイムを達成することは、ITサービスの提供にとって重要な考慮事項です。

最大稼働時間はどのように達成されますか? 優れた管理が鍵です。 国際標準化機構(ISO)は、FCAPSと呼ばれるネットワーク管理のフレームワークを作成しました。

  • 障害管理
  • 構成管理
  • 経理管理
  • パフォーマンス管理
  • セキュリティ管理

個々のネットワークコンポーネントの問題は、このモデルを使用して予防的および事後的に対処されます。 障害は、アラームとイベント通知を使用して監視されます。 これらは、SNMP(システムネットワーク管理プロトコル)などのプロトコルのエージェントまたはその他の独自のソリューションによって収集されます。 カスタマイズ可能なしきい値は、アラームをトリガーし、データセンターの監視担当者のキューに配置されるチケットを自動的に生成することもあります。 大規模な通信事業者ネットワークには、ネットワークのコア、ディストリビューション、またはアクセスレイヤーに対処するための個別の部門があります。 根本原因分析では、重大なイベントの後に重大な問題を特定して定義しようとします。

同様のプロセスがシステム管理に使用されます。 インターネットサービスプロバイダー(ISP)および管理されたホスティングセンターは、サーバー、ストレージシステム、またはその他のデバイスの実行可能性を監視および管理するシステム管理者を採用しています。 たとえば、WindowsまたはLinuxマシン上の個々のプロセスは、ネットワークプロトコルと同じ方法でグラフィカルユーザーインターフェイス(GUI)管理プログラムを介して表示および制御できます。

ネットワークコンポーネントとシステムのリモート監視と構成は、システムの稼働時間を最大化するリアルタイム機能を提供します。 これは、構成の変更、主要業績評価指標の収集、またはセキュリティ強化の実装にまで及びます。

稼働時間とシステムの堅牢性を調べる1つの方法は、IBMがRASと呼んだモデルである信頼性、可用性、保守性です。 RASを確保するために、多くの方法が開発されました。 これらには、冗長性、データバックアップ、無停電電源装置(UPS)、ホットスワップ可能なコンポーネント、および自動更新が含まれます。 計画された変更とメンテナンスウィンドウは、ユーザーを悩ませることなく既知の問題を修正または改善する機会を提供します。

最終的にはシステムとネットワークに障害が発生します。 冗長性は、システムの復元力の鍵の1つです。 これは、ハードウェア、ソフトウェア、またはデータに適用できます。 ネットワークまたはソフトウェアシステムの信頼性を確保する責任者は、単一障害点(SPOF)と見なされるものを探します。 ネットワーク全体が単一のスイッチまたはケーブルを流れますか? すべてのプロセスが単独のサーバーで実行されていますか? 重要なデータセットのコピーは1つだけですか? 冗長性がなければ、企業は開発に数年かかったものを瞬時に失う可能性があります。

稼働時間を最大化することは、「すべてを超える」努力です。 ベストプラクティスは、数十年にわたる経験とコラボレーションを通じて開発されてきました。 自己修復ネットワーク、仮想化、データ分析、改善されたアーキテクチャなど、新しいソリューションが継続的に導入されています。 複雑なシステムで発生するすべての問題に対処する単一の方法はありません。 すべての企業は、使用可能な機器のライフサイクル内でITリソースを可能な限り効率的に最大限に活用しようとします。

企業はどのようにアップタイムを最大化しますか?