開発 一般的に、サイトの信頼性エンジニアリングには何が関係していますか?

一般的に、サイトの信頼性エンジニアリングには何が関係していますか?

Anonim

Q:

一般的に、サイトの信頼性エンジニアリングには何が関係していますか?

A:

サイトの信頼性エンジニアリング(SRE)に関連する作業は、作業中の企業とシステムによってかなり異なります。

サイト信頼性エンジニアリングの基本的な定義は、ソフトウェア開発の経験を持つ人々に運用を任せるプロセス、または開発と運用の作業を何らかの重要な方法で混合または結合するプロセスです。 とはいえ、サイト信頼性エンジニアの役割には、多くの場合、トップレベルの設計アプローチを運用に適用することが含まれます。

サイトの信頼性エンジニアリングを使用するアプローチは、devopsと呼ばれる別のアプローチに似ています。どちらも開発と運用を組み合わせることを目的としています。 devopsは2つの部門を統合するプロセスとしてしばしば説明されますが、サイト信頼性エンジニアは多くの場合、役職として使用され、従来のシステム管理者の役職に取って代わります。 違いは、システムの監視と提供に加えて、サイト信頼性エンジニアがこれらの開発コンセプトも適用することです。これは、開発されたプログラムが想定どおりに機能することを確認するために重要です。

実際には、サイトの信頼性エンジニアがいつでもシステムを監視するために電話をかける場合があります。 この個人は、自動化ツールを作成したり、品質保証機能の開発を支援したりできます。 SREのチームは、アプリケーションの稼働時間を評価したり、開発されたアプリケーションが実際にどのように現場で使用されているかを調べたりします。

開発と運用を組み合わせるという一般的な概念の中で、SREの役割は非常に柔軟です。 このアプローチは、コミュニケーションと哲学の観点から2つの部門間の「ギャップを埋める」ことも試みていると言う人もいます。 そのため、SREの人は、開発された製品やサービスの使用について実際に話すために、かなりの数の会議に参加することになります。 SREはdevopsプロセスの「利害関係者」と見なされる場合があり、運用パフォーマンスに目を向けてエンジニアリングと設計に関する重要なフィードバックを提供します。

SREはある種のシステム管理者の役割であると考える人もいますが、Googleのような企業はSREの概念を受け入れ、この種の専門家の役割を定義するためにより多くの投資を行っています。 Googleのエンジニアは、SREプロセスで提供できる非常に重要な入力のいくつかについて話し、これらの専門家は、従来のシステム管理者にはなかった方法で高度なスキルと経験を持っていると説明します。

一般的に、サイトの信頼性エンジニアリングには何が関係していますか?