Work

障害監視・運用・保守を導入するために考えるべきこととは?~監視・運用・保守パターン紹介編~

自社サービスや社内システムを運用しているサーバーは24時間稼働することが求められています。サーバーやシステムに障害が発生した場合、日中帯であればその時間に働いている担当エンジニアが対応して、被害を最小限に抑えることが出来ると思います。

しかし、サーバー障害が夜間や休日に発生した場合はどうなるのでしょうか。

障害の長時間化となり、顧客満足度の低下や業務に支障が出る事となります。

被害を最小限に抑えるために、夜間・休日でも円滑にサービスを提供できるようにする会社の監視・運用・保守体制のパターンをご紹介します。

会社で障害監視・運用・保守を行う

24時間365日必ず会社に社員がいる体制を作れば、夜間・休日関係なく障害監視・運用・保守を行うことが出来ます。

交代勤務(シフト勤務)

1つは、交代勤務という体制です。コンビニエンスストアなどの24時間営業している店などと同じ形態です。

交代勤務には主に2交代制と3交代制があります。勤務形態は会社により様々です。

2交代制は12時間交代する場合と、日勤8時間+夜勤16時間の場合があります。

2交代制の場合は8時間は確実にオーバーする為、夜勤勤務者の翌日は非番にする対応が必要となります。

いずれも長時間勤務となるため社員の健康に気を遣う必要があります。

3交代制の場合は早朝・日中・夜間の8時間交代で回すことが出来るため、長時間労働にはなりにくい体制となります。しかし、夜間帯で働いている社員は昼夜逆転生活となるため健康に気を遣う必要があります。

交代勤務のメリットとしては、最も障害復旧時間が短いこととなります。24時間365日起きている社員が障害発生後即時に対応できるため、発生から復旧までの時間が短くなります。

デメリットとしては、コストが高い、社員の健康問題が挙げられます。また、障害が無かった夜間・休日帯はそのコストは不要だったという事となります。

宿直勤務

2つ目は、宿直勤務です。日中帯の通常勤務後、会社内の宿直室で一晩過ごす体制です。

宿直勤務の社員は社内で晩食、シャワーなどを済ませ、宿直室で睡眠を取ります。

障害発生した場合にシステムからの異常通知やコールセンターからの入電時のみ起床し、対応を行います。

宿直期間中に障害が無ければそのまま朝を迎え翌日も通常勤務を行います。障害が発生した場合は会社の取り決めにより、また宿直室で休息をするか、そのまま翌朝まで勤務するか、夜勤としてカウントしてそのまま帰宅となります。

宿直勤務のメリットとしては、障害が無い場合は人員を残したまま日中帯のリソースとして組み込むことが出来ます。

デメリットとしては、宿直室の施設費用、労働基準監督署の許可が必要となります。また、宿直対応者が深い眠りに入ってしまい、通知に気が付かず障害が長時間化するという懸念もあります。

自宅で障害監視・運用・保守を行う

中小企業等は夜間休日に人員を割いてしまうと日中帯の業務が回らなくなる会社もあります。その場合、夜間休日は自宅で当番制を決めて障害発生時のみ出社で対応するという方法です。

監視当番制

夜間・休日を社員による持ち回りの監視当番を設定します。通常通り日勤終了後に帰宅して、自宅で過ごします。障害発生時にシステム通知やコールセンターの入電を受けて対応を行います。

自宅からテレワークのシステムで遠隔対応が可能な事象であれば自宅で対応し、出社が必要であれば会社へ出社します。

障害復旧後はまた帰宅し、自宅で過ごします。

メリットとしては、社員としてはリラックスできる自宅で休息を取れること、障害が無い場合は翌日日中帯のリソースが確保できます。

デメリットとしては、社員の自宅から会社まで通勤する時間が掛かるため、障害が長時間化します。また、都心部の場合夜間は電車が動いていない為、タクシーでの通勤となる場合もあります。さらに、社員側からも夜間休日でもストレスが掛かる、オンオフが付けづらいなどのライフスタイルの面で社員幸福度が落ちる可能性があります。

障害監視・運用・保守を依頼する

最後は、障害監視・運用・保守をアウトソーシングするやり方です。自社で夜間休日は対応せず、監視・運用・保守を受託している企業に任せます。受託企業でも対応が出来ない場合のみ自社の責任者へ入電する場合や、翌日早朝・週明けにまとめて連絡を貰うなどの方法があります。

メリットとしては、自社の社員で対応する必要が無いため、日中帯業務に支障が出ません。監視・運用・保守代行会社も他社の監視をしながら実施しているためコストメリットもあります。

デメリットとしては、依頼する場合は、アラームの内容とそのアラームが発生した際のマニュアルの準備や外部からシステム確認するためのネットワーク整備が必要です。

また、自社社員と比べるとシステムの専門的な知識を有していない為、品質が悪くなることが考えられます。

自社で監視体制を構築せず、サーバーの管理をアウトソーシングする方法もあります。

アイレット株式会社では、AWSサーバーの運用監視を24時間365日フルサポートで行っています。

このようなサーバー管理会社を有効活用し、社員のライフワークバランスの向上に取り組むことをおすすめします。

AWSサーバーの監視運用を24時間365日でご支援!【AWS運用・保守サービス】

まとめ

監視障害・運用・保守を導入する場合のパターンをご紹介しました。

体制によって、コスト・品質・社員幸福度など様々なメリット・デメリットがあります。自分の会社にあった方法を検討しましょう。

  • この記事を書いた人

KAITech

大企業/中小企業/ベンチャー企業を経験
AWS/ネットワークのエンジニア
記事執筆やメンタリング等、仕事の依頼はコチラから
https://www.kaitech-media.biz/work/

-Work