監視・運用部門のインフラエンジニアは、ITインフラの安定的な運用と監視を担当する重要な役割を果たしています。
本記事では、監視・運用部門インフラエンジニアの業務内容と日常の業務スケジュールについて詳しく紹介します。
さらに、インフラエンジニアのライフワークバランスについても触れます。
インフラエンジニアが24時間365日監視業務を行うメリット・デメリットは下記で紹介しています!
監視・運用部門のインフラエンジニアとは
監視・運用部門のインフラエンジニアは、ITインフラの運用を担当する部門です。
インフラエンジニアは、ルーター・スイッチ・ネットワーク・サーバー・ストレージなどのインフラ機器を監視し、障害や問題を早期に検知し解決する役割を果たします。
監視・運用部門は24時間365日のシフト体制を取る企業も多くあります。今回はシフト制の企業の場合の業務内容を紹介します。
監視・運用部門インフラエンジニアの業務概要

インフラエンジニアの業務概要をご紹介します。
※本業務概要は筆者である私の経験に基づくものとなります。
インフラエンジニアの勤務体制
私が勤めていた企業は24時間365日、自社で監視・運用を賄っています。
日勤・夜勤の2交代制を組んでいます。
日勤:9:00-18:00
夜勤:17:00-9:00
日勤と夜勤で時間が被っているのは引継ぎの時間があるためです。
平日・休日・祝祭日・正月・お盆も変わりません。
夜勤の場合、一気に2日分仕事をします。
月曜の17時に出社⇀翌9時に退社の16時間分働きます。火曜日の9時から夜勤明けの非番となります。
その翌日の水曜日からまた日勤か夜勤のシフトに加わります。
ですが、毎日監視業務をするわけではありません。
インフラエンジニアには監視業務以外にも、担当業務や運用部門としてのプロジェクトの参画を行います。監視担当以外の日にこれらの業務を行います。
その場合は日勤帯に業務をします。
インフラエンジニアの業務内容
インフラエンジニアの業務内容をご紹介します。
監視業務
監視・運用インフラエンジニアの主たる業務は監視業務です。
ルータやスイッチ・サーバーの故障やエラーが発生した際は、監視ツールから発報通知が来ます。
監視ツールは「ZABBIX」や「Nagios」、「TWSNMP」などを利用していました。
発報通知が来た後に、該当のインフラ機器にログインして状況を確認します。
アラームの発報頻度は、監視台数にもよりますが、私は8時間で30件ほどでした。
30件の中には、無視してもよいアラームがほとんどで、内1~2件が実際の故障対応を行う必要があるアラームです。
上記の、無視してよいアラームは、CPU利用率90%の超過アラームなどで、時間経過と共に収まるため「様子見対応」ということになります。
障害対応
監視業務の中から、対応が必要な障害が発生した場合、障害対応に移ります。
対応が必要なアラームは、ルータの機器故障などになります。
その際は障害状況に合わせてエスカレーションやカスタマーセンターへの連絡など、一気にスピード感が上がります。
障害対応は対応時間が限られるものと、そうでないものがあります。
限られるものの場合は、機器の故障によりサービス提供に影響が出ている場合です。1秒でも早い復旧が求められるため、カスタマーセンター・上長・チーム内へ迅速にエスカレーションします。
時間が限られないパターンは、冗長構成があり、サービス提供に影響が出ていない場合です。その場合は、作業をすることを報告して、作業ミスがないようにゆっくりと対応します。危険作業が伴う場合は、ユーザー影響が少ない夜間帯まで待って作業をします。
そのため、日勤に発生した場合は夜勤者が作業を行うので、作業手順書の作成や引継ぎ資料を作成しておきます。
申告対応
申告対応も監視・運用業務の主たる業務です。監視業務と並行して行います。
申告対応とは、利用者からカスタマーセンターが問い合わせや報告を受け、カスタマーセンターから技術部門への調査依頼に対応します。
これには、ユーザーからのチケットや電話、メールなどの対応は含まれません。カスタマーセンターへ調査結果を回答し、カスタマーセンター側で再度利用者へ報告します。
監視業務は8時間の中で1時間から2時間程度しか発生しません。監視業務以外は申告対応を行っています。
1日15件ほど対応します。
カスタマーセンターもある程度の知識はありますが、技術的な質問や、現状のインフラ機器の状態の確認などはできません。その場合にインフラエンジニアへ申告対応を行います。
定型業務
定型業務というものもあります。
ルータ・サーバーなどのlogを確認して、アラーム発報していない未知のアラームがないか確認します。
また、機器の仕様上アラームを発報できないログやWA(ワークアラウンド)対応を行います。基本的に日勤帯に実施しますが、監視業務とは平行せずに定型業務係として1名専任で業務にあたります。
これらの業務は、システムの安定性とセキュリティの維持に重要な役割を果たします。
担当業務
特定のシステムやプロジェクトを任されている場合があります。
定期訓練やセキュリティの日常点検、部材の資産管理・棚卸などチーム内で役割が決まっている、担当業務を実施します。
監視業務の時間は実施することが難しくなるため、監視業務以外のシフト時に一気に仕事を進めます。
プロジェクト参画
監視・運用部門のインフラエンジニアは、新しいプロジェクトやインフラストラクチャの導入にも関与することがあります。設計・導入部門が作った要件の収集や設計、実装、テスト、運用への移行などの会議に参加し、監視部門の代表として、プロジェクトの各段階において重要な役割を果たします。
監視・運用部門インフラエンジニアの1日の業務スケジュール

ここからは、実際に私が経験していた、インフラエンジニアの1日の業務スケジュールを紹介します。
日勤・夜勤に分けての紹介です。
日勤(監視業務)
9:00
出社。夜勤からの引継ぎを実施・引継ぎ後はメールチェック・本日の作業スケジュールの確認。
10:00-12:00
申告対応などを実施
12:00-13:00
昼休憩。監視画面の前で昼食。電話対応や障害発生時は昼食を中止して対応。
13:00-17:00
引き続き申告対応・障害対応を実施
17:00-18:00
夜勤者へ向けて引継ぎ資料を作成
18:00-20:00
監視終了・残業する場合は別席に移動して担当業務やプロジェクト業務を行う
日勤(監視業務以外のシフト)
9:00
出社。メールチェック・本日の作業スケジュールの確認。
10:00-12:00
ミーティングや担当業務の実施
12:00-13:00
昼休憩。障害発生の心配をせず、ゆっくりと休息。外食も可能。
13:00-17:00
引き続きミーティングや担当業務の実施
17:00-18:00
監視業務側の引継ぎを聞いて、1日何が起こったか把握。
18:00-20:00
残業する場合は別席に移動して担当業務やプロジェクト業務を行う
夜勤(監視業務)
18:00-19:00
出社。日勤者からの引継ぎ・メール確認
19:00-24:00
申告対応・監視対応を実施
24:00-1:00
夜食。電話やアラームが無い場合は適度に仮眠をとる。
1:00-8:00
電話やアラームが無い場合は、椅子で仮眠をとる。担当業務やプロジェクトを行っても良い。
日勤者から作業を引き継いだ場合は、指定された時間に作業対応を実施。
8:00-9:00
日勤担当へ引継ぎ資料作成・引継ぎ実施
繁忙期
インフラエンジニアは繁忙期はほとんどありません。
強いて言えば、月曜日が忙しくなります。土日に休んでいた企業が月曜に出社して異変に気づき、申告が増える傾向にあります。
機器の障害は平日・休日関係なく発生するため、特に時期による違いはありません。
ただし、台風や落雷の多い夏場は災害対応が増えてきます。
監視・運用部門インフラエンジニアのライフワークバランス

夜勤前後の時間の使い方
夜勤勤務では、睡眠とリラックスの時間を適切に確保することが重要です。夜勤前には十分な休息を取り、夜勤後には適度な睡眠をとるよう心がけましょう。また、夜勤明けの時間を有効に活用し、自己啓発や趣味に時間を割くことも大切です。
私の場合は、夜勤の18時出社時は早朝6時に起きて、24時間空いているジムにいき運動をします。9時ごろ帰宅し、15時まで仮眠を行います。
17時までに出社準備をして、出勤します。
夜勤明けの場合は、10時に帰宅、14時から15時まで寝て、そこから活動を始めます。
いずれの場合も昼夜逆転とならないように23時から24時には寝るようにしていました。
体には悪い
シフト制は、どんなにケアしても体には悪いです。
夜勤中の深夜3時あたりは、寿命が縮んでいく感覚を味わいます。
ほとんど座ってパソコンに向かう業務であるため、運動不足にもなります。
50歳で夜勤をしている人もいましたが、辛そうでした。
残業は少なめ
監視・運用部門インフラエンジニアの業務は、予期せぬトラブルに対応することが多いため、残業が発生することもあります。しかし、障害が発生しない場合は定時退社の場合が多くなります。
まとめ
監視・運用部門インフラエンジニアは、ITインフラストラクチャの安定的な運用と監視を担当する重要な役割を果たしています。日常的な監視業務、トラブル対応、定型業務、プロジェクト参画など多岐にわたる業務を担当しています。
ライフワークバランスの面では、夜勤前後の時間の使い方や体への負担に注意が必要です。適切な休息や睡眠を取りながら、自己の健康管理にも努めましょう。また、業務の効率化や適切なタスク管理により、残業時間を最小限に抑えることも重要です。
自社で監視体制を構築せず、サーバーの管理をアウトソーシングする方法もあります。
アイレット株式会社では、AWSサーバーの運用監視を24時間365日フルサポートで行っています。
このようなサーバー管理会社を有効活用し、社員のライフワークバランスの向上に取り組むことをおすすめします。
AWSサーバーの監視運用を24時間365日でご支援!【AWS運用・保守サービス】