狠狠撸

狠狠撸Share a Scribd company logo
cloudpack




        2011.7.25
閾値         閾値
#       項?        コマンド        NRPE                         通報                   備考                                   Nagios 通知内容
                                     Warning    Critical
                                                           5分に1回ロードアベレージのチェックを?う
                                                           5分前に5% 10分前に4% 15分前に3%の閾値を超えた場合 Waning
    ロードアベレー                    ?                         ? となる                                       CRITICAL - load average
1           check_load                  5,4,3     10,6,4
    ジ                                                      5分前に10% 10分前に6% 15分前に4%の閾値を超えた場合 Critical WARNING - load average
                                                           となる

                                                            5分に1回ルートディスク使?量のチェックを?う
                                                                                                         DISK WARNING - free space: /
2 ルートディスクcheck_disk            ?          0.2         0.1 ? ルートディスク使?量70%を超えた場合 Warningメール送信
                                                            ルートディスク使?量80%を超えた場合 Criticalメール送信            DISK CRITICAL   free space:/
                                                            5分に1回データディスク使?量のチェックを?う
                                                                                                         DISK WARNING - free space: /mnt/hdd1
3 データディスクcheck_disk            ?          0.2         0.1 ? データディスク使?量70%を超えた場合 Warningメール送信
                                                            データディスク使?量80%を超えた場合 Criticalメール送信            DISK CRITICAL - free space: /mnt/hdd1
                                                                                                         USERS WARNING - 5 users currently
                                                            5分に1回ログインユーザ数チェックを?う
  ログインユー                       ?                                                                         logged in
4              check_users                 5           10 ? 5ユーザ以上ログインしていた場合 Warningメール送信
  ザー数                                                                                                    USERS WARNING - 10 users currently
                                                            10ユーザ以上ログインしていた場合 Criticalメール送信
                                                                                                         logged in
                                                           5分に1回全プロセス数チェックを?う
                                                                                                         PROCS WARNING: 301 processes
5 全プロセス数        check_procs    ?         300         350 ? プロセス数300以上起動していた場合 Warningメール送信
                                                           プロセス数350以上起動していた場合 Criticalメール送信              PROCS CRITICAL: 350 processes

6 SSH          check_ssh                                 ? 5分に1回SSH起動チェックを?う                             CRITICAL - Socket timeout after 10
                                                           sshが起動していない場合 Criticalメール送信                   seconds
                                                           5分に1回死活チェックを?う
                                       250ms      300ms ? 返り値が250msもしくは50%かけた場合 Warningメール送信             PING WARNING - Packet loss = 50%
7 死活監視         check_ping
                                         50%        90%    返り値が300msもしくは90%かけた場合 Criticalメール送信           PING CRITICAL - Packet loss = 100%
                                                           2分に1回 /var/log/messageログをチェック
    messagesログ                 ?                         ? アラートキーワード「kernel」が1回書きこまれたらWarningメール送        CRITICAL kernel
8              check_log2
    監視                                                     信                                             CRITICAL Error
                                                           「Error」も
                                                           5分にメモリチェックを?う
               check_memor                                                                               CRITICAL - memory free
9 メモリ監視                        ?          80          90 ? メモリ80%使?していた場合 Warningメール送信
               y                                           メモリ90%使?していた場合 Criticalメール送信                  WARNING - memory free
                                                                                                         PROCS WARNING: 0 process with args
                                                             5分にcronのチェックを?う                             'crond'
10 crond       プロセス            ?                           ? crond プロセスが確認できない場合   Criticalメール送信         PROCS CRITICAL: 0process with args
                                                                                                         'crond'




                                                                                                                                              1
URL

# HOST/ドメイン     コマンド       NRPE   通報   URL                      備考             Nagios 通知内容     備考
                                             5分に1回http//の監視を?う 返り値が200の場合はOK
1             check_http          ?                                            HTTP CRITICAL
                                             返り値が200以外の場合 Criticalメール送信
                                             5分に1回http//の監視を?う 返り値が200の場合はOK
2             check_http          ?                                            HTTP CRITICAL
                                             返り値が200以外の場合 Criticalメール送信
                                             5分に1回http//の監視を?う 返り値が200の場合はOK
3             check_http          ?                                            HTTP CRITICAL
                                             返り値が200以外の場合 Criticalメール送信
                                             5分に1回http//の監視を?う 返り値が200の場合はOK
4             check_http          ?                                            HTTP CRITICAL
                                             返り値が200以外の場合 Criticalメール送信




                                                                                                    2
DB

                                    閾値      閾値                                                               Nagios 通知内容
#        項?      コマンド       NRPE                      通報                      備考
                                   Warning Critical
                                                           5分に1回httpd起動確認を?う
1 Apache       check_http                             ?                                           HTTP CRITICAL
                                                           httpdが起動していない場合 Criticalメール送信
                                                           5分に1回httpdプロセスチェックを?う
    Apacheのプロ                                                                                     PROCS WARNINGL: 230 processes
2             check_procs    ?         230      250   ?    httpd プロセス230個起動していた場合 Warningメール送信
    セス数                                                                                           PROCS CRITICAL: 250 processes
                                                           httpd プロセス250個起動していた場合 Criticalメール送信
                                                           5分に1回 ポート8009監視を?う
3 Tomcat       check_tcp                              ?                                           接続を拒否されました
                                                           ポート8009が解放されていない場合はWarningメール送信
                                                           5分に1回javaプロセスを監視を?う
                                                           キーワード 「/usr/bin/java」                  PROCS CRITICAL: 0 processes
4 Java         プロセス          ?                        ?    の?字列で監視                                with args /usr/bin/java
                                                           上記プロセスが確認できない場合はCriticalメール送信




                                                                                                                                  3
URL

                                   閾値        閾値                                                         Nagios 通知内容         備考
#     項?        コマンド       NRPE                        通報                    備考
                                  Warning   Critical

1 MySQL      check_mysql    ?                          ?    5分に1回 MySQL監視を?う                     CRITICAL - no connection
                                                            MySQLが起動していない場合 Criticalメール送信
                                                            5分に1回PostgreSQL起動確認を?う
2 PostgreSQL check_pgsql    ?                          ?                                         CRITICAL - no connection
                                                            PostgreSQLが起動していない場合 Criticalメール送信




                                                                                                                                 4

More Related Content

肠濒辞耻诲辫补肠办监视项目一覧表(サンプル)

  • 1. cloudpack 2011.7.25
  • 2. 閾値 閾値 # 項? コマンド NRPE 通報 備考 Nagios 通知内容 Warning Critical 5分に1回ロードアベレージのチェックを?う 5分前に5% 10分前に4% 15分前に3%の閾値を超えた場合 Waning ロードアベレー ? ? となる CRITICAL - load average 1 check_load 5,4,3 10,6,4 ジ 5分前に10% 10分前に6% 15分前に4%の閾値を超えた場合 Critical WARNING - load average となる 5分に1回ルートディスク使?量のチェックを?う DISK WARNING - free space: / 2 ルートディスクcheck_disk ? 0.2 0.1 ? ルートディスク使?量70%を超えた場合 Warningメール送信 ルートディスク使?量80%を超えた場合 Criticalメール送信 DISK CRITICAL free space:/ 5分に1回データディスク使?量のチェックを?う DISK WARNING - free space: /mnt/hdd1 3 データディスクcheck_disk ? 0.2 0.1 ? データディスク使?量70%を超えた場合 Warningメール送信 データディスク使?量80%を超えた場合 Criticalメール送信 DISK CRITICAL - free space: /mnt/hdd1 USERS WARNING - 5 users currently 5分に1回ログインユーザ数チェックを?う ログインユー ? logged in 4 check_users 5 10 ? 5ユーザ以上ログインしていた場合 Warningメール送信 ザー数 USERS WARNING - 10 users currently 10ユーザ以上ログインしていた場合 Criticalメール送信 logged in 5分に1回全プロセス数チェックを?う PROCS WARNING: 301 processes 5 全プロセス数 check_procs ? 300 350 ? プロセス数300以上起動していた場合 Warningメール送信 プロセス数350以上起動していた場合 Criticalメール送信 PROCS CRITICAL: 350 processes 6 SSH check_ssh ? 5分に1回SSH起動チェックを?う CRITICAL - Socket timeout after 10 sshが起動していない場合 Criticalメール送信 seconds 5分に1回死活チェックを?う 250ms 300ms ? 返り値が250msもしくは50%かけた場合 Warningメール送信 PING WARNING - Packet loss = 50% 7 死活監視 check_ping 50% 90% 返り値が300msもしくは90%かけた場合 Criticalメール送信 PING CRITICAL - Packet loss = 100% 2分に1回 /var/log/messageログをチェック messagesログ ? ? アラートキーワード「kernel」が1回書きこまれたらWarningメール送 CRITICAL kernel 8 check_log2 監視 信 CRITICAL Error 「Error」も 5分にメモリチェックを?う check_memor CRITICAL - memory free 9 メモリ監視 ? 80 90 ? メモリ80%使?していた場合 Warningメール送信 y メモリ90%使?していた場合 Criticalメール送信 WARNING - memory free PROCS WARNING: 0 process with args 5分にcronのチェックを?う 'crond' 10 crond プロセス ? ? crond プロセスが確認できない場合 Criticalメール送信 PROCS CRITICAL: 0process with args 'crond' 1
  • 3. URL # HOST/ドメイン コマンド NRPE 通報 URL 備考 Nagios 通知内容 備考 5分に1回http//の監視を?う 返り値が200の場合はOK 1 check_http ? HTTP CRITICAL 返り値が200以外の場合 Criticalメール送信 5分に1回http//の監視を?う 返り値が200の場合はOK 2 check_http ? HTTP CRITICAL 返り値が200以外の場合 Criticalメール送信 5分に1回http//の監視を?う 返り値が200の場合はOK 3 check_http ? HTTP CRITICAL 返り値が200以外の場合 Criticalメール送信 5分に1回http//の監視を?う 返り値が200の場合はOK 4 check_http ? HTTP CRITICAL 返り値が200以外の場合 Criticalメール送信 2
  • 4. DB 閾値 閾値 Nagios 通知内容 # 項? コマンド NRPE 通報 備考 Warning Critical 5分に1回httpd起動確認を?う 1 Apache check_http ? HTTP CRITICAL httpdが起動していない場合 Criticalメール送信 5分に1回httpdプロセスチェックを?う Apacheのプロ PROCS WARNINGL: 230 processes 2 check_procs ? 230 250 ? httpd プロセス230個起動していた場合 Warningメール送信 セス数 PROCS CRITICAL: 250 processes httpd プロセス250個起動していた場合 Criticalメール送信 5分に1回 ポート8009監視を?う 3 Tomcat check_tcp ? 接続を拒否されました ポート8009が解放されていない場合はWarningメール送信 5分に1回javaプロセスを監視を?う キーワード 「/usr/bin/java」 PROCS CRITICAL: 0 processes 4 Java プロセス ? ? の?字列で監視 with args /usr/bin/java 上記プロセスが確認できない場合はCriticalメール送信 3
  • 5. URL 閾値 閾値 Nagios 通知内容 備考 # 項? コマンド NRPE 通報 備考 Warning Critical 1 MySQL check_mysql ? ? 5分に1回 MySQL監視を?う CRITICAL - no connection MySQLが起動していない場合 Criticalメール送信 5分に1回PostgreSQL起動確認を?う 2 PostgreSQL check_pgsql ? ? CRITICAL - no connection PostgreSQLが起動していない場合 Criticalメール送信 4