助けが必要です。サイトで401502などのエラーが発生した場合にアラームを鳴らしたい。サーバー上には、データドッグでさまざまな部分を送信するエージェントがあります。そのようなモジュールhttp_checkがあり、そのような関数があるようにそれで。
http_response_status_code - A string or Python regular expression for an HTTP status code. This check will report DOWN for any status code that does not match. This defaults to 1xx, 2xx and 3xx HTTP status codes. For example: 401 or 4\d\d
これが私のhttp_check.ymlです
init_config:
instances:
- name: My first service
url: https://example.com
collect_response_time: true
timeout: 1
skip_event: true
http_response_status_code: 502
check_certificate_expiration: true
disable_ssl_validation: false
days_warning: 7
days_critical: 3
tags:
- url:example.com
- env:production
実際、私はnginxをシャットダウンして、ステータスが送信されることを確認しようとしています。何も見えない。一般的なタスクは、サイトを監視し、何かが落ちた場合に警告することです。
Datadogの開発者はこの問題について知っています。このタスクを解決するには、次のようなカスタムチェックを使用する必要があります http_check.py
次に、ホストでエージェントを再起動し、エラーを模倣する必要があります。イベントdatadogには、http://example.com returned a status of 503 after 30.0 seconds
が表示されます。
その後、アラートを作成できます。このカスタムチェックは、200を除くすべてのコードを送信します。
Http_response_status_codeには(4 | 5)\ d\dを使用できます。