web-dev-qa-db-ja.com

Datadogの返信コードでアラートを作成するにはどうすればよいですか?

助けが必要です。サイトで401502などのエラーが発生した場合にアラームを鳴らしたい。サーバー上には、データドッグでさまざまな部分を送信するエージェントがあります。そのようなモジュールhttp_checkがあり、そのような関数があるようにそれで。

http_response_status_code - A string or Python regular expression for an HTTP status code. This check will report DOWN for any status code that does not match. This defaults to 1xx, 2xx and 3xx HTTP status codes. For example: 401 or 4\d\d

これが私のhttp_check.ymlです

init_config:
instances:
  - name: My first service
    url: https://example.com
    collect_response_time: true
    timeout: 1
    skip_event: true
    http_response_status_code: 502
    check_certificate_expiration: true
    disable_ssl_validation: false
    days_warning: 7
    days_critical: 3
    tags:
      - url:example.com
      - env:production

実際、私はnginxをシャットダウンして、ステータスが送信されることを確認しようとしています。何も見えない。一般的なタスクは、サイトを監視し、何かが落ちた場合に警告することです。

1
James M

Datadogの開発者はこの問題について知っています。このタスクを解決するには、次のようなカスタムチェックを使用する必要があります http_check.py

次に、ホストでエージェントを再起動し、エラーを模倣する必要があります。イベントdatadogには、http://example.com returned a status of 503 after 30.0 secondsが表示されます。

その後、アラートを作成できます。このカスタムチェックは、200を除くすべてのコードを送信します。

1
James M

Http_response_status_codeには(4 | 5)\ d\dを使用できます。

0
Isaac