web-dev-qa-db-ja.com

閉じた後、TCPバインドされているローカルソケットアドレスが利用できなくなりますか?

Linux(私のライブサーバーはRHEL 5.5上にあります-以下のLXRリンクはその中のカーネルバージョンへのリンクです)、man 7 ipはこう言います:

A TCPバインドされているローカルソケットアドレスは、SO_REUSEADDRフラグが設定されていない限り、閉じた後しばらくの間使用できません。

SO_REUSEADDRを使用していません。 「しばらく」はどのくらいですか?それがどのくらいの長さであるか、どうすれば変更できますか?

私はこれについてグーグルで調べていて、いくつかの情報を見つけましたが、どれもアプリケーションプログラマの観点からこれを実際に説明しているものはありません。ウィットするには:

  • TCP_TIMEWAIT_LEN in net/tcp.hは「TIME-WAIT状態を破棄するまでの待機時間」であり、「約60秒」に固定されています
  • / proc/sys/net/ipv4/tcp_fin_timeout は、「ソケットがFIN-WAIT-2の状態に保たれる時間、それが私たちの側で閉じられた場合」、「デフォルト値は60秒」

私がつまずくのは、カーネルのTCP=ライフサイクルのモデルと、利用できないポートのプログラマーのモデルとの間のギャップを埋めるときです。つまり、これらの状態が「時間」にどのように関連するかを理解することです。 。

13
Tom Anderson

ソケットがプログラムで使用できないという考えは、TCPまだ転送中のデータセグメントが到着し、カーネルによって破棄されることを許可することです。つまり、アプリケーションで可能です。ソケットでclose(2)を呼び出すが、ルーティングの遅延またはパケットを制御するための事故、またはTCP接続の反対側がしばらくの間データを送信することを許可できるものアプリケーションは、TCPデータセグメントを処理する必要がないことを示しているため、カーネルは着信したセグメントを破棄するだけです。

タイムアウト時間を確認するためにコンパイルして使用できるCの小さなプログラムをハッキングしました。

_#include <stdio.h>        /* fprintf() */
#include <string.h>       /* strerror() */
#include <errno.h>        /* errno */
#include <stdlib.h>       /* strtol() */
#include <signal.h>       /* signal() */
#include <sys/time.h>     /* struct timeval */
#include <unistd.h>       /* read(), write(), close(), gettimeofday() */
#include <sys/types.h>    /* socket() */
#include <sys/socket.h>   /* socket-related stuff */
#include <netinet/in.h>
#include <arpa/inet.h>    /* inet_ntoa() */
float elapsed_time(struct timeval before, struct timeval after);
int
main(int ac, char **av)
{
        int opt;
        int listen_fd = -1;
        unsigned short port = 0;
        struct sockaddr_in  serv_addr;
        struct timeval before_bind;
        struct timeval after_bind;

        while (-1 != (opt = getopt(ac, av, "p:"))) {
                switch (opt) {
                case 'p':
                        port = (unsigned short)atoi(optarg);
                        break;
                }
        }

        if (0 == port) {
                fprintf(stderr, "Need a port to listen on\n");
                return 2;
        }

        if (0 > (listen_fd = socket(AF_INET, SOCK_STREAM, 0))) {
                fprintf(stderr, "Opening socket: %s\n", strerror(errno));
                return 1;
        }

        memset(&serv_addr, '\0', sizeof(serv_addr));
        serv_addr.sin_family      = AF_INET;
        serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
        serv_addr.sin_port        = htons(port);

        gettimeofday(&before_bind, NULL);
        while (0 > bind(listen_fd, (struct sockaddr *)&serv_addr, sizeof(serv_addr))) {
                fprintf(stderr, "binding socket to port %d: %s\n",
                        ntohs(serv_addr.sin_port),
                        strerror(errno));

                sleep(1);
        }
        gettimeofday(&after_bind, NULL);
        printf("bind took %.5f seconds\n", elapsed_time(before_bind, after_bind));

        printf("# Listening on port %d\n", ntohs(serv_addr.sin_port));
        if (0 > listen(listen_fd, 100)) {
                fprintf(stderr, "listen() on fd %d: %s\n",
                        listen_fd,
                        strerror(errno));
                return 1;
        }

        {
                struct sockaddr_in  cli_addr;
                struct timeval before;
                int newfd;
                socklen_t clilen;

                clilen = sizeof(cli_addr);

                if (0 > (newfd = accept(listen_fd, (struct sockaddr *)&cli_addr, &clilen))) {
                        fprintf(stderr, "accept() on fd %d: %s\n", listen_fd, strerror(errno));
                        exit(2);
                }
                gettimeofday(&before, NULL);
                printf("At %ld.%06ld\tconnected to: %s\n",
                        before.tv_sec, before.tv_usec,
                        inet_ntoa(cli_addr.sin_addr)
                );
                fflush(stdout);

                while (close(newfd) == EINTR) ;
        }

        if (0 > close(listen_fd))
                fprintf(stderr, "Closing socket: %s\n", strerror(errno));

        return 0;
}
float
elapsed_time(struct timeval before, struct timeval after)
{
        float r = 0.0;

        if (before.tv_usec > after.tv_usec) {
                after.tv_usec += 1000000;
                --after.tv_sec;
        }

        r = (float)(after.tv_sec - before.tv_sec)
                + (1.0E-6)*(float)(after.tv_usec - before.tv_usec);

        return r;
}
_

このプログラムを3つの異なるマシンで試しましたが、カーネルがroot以外のユーザーによるソケットの再オープンを許可しない場合、55秒から59秒の可変時間を取得しました。上記のコードを「opener」という名前の実行可能ファイルにコンパイルし、次のように実行しました。

_./opener -p 7896; ./opener -p 7896
_

私は別のウィンドウを開いてこれを行いました:

_telnet otherhost 7896
_

これにより、「オープナー」の最初のインスタンスが接続を受け入れてから閉じます。 「opener」の2番目のインスタンスはTCPポート7896に毎秒bind(2)を試みます。「opener」は55〜59秒の遅延を報告します。

ぐるぐる回って、私は人々がこれをすることを勧めるのを見つけます:

_echo 30 > /proc/sys/net/ipv4/tcp_fin_timeout
_

その間隔を短くします。それは私にはうまくいきませんでした。私がアクセスした4台のLinuxマシンのうち、2台は30台、2台は60台でした。その値も10に設定しました。「opener」プログラムとの違いはありません。

これを行う:

_echo 1 > /proc/sys/net/ipv4/tcp_tw_recycle
_

物事を変えました。 2番目の「オープナー」は、新しいソケットを取得するのに約3秒しかかかりませんでした。

14
Bruce Ediger