問題:CPanel Latest Visitorsコンソールの奇妙で一見ランダムなエントリ。参照URLなしでボットとして識別されない画像ファイルにアクセスするIPを表示します。
背景:ウェブサイトやITのトレーニングや指導を受けたことがない。私は交通機関の趣味に関するいくつかのウェブサイトを作成しました。これは非常に落ち着いて平穏なものでなければなりません。アメリカ、カナダ、日本人、イギリス、オーストラリアの何十人もの人々にとって興味深いかもしれない種類のもの。これらのWebサイトは、不在マネージャーが運営するWebホスティング会社でホストされていました。それらはシャットダウンし、私はドメインを新しい会社に移しました。そして、それは私にすべてのコントロールを引き渡しました。新しいサービスが開始されてから約1か月で、最大のWebサイトが5 GBの基本設定を超え、15 GBのサービスに追加され、料金が引き上げられました。帯域幅の使用量が増加するのを見始め、IP Blockerコンソールの使用方法を見つけました。 HTAccessやRobots.txtを理解することはできませんでしたが、それらは別の機会に残します。私は、とにかくRobots.txtルールに従わないSEOプロファイラーと中国/ロシアのボットの価値のほとんどをブロックすることができました。また、特定のファイルに対するリクエストを1日に数十回クラスター化するロシア語/ウクライナ語のURLの回転をブロックすることができました。しかし、帯域幅の消費は減少していません。
参照URLのない画像ファイルを要求しているIPに気付き始め、ボットとして識別されず、ブラウザーまたはセル電話として識別されました。これは通常のサーフィンではないことを知っています。画像ファイルを呼び出すためにHtmlファイルがプルされておらず、画像ファイルはどのWebページで使用されているグループとも相関しないクラスターにあるからです。私はIPをWhois Lookupsで実行し、いくつかのグループを作成しています:ソビエトブロック国-ロシア、ウクライナ、ブルガリア、エストニア...ラテン語圏の国-ブラジル、スペイン、コスタリカ...中国。南アフリカ。トピックの問題はそれらの国では利用できなかったため、ウェブサイトのコンテンツとは関係のないすべての場所。
また、カナダ、ワシントン州、ニュージャージーなどとして知られているIPもありますが、それらをブロックするのをためらっています。
ここで何を見ているの?私のウェブサイトでリモートおよび海外のIPを狙い、100以上の異なるアドレスから1日に何十回も連続して数枚の写真をヒットすることでお金を稼ぐことはできますか?
.htaccessを使用して画像の表示を直接ブロックする方法があります
RewriteEngine on
RewriteCond %{HTTP_REFERER} !^http://(www\.)?localhost [NC]
RewriteCond %{HTTP_REFERER} !^http://(www\.)?localhost.*$ [NC]
RewriteRule \.(gif|jpg)$ - [F]
画像に直接アクセスすると、403 Forbiddenエラーが返されますが、Webページに表示することはできます。これは、画像への直接URLを使用してユーザーがアクセスできないようにするのに役立ちます。
これらはGooglebotのIPアドレスではありません。悪いボットオペレーターがGooglebotをエージェント名として使用して、彼らが大丈夫だと思わせることは珍しくありません。一度に1つを除いてAmazon IPアドレスをブロックすることは考えませんが、多くの不正なボットオペレーターがAmazon IPアドレスから来ていることがわかりました。
Apacheのドキュメントは次の場所にあります。
それほど難しくありませんが、ふるいにかけて理解するのに時間がかかります。
Apache構成は、いくつかの場所のいずれかにあります。ベースApacheディレクトリは、/etc/Apache2/
または/etc/local/Apache2/
にあります。
httpd.conf
ファイルが空の場合、基本構成はApache2.conf
およびports.conf
です。おそらくこれらのファイルを編集する必要はありません。ただ言及しているだけです。
sites-available
ディレクトリも表示されるはずです。このサイトで利用可能なディレクトリには、おそらくexample.com.conf
の形式のファイルがあります。これが最初に見たいファイルです。ディレクティブAllowOverride
が表示されます。これがNone
に設定されている場合、.htaccess
の使用は利用できません。 None
をAll
または他の値に変更します。
次に、おそらく/home/example.com/www
というWebスペース内で、隠しファイル.htaccess
を探します。 ls -al
を使用できます。このファイルを編集します。 RewriteEngine On
が最初の行または最初の行に近いことを確認する必要があります。 ErrorDocument
ディレクティブがある場合は、ErrorDocumentが最後に処理されるディレクティブになるように、ディレクティブの前に次のものを置きます。
RewriteCond %{REMOTE_ADDR} 23.20.165.34 [NC]
RewriteRule .* - [F,L]
RewriteCond %{REMOTE_ADDR} 54.198.86.102 [NC]
RewriteRule .* - [F,L]
. [dots]
をエスケープする必要はないと思います。これが機能しない場合は、IPアドレスを23\.20\.165\.34
などに変更してみてください。これは動作するはずです。そうでない場合は、IPアドレスを^23\.20\.165\.34$
などのように変更します。
これらがすでにブロックされている場合は、何もする必要はありません。私はあなたにいくつかの選択肢を与えたかっただけです。