ボット検出 (Bot Detection) とは、Web サイトやサービスへのアクセスが、実際の人間によるものか、自動化されたプログラム (ボット) によるものかを判別する技術です。
インターネットトラフィック全体に占めるボットの割合は驚くほど高く、Imperva の 2024 年レポートによると、全 Web トラフィックの約 49.6% がボットによるものです。そのうち約 32% が悪意のあるボット (スクレイピング、クレデンシャルスタッフィング、DDoS 攻撃など) です。
短縮 URL サービスにとってボット検出は特に重要です。ボットによる不正クリックは、クリック解析データの信頼性を損ないます。広告キャンペーンの短縮 URL がボットに大量クリックされると、実際のユーザー数を過大に見積もってしまい、マーケティング判断を誤ります。
ボット検出の主な手法は、行動分析 (マウスの動き、スクロールパターン、クリック間隔の自然さ)、フィンガープリント分析 (ブラウザの特徴が人間の典型的なパターンと一致するか)、レート分析 (同一 IP からの異常な高頻度アクセス)、JavaScript チャレンジ (JavaScript を実行できないボットの排除)、CAPTCHA (人間にしか解けない課題) です。
高度なボットは人間の行動を模倣するため、単一の手法では検出が困難です。複数の手法を組み合わせたスコアリングモデルが効果的です。Cloudflare Bot Management、AWS WAF Bot Control、reCAPTCHA Enterprise などのサービスが、機械学習ベースのボット検出を提供しています。関連書籍は Amazon でも探せます。