メインコンテンツへ
短.be

URL 正規化

表記が異なるが同じリソースを指す複数の URL を、統一された標準形式に変換する処理。重複コンテンツの防止に不可欠。

2025年11月17日 · 約 1 分で読めます

URL 短縮

URL 正規化 (URL Normalization / URL Canonicalization) とは、同じ Web ページを指す複数の URL 表記を、1 つの標準的な形式に統一する処理です。たとえば「http://Example.COM/page/」「https://example.com/page」「https://example.com/page/index.html」はすべて同じページを指す可能性がありますが、検索エンジンはこれらを別の URL として扱います。

URL 正規化で統一すべき主な要素は、プロトコル (http → https)、ホスト名の大文字小文字 (Example.COM → example.com)、末尾のスラッシュ (有無の統一)、デフォルトポート番号の除去 (:443 や :80)、パーセントエンコーディングの統一 (%7E → ~)、不要なクエリパラメータの除去、パスの正規化 (/a/../b → /b) です。

短縮 URL サービスにとって URL 正規化は核心的な技術です。ユーザーが入力した URL を正規化してからデータベースに保存することで、同じページに対して複数の短縮 URL が生成されるのを防げます。「https://example.com/page」と「https://example.com/page/」を別の URL として扱うと、同じページに 2 つの短縮 URL が割り当てられ、クリック統計が分散してしまいます。

SEO の観点では、URL 正規化の不備は重複コンテンツ問題を引き起こします。同じコンテンツが複数の URL でアクセス可能な場合、検索エンジンはどの URL を正規版として扱うか判断に迷い、検索順位が分散します。canonical タグ (<link rel="canonical">) で正規 URL を明示することが最も確実な対策です。

RFC 3986 は URI の構文を定義しており、正規化のルールもこの仕様に基づいています。ただし、実務上は RFC の厳密な正規化だけでは不十分で、Web サーバーの設定 (末尾スラッシュの扱い、www の有無など) に応じたサイト固有の正規化ルールも必要です。関連書籍は Amazon でも探せます。

X でシェアはてブ

この記事は役に立ちましたか?

関連用語

関連記事

よくある質問

URL の末尾にスラッシュは付けるべきですか?
どちらでも構いませんが、サイト全体で統一することが重要です。統一されていないと、検索エンジンが同じページを別の URL として認識し、SEO 評価が分散します。リダイレクトで一方に統一するのが一般的です。
www あり/なしはどちらが正しいですか?
技術的にはどちらも正しいですが、サイト全体で一方に統一し、もう一方からリダイレクトする設定が必要です。最近は www なしが主流ですが、既に www ありで運用しているサイトは無理に変更する必要はありません。
短縮 URL サービスは URL を正規化していますか?
主要なサービスは基本的な正規化 (プロトコル統一、ホスト名の小文字化など) を行っています。ただし、末尾スラッシュやクエリパラメータの順序など、サービスによって正規化の範囲は異なります。

短縮 URL を作成してみませんか?

無料で URL を短縮する