インターネットの URL は、英語 (正確には ASCII 文字) を前提に設計されました。 `https://www.example.com/about` のような URL は、英語話者にとっては自然ですが、日本語、中国語、アラビア語、ヒンディー語を母語とする数十億人にとっては、外国語の文字列です。 URL は言語の壁を超えられるのでしょうか。
2003 年、国際化ドメイン名 (IDN: Internationalized Domain Names) の仕様が正式に策定され、 ASCII 以外の文字をドメイン名に使用できるようになりました。日本語では「日本語.jp 」、中国語では「中文.cn 」、アラビア語では「مثال.مصر」のようなドメインが技術的に可能になりました。日本では、 2001 年から「.jp 」ドメインで日本語ドメインの登録が開始され、「総務省.jp 」「東京.jp 」などの日本語ドメインが登録されています。しかし、日本語ドメインの普及率は低いままです。 2026 年現在、 `.jp` ドメインの登録数約 170 万件のうち、日本語ドメインは約 10 万件 (約 6%) にとどまっています。
日本語ドメインが普及しない理由は複数あります。第一に、入力の手間です。日本語ドメインをブラウザのアドレスバーに入力するには、日本語入力モードに切り替え、漢字やひらがなを入力し、変換する必要があります。英語のドメインなら半角英数字をそのまま入力できるのに対し、日本語ドメインは入力ステップが多くなります。第二に、 Punycode 変換の問題です。日本語ドメイン「例え.jp 」は、内部的には「 xn--r8jz45g.jp 」という Punycode に変換されます。メールアドレスや一部のアプリケーションでは、この Punycode が表示されてしまい、ユーザーにとって意味不明な文字列になります。多言語インターネットに関する書籍は Amazon でも探せます。
アラビア語圏では、 URL の言語問題はさらに複雑です。アラビア語は右から左に書く (RTL: Right-to-Left) 言語であり、 URL の左から右への表記と根本的に矛盾します。アラビア語のドメイン名を含む URL をアラビア語のテキスト中に埋め込むと、文字の方向が混在し、表示が崩れることがあります。この問題は「 BiDi (Bidirectional) 問題」と呼ばれ、 Unicode の仕様レベルで対処が試みられていますが、完全な解決には至っていません。
短縮 URL は、多言語インターネットにおいて意外な役割を果たしています。短縮 URL は言語に依存しない短い英数字の文字列であるため、どの言語のユーザーでも同じように入力・共有できます。日本語ドメインの長い URL を `bit.ly/xxxxx` に変換すれば、入力の手間も Punycode の問題も解消されます。皮肉なことに、多言語対応のために作られた国際化ドメイン名よりも、英語ベースの短縮 URL の方が、言語の壁を超えるツールとして実用的に機能しているのです。 URL の言語問題は、インターネットが英語圏で生まれたという歴史的な事実と、世界中の人々がインターネットを使うという現実の間にある、まだ解決されていない課題なのです。