Как http://d§.cc/ действительный URL?

Просматривая онлайн сегодня, я наткнулся на следующий URL:

http://d§.cc/

Как-то это работает. В Firefox 3.6/Mac браузер интерпретирует URL как:

http://xn--d-jca.cc/

В Safari 5/Mac URL-адрес не изменяется при переходе к нему.

Я всегда понимал, что символ § ( знак раздела), среди прочего, недопустим в URL. Цитировать RFC 1738:

Таким образом, только буквенно-цифровые символы, специальные символы "$-_.+!*'()," И зарезервированные символы, используемые для их зарезервированных целей, могут быть использованы в URL без кодирования.

Это странность кодировки символов? И как / где я могу зарегистрировать свой собственный § URL?

2 ответа

Решение

Это интернационализированное доменное имя или IDN. Используемая кодировка называется punycode.

Многие крупные регистраторы занимаются продажей доменных имен IDN, включая GoDaddy, но когда я зарегистрировал свой тщеславный IDN (ə.tv), я обнаружил, что Name.com проще. Они стоят столько же, сколько "обычные" домены.

Ниже приведен список допустимых символов IDN - однако учтите, что многие из этих символов не будут отображаться правильно во всех шрифтах, поэтому, если вы хотите купить IDN, убедитесь, что вы тестировали его в часто используемых шрифтах на вашем компьютере. целевые платформы перед покупкой.

Это называется IDN (интернационализированное доменное имя). Это не имеет ничего общего с URI, это особенность DNS (Domain Name System), которая разрешает понятные человеку имена DNS, такие как www.example.com в IP-адреса, такие как 127.0.0.1,

Поскольку изначально система доменных имен была только ASCII, IDN была введена обратно совместимым образом: DNS-имена, содержащие символы не-ASCII, кодируются в DNS-имена, содержащие только символы ASCII, с использованием алгоритма Punycode, который специально разработан для эффективен для типов строк, которые обычно содержатся в DNS-имени и все же могут быть несколько удобочитаемыми даже в закодированном виде.

Основная цель IDN, как следует из названия, состоит в том, чтобы сделать возможным регистрацию доменных имен на языках, отличных от английского. Однако побочным эффектом является то, что теперь все имена Unicode, включая символы, которые на самом деле не имеют ничего общего с неанглийскими языками, могут использоваться в доменных именах.

Другие вопросы по тегам