Как выглядит адрес сайта

URL (Uniform Resource Locator) – это индикатор положения ресурса в Интернете. Это адрес страницы сайта, который состоит из домена, пути к странице и наименования ее файла. В 1990 г. Тим Бернерс-Ли, участвовавший в Европейском совете по ядерным исследованиям в Женеве, придумал URL, на тот момент представлявший собой адрес расположения файлов.

Вместе с явными достоинствами URL имеет существенный недостаток. В нем могут использоваться только латинские буквы и некоторые символы в адресе. В противном случае под влиянием особого алгоритма адрес кодируется в шестнадцатеричном представлении, что значительно ущемляет другие языки. Для этого используется международный индикатор сайтов IRI, позволяющий прописывать любые символы Юникода. Длину URL ограничивают только браузеры. Не рекомендуется использовать больше 2048 символов.

Структура URL сайта

Изначально для URL-адреса была заложена понятная, удобная и легко расширяемая структура. Традиционная форма представлена следующим образом:

Каждый идентификатор имеет свое назначение.

  • Схема – протокол, который будет использоваться для передачи данных. Например, стандартный http, защищенное соединение https, ftp – передача файлов по TCP-сетям и другие.
  • Логин и пароль – конфиденциальные данные, которые определяют права доступа пользователя к конкретному ресурсу. Не указываются в протоколе http. Например, используются в ftp для авторизации на сервере.
  • Хост – доменное имя или IP-адрес, на котором расположен сервер, сайт.
  • Порт – используется в основном для подключения к ftp, а в http не указывается и проставляется автоматически как 80, 8080.
  • URL-путь – точный адрес к конкретному файлу (странице).
  • Параметры – отдельные запросы, посылаемые методом GET на сервер с передаваемыми значениями параметров.
  • Якорь – это уникальная строка на странице, которой заранее присваивается URL-идентификатор со знаком #. При нажатии на ссылку с якорем пользователь попадает сразу в нужный фрагмент текста. Активно используется на форумах, в комментариях, в заголовках для быстрой навигации.

Схемы (протоколы) URL

На 2017 год разработано и введено огромное количество протоколов как для передачи файлов в разных сетях, так и для быстрого взаимодействия с определенными сервисами, программным обеспечением в сети. Схемы делятся на 3 категории.

Общепринятые:

  • ftp – передача данных через FTP-клиент;
  • https – протокол с шифрованием;
  • mailto – запуск почтовой службы и отправка писем;
  • xmpp – протокол XMPP в Jabber и других клиентах.

Экзотические:

  • skype – взаимодействие с программой Skype;
  • ednk – протокол файлообменника eDonkey;
  • bitcoin – биткоин;
  • steam – сервис цифровых покупок Steam, быстрое подключение к серверам игр;
  • tg – мессенджер Telegram.

Протоколы в браузерах:

  • opera – служебные настройки и страницы браузера Опера;
  • browser – служебные настройки и страницы браузера от Яндекса;
  • chrome – служебные настройки и страницы Google Chrome.

Мы перечислили лишь основные примеры протоколов URL для каждой категории, но на самом деле их значительно больше.

Кодирование URL

Для кодирования адресов используется набор символов US-ASCII, но его ограничение имеет существенные недостатки. Он предусматривает взаимодействие только с буквами латиницы и некоторыми символами. Для поддержки кириллицы используется перекодировка.

Реализация. Если системе необходимо перекодировать кириллицу в латиницу, преобразование осуществляется в 2 этапа.

  • Все символы кодируются в формате UTF-8 в определенной последовательности из 2 байтов.
  • Вся последовательность кодированных байтов записывается в шестнадцатеричной системе исчисления с использованием знака процента (%).

Стандарт IRI. Так как использование символов в URL ограничено только латиницей, это ущемляет права других стран и народов, поэтому данную проблему можно решить с помощью стандарта IRI, который расшифровывается как «международный идентификатор ресурсов». Он был закреплен в 2005 году как альтернатива URL, в котором могут использоваться любые символы и буквы Юникода.

Инициатива PURL

Одна из существенных проблем, которая наблюдается в использовании URL сайта, – это отсутствие какой-либо гибкости. Например, вы выложили информацию в Интернете по определенному адресу, разослали письма друзьям, разместили ссылки на других сайтах, но в какой-то момент поменяли его. В итоге пользователи, которым вы ранее сообщали о рабочем URL, смогут перейти на нужную страницу только в том случае, если корректно настроен редирект.

Читайте также:  Как поменять графический ключ на ксиоми

Технология PURL предназначена для того, чтобы создать общий каталог, где будут храниться все URL. Пользователь обращается к PURL, сервер автоматически находит нужный URL, и система переадресовывает человека по адресу, который ему был нужен. Если же адрес поменяется, то достаточно изменить запись в базе данных PURL.

Виды URL

URL с идентификатором сессий. У адреса может быть отдельный идентификатор SID, который автоматически добавляется при каждом посещении страницы разными пользователями. В основном такие URL используются для массового сбора статистики о посетителях и их поведении для дальнейшего анализа.

Статические URL. Информация на странице постоянна и не меняется. Используются для формирования качественного контента на сайте.

Динамические URL. Генерируют информацию автоматически в зависимости от запросов пользователей. В основном используются в скриптах для фильтрации контента, вывода различных форм поиска и прочих удобств навигации. Поисковые роботы обычно игнорируют динамические URL и не индексируют их.

Формирование ЧПУ

ЧПУ – это тоже пример URL, который переводится как «человекопонятный URL». Используется во многих CMS благодаря встроенным инструментам или дополнительным модулям и плагинам. Приводит вид URL к понятной и логической структуре, например site.ru/content/car.

С помощью ЧПУ легче создавать и отслеживать структуру сайта, изменять URL, вести аналитику в панели веб-мастера. В адресе могут использоваться только латинские буквы и некоторые символы.

Единый указатель ресурса (от англ. Uniform Resource Locator — унифицированный указатель ресурса, сокр. URL [ ˌjuː ɑːr ˈel ]) — система унифицированных адресов электронных ресурсов, или единообразный определитель местонахождения ресурса (файла) [1] .

Используется как стандарт записи ссылок на объекты в Интернет (Гипертекстовые ссылки во «всемирной паутине» www).

Содержание

История [ править | править код ]

URL был изобретён Тимом Бернерсом-Ли в 1990 году в стенах Европейского совета по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN ) в Женеве, Швейцария. URL стал фундаментальной инновацией в Интернете. Изначально URL предназначался для обозначения мест расположения ресурсов (чаще всего файлов) во Всемирной паутине. Сейчас URL применяется для обозначения адресов почти всех ресурсов Интернета. Стандарт URL закреплён в документе RFC 3986. Сейчас URL позиционируется как часть более общей системы идентификации ресурсов URI, сам термин URL постепенно уступает место более широкому термину URI. Стандарт URL регулируется организацией IETF и её подразделениями.

В 2009 году Тим Бернерс-Ли высказал мнение об избыточности двойного слеша // в начале URL, после указания сетевого протокола [2] .

Структура URL [ править | править код ]

Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор ASCII‐символов (к примеру, пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:

схема схема обращения к ресурсу; в большинстве случаев имеется в виду сетевой протокол логин имя пользователя, используемое для доступа к ресурсу пароль пароль указанного пользователя хост полностью прописанное доменное имя хоста в системе DNS или IP-адрес хоста в форме четырёх групп десятичных чисел, разделённых точками; числа — целые в интервале от 0 до 255. порт порт хоста для подключения URL-путь уточняющая информация о месте нахождения ресурса; зависит от протокола. параметры строка запроса с передаваемыми на сервер (методом GET) параметрами. Начинается с символа ? , разделитель параметров — знак & . Пример: ?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3 якорь идентификатор «якоря» (англ.) русск. с предшествующим символом # . Якорем может быть указан заголовок внутри документа или атрибут > (англ.) русск. элемента. По такой ссылке браузер откроет страницу и переместит окно к указанному элементу. Например, ссылка на этот раздел статьи: https://ru.wikipedia.org/wiki/URL#Структура_URL .

Схемы (протоколы) URL [ править | править код ]

Общепринятые схемы (протоколы) URL включают:

  • ftp — Протокол передачи файлов FTP
  • http — Протокол передачи гипертекстаHTTP
  • rtmp — Real Time Messaging Protocol проприетарный протокол потоковой передачи данных, в основном используется для передачи потокового видео и аудиопотоков с веб-камер через интернет.
  • rtsp — Потоковый протокол реального времени.
  • https — Специальная реализация протокола HTTP, использующая шифрование (как правило, SSL или TLS)
  • gopher — Протокол Gopher
  • mailto — Адрес электронной почты
  • news — Новости Usenet
  • nntp — Новости Usenet через протокол NNTP
  • irc — Протокол IRC
  • smb — Протокол SMB/CIFS
  • prospero — Служба каталогов Prospero Directory Service
  • telnet — Ссылка на интерактивную сессию Telnet
  • wais — База данных системы WAIS
  • xmpp — Протокол XMPP (часть Jabber)
  • file — Имя локального файла
  • data — Непосредственные данные (Data: URL)
  • tel — звонок по указанному телефону
Читайте также:  Как делают видео игры

Экзотические схемы URL:

  • afs — Глобальное имя файла в файловой системе Andrew File System
  • cid — Идентификатор содержимого для частей MIME
  • mid — Идентификатор сообщений для электронной почты
  • mailserver — Доступ к данным с почтовых серверов
  • nfs — Имя файла в сетевой файловой системе NFS
  • tn3270 — Эмуляция интерактивной сессии Telnet 3270
  • z39.50 — Доступ к службам ANSI Z39.50
  • skype — Протокол Skype
  • smsto — Открытие редактора SMS в некоторых мобильных телефонах
  • ed2k — Файлообменная сетьeDonkey, построенная по принципу P2P
  • market — Android Маркет
  • steam — протокол Steam
  • bitcoin — Криптовалюта Биткойн
  • ob — OpenBazaar
  • tg — Telegram

Схемы URL в браузерах:

  • view-source — просмотр исходного кода указанной web-страницы в различных браузерах.
  • chrome — служебные страницы браузера Google Chrome или браузеров на движке Gecko [3] . В Яндекс. Браузере перенаправляет на browser://
  • opera — служебные страницы браузера Opera.
  • browser — служебные страницы Яндекс.Браузера.
Официальные Неофициальные

Кодирование URL [ править | править код ]

Стандарт URL использует набор символов US-ASCII. Это имеет серьёзный недостаток, поскольку разрешается использовать лишь латинские буквы, цифры и несколько знаков пунктуации. Все другие символы необходимо перекодировать. Например, перекодироваться должны буквы кириллицы, буквы с диакритическими знаками, лигатуры, иероглифы. Перекодирующая кодировка описана в стандарте RFC 3986 и называется URL-encoding, URLencoded или percent‐encoding .

Пример кодирования можно видеть в русскоязычной Википедии, использующей в URL русский язык. Например, строка вида:

Реализация [ править | править код ]

Преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в UTF-8 в последовательность из двух байтов, а затем каждый байт этой последовательности записывается в шестнадцатеричном представлении с предшествующим знаком процента (%):

Не зарезервированные символы [4]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
0 1 2 3 4 5 6 7 8 9 _ .

Все другие символы в URI кодируются.

Зарезервированные символы кодируются в таком соответствии:

! " # [5] $ % & [5] * + , [5] : [5] ; [5] [5] > ? [5] [ ] ^ ` < | >
%21 %22 %23 %24 %25 %26 %27 %2A %2B %2C %3A %3B %3C %3D %3E %3F %5B %5D %5E %60 %7B %7C %7D %20 [6]

Кодирование параметров в Internet Explorer и старом Firefox происходит несколько иначе [7] .

В некоторых случаях URL формируется с использованием кодирования Base58 [8] .

Стандарт IRI [ править | править код ]

Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами подавляющего большинства языков может стать нечитаемым для человека.

Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и ISOC. Эту проблему призван решить стандарт IRI (англ. Internationalized Resource Identifier ) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда‐либо идентификаторы IRI заменить столь широко используемые URL (и URI в целом).

Ограничение длины [ править | править код ]

Формально, длина URL не ограничена, но браузеры имеют ограничения по длине URL. Не рекомендуется использовать URL длиной более 2048 символов, так как Microsoft Internet Explorer имеет именно такое ограничение [9] .

Инициатива PURL [ править | править код ]

Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы PURL (англ. Persistent Uniform Resource Locator ). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL‐адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.

Читайте также:  Как посмотреть пароль вифи на андроид

21 ноября 2017 года. Опубликовано в разделах: Азбука терминов. 30573

Больше видео на нашем канале — изучайте интернет-маркетинг с SEMANTICA

Чтобы лучше понять, что значит адрес сайта, его можно сравнить с номером книги в библиотеке. По номеру библиотекарь найдет для вас нужную книжку. В случае с сайтом в качестве библиотекаря выступает браузер. Задав в адресной строке адрес сайта, браузер найдет и откроет его.

Чтобы браузер нашел требуемую страницу, ее адрес обязательно должен быть указан верно. Эта ситуация аналогична отправке письма по почте. Если допустить ошибку в указании реквизитов почтового адреса (страна проживания, город, улица, дом, квартира), то письмо не дойдет до получателя.

Как узнать веб адрес сайта

Адрес сайта еще называют URL (от англ. Uniform Resource Locator). Пример адреса сайта выглядит так:

Самый простой способ узнать адрес сайта – это просто скопировать его из адресной строки.

URL имеет не только страница в целом, но и отдельные ее элементы, в частности изображения. Узнать адрес, например, картинки можно нажав на ней правой клавишей мыши и выбрав из выпадающего списка пункт «Копировать URL-Картинки».

Таким же образом можно получить и URL всего документа, выбрав из выпадающего списка пункт «Копировать адрес ссылки» кликнув по нужной ссылке.

Структура URL адреса

Подобно почтовому адресу, URL имеет свои реквизиты. Рассмотрим его структуру:

  1. Протокол – регламентирует обмен данных между различными ресурсами. В частности протокол http указывает на ресурс WWW, протокол ftp указывает на ресурс FTP и т.д. В адресной строке браузера протокол отделяется от остальных реквизитов следующей конструкцией: ://.
  2. Авторизация.
  3. Хостинг – номер устройства (узла) в локальной либо глобальной сети.
  4. Порт – номер вводного канала. Если на сервере таких каналов несколько, то укажите тот, через который будет вводиться информация.
  5. Путь – сведения о способе получения доступа.
  6. Параметры – сведения, согласно которым страница будет структурирована.

Каким должен быть адрес

Основная часть URL адреса – это доменное имя сайта, которое во многом повлияет на его посещаемость. Существует ряд критериев, которыми следует руководствоваться при создании адреса сайта:

  1. Краткость. Пользователю проще запомнить пару связных слов, чем длинную фразу или комбинацию бессвязных символов. Короткое имя, размещенное в наружной рекламе или на странице печатного издания привлекает внимание и надолго остается в памяти. Это дает хорошую предпосылку для дальнейшего посещения ресурса.
  2. Презентабельность. Доменное имя должно выгодно представить содержимое ресурса. Чаще всего используют или название организации, или вид ее деятельности, или имя человека, о котором говорится на сайте. Это косвенный элемент рекламной кампании, который, при правильном подходе, даст хорошие результаты.
  3. Красивое название. Оно позволит сделать ресурс более солидным в глазах потенциальных пользователей. Длинное и непонятное доменное имя говорит о том, что владелец ресурса не расщедрился на покупку красивого домена. Это может отпугнуть потенциальных клиентов.

Как URL адрес влияет на SEO

Грамотно составленный URL является одним из инструментов SEO. Правильная структура адреса способствует быстрой индексации веб сайта, что поможет поднять его ранг. Для этого необходимо следовать ряду рекомендаций:

  1. В имени домена допускается использование ключевых слов в разбавленном вхождении. Это позволит повысить позицию в системе ранжирования. Однако, не стоит составлять домен из одних ключевых слов, в точности соответствующих предполагаемому запросу. Алгоритм ранжирования Google может исключить такой сайт из выдачи.
  2. Доменную зону лучше выбирать, ориентируясь на местоположение предполагаемой аудитории. Так, зона .ru увеличит поток российского трафика.
  3. Глубина подкаталогов в доменном имени также повышает позиции ресурса в системе ранжирования. Особенно это справедливо для подкаталогов, именованных ключевыми словами.
  4. В идеале урл должен быть читаемым и понятным человеку (ЧПУ),
Adblock
detector