URI - Система адресации в WWW пространстве

В информационном WWW пространстве все ресурсы имеют единую адресацию, которая называется URI - Uniform Resource Identifiers. Адреса URI автоматически присваиваются всем ресурсам сети Интернет независимо от методов доступа к ним (HTTP, FTP, Internet mail и т.п.).

Общая схема формирования адресов:

 _______________________________________________________
|    _________________                                  |
|   |  ftp:          |                                  |
|   |  gopher:       |                                  |
|   |  http:       _______________                      |
|   |  etc        |  |  urn:      |                     |
|   |_____________|__|  fpi: ?    |                     |
|      URLs       |               |                     |
|                 |_______________|                     |
|                       URNs                            |
|_______________________________________________________|
                               URIs
Терминология:
URI
Uniform Resource Idenifier.
Множество всех имен и адресов (names/addresses) ресурсов WEB пространства (см. URI specification).
URL
Uniform Resource Locator.
Множество URI схем которые дают точную инструкцию по доступу к ресурсу через Интернет. (см. URL specification).
URN
Uniform Resource Name.
  1. Это некоторый URI, который дает расширенную инструкцию возможной передачи ресурса. (это относится и к URL). Например, PURLs.
  2. Частичная схема передачи ресурсов, которая развивается в настоящий момент IETF. Позволяет использовать в интернетовских протоколах имена, которые являются нестандартными (например, содержат русские буквы).
URC
Uniform Resource Citation или Uniform Resource Characteristics.
Множество пар метаданных attribute/value, которые описывают ресурс. Некоторые из них могут быть URIs различного вида. В эти писания могут быть включены, например, authorship, publisher, datatype, date, copyright status and shoe size (см. Metadata and RDF).

Адрес URL - Uniform Resource Locator

Система адресации и собственно сами адреса в HTML документах называются URL (см. также URI). Что такое URL? URL - это аббревиатура от Uniform Resource Locator. Адрес URL является сетевым расширением понятия полного имени файла в операционной системе (пути к файлу filename). В этой адресации кроме имени файла и директории, где он находится указывается сетевое имя машины, на которой этот файл расположен и метод доступа к файлу, который можно использовать для его просмотра или загрузки.

Методы доступа

С помощью URL, описывающих различные методы доступа к удаленным системам, можно запускать удаленные программы и передавать им значения. На этом принципе построены шлюзы в другие интернетовские сервисы, например, finger, archie,..... и др.

Рассмотрим несколько наиболее часто используемых типов URL адресов и методов доступа.

Файлы

Допустим, файл с именем    "internet.zip"    лежит на FTP-сервере    ftp.ict.nsc.ru    в директории    /pub/winsite/www/.    Тогда URL адрес этого файла будет выглядеть так:

file://ftp.ict.nsc.ru/pub/winsite/www/internet.zip

Пример URL адреса директории, в которой лежит файл:

file://ftp.ict.nsc.ru/pub/winsite/www/

Понятно, что URL адрес корневой директории FTP сервера    ftp.ict.nsc.ru    выглядит вот так:

file://ftp.ict.nsc.ru/

Кстати вместо сетевого имени машины    ftp.ict.nsc.ru    можно указать ее IP-адрес   193.124.243.76.   Это часто бывает полезно для ускорения работы с удаленными системами при невысокой скорости передачи данных, поскольку в этом случае нет необходимости обращаться к службе DNS для поиска сетевого адреса, по которому идет маршрутизация IP-пакетов.

FTP адрес

Если вам необходимо явно указать, что выбранный вами файл следует загрузить с FTP сервера на машину клиента, то в URL адресе файла следует явно указать тип протокола, например:
ftp://ftp.ict.nsc.ru/pub/winsite/www/internet.zip

Gopher URLs

Адреса Gopher URL's не так разнообразны, как файловые. Это связано с ограниченностью этого сервиса. Для того, чтобы задать, например, gopher сервер Новосибирского государственного университета   gopher.nsu.ru,   необходим URL:
gopher://gopher.nsu.ru/

Некоторые gopher сервера могут находиться на нестандартном номере порта (по умолчанию обычно используется 70 порт). В этом случае он должен явно указываться:

gopher://gopher.banzai.com:7070/
Здесь 7070 - номер порта.

HTTP URLs

HTTP -- HyperText Transport Protocol (протокол передачи гипертекста). HTTP сервера обычно используются для предоставления гипертекстовых документов. Такие документы, в отличие от обычных, имеют ссылки на другие документы (не обязательно расположенных на этом же сервере) и состоят из текста, графики, звуков, анимации.

Для вызова документа   "url.html",   который находится в директории /win/docs/html/ WWW сервера www.ict.nsc.ru необходим следующий URL адрес:

http://www.ict.nsc.ru/win/docs/html/url.html

По умолчанию все программы по протоколу HTTP ищут WWW сервер на 80 порту, но можно и явно указать порт (также как и в gopher'e).

http://www.weblab.com:1234/pub/files/foobar.html

Частичные URL

Частичные URL используются только при протоколом передачи гипертекста (HTTP). Если вы внимательно посмотрите на исходники какого-нибудь гипертекстового документа и обратите внимание на то, как указаны ссылки на другие URL, то заметите, что встречаются два вида:

<A Href="http://www.w3c.net/WWW/url.html">URL</A>

<A Href="docs.html">Документация</A>

Первый пример - это полный URL, а второй - частичный. Частичный URL указывает на документ, который находится на том же сервере и в той же директории, где и документ, в котором встречается эта ссылка. Так, например, если документ, где вы нашли эти две строчки, имел URL http://www.w3c.net/WWW/foo.html, то полный URL у второго частичного должен выглядеть как http://www.w3c.net/WWW/docs.html.

Сокращенные URL адреса определяются по правилам, принятым в операционной системе UNIX. Например, адрес ../win/file.html означает переход на одну директорию вверх и выбор файла из поддиректории   win   с именем file.html или адрес /docs/ball.gif - переход в корневую директорию и выбор файла с полным именем /docs/ball.gif.

Другие URL адреса

Приведем несколько других типов задание доступа к удаленным системам:

<A HREF="mailto:...">
Задание адреса электронной почты для автоматической отправки сообщения через просмотрщик:
<A HREF="mailto:root@ict.nsc.ru"> root@ict.nsc.ru</a>
<A HREF="news:...">
Задание связи с севером NewsGroup
<A HREF="telnet://...">
Задание связи через   TELNET.
<A HREF="wais://...">
Задание связи с сервером WAIS.
Это, конечно, не полный список возможных URL адресов, ввиду того, что постоянно вводятся в обращения новые методы доступа к данным

Более полную информацию об URL Вы можете получить, обратившись в:


ИВТ Федотов А.М. Введение в Internet
Документация по Интернет технологиям

Начало создания курса: Mondy, 19-Aug-1996 10:12:15 NOVST
Дата последней модификации: Thursday, 11-May-2000 10:51:34 NOVST
© 1996 - 2001, А.М.Федотов
© 1996 - 2001, Институт вычислительных технологий СО РАН, Новосибирск