Содержание
World Wide Web (Всемирная Паутина) -- это сеть информационных ресурсов. Сеть (Web) полагается на следующие три механизма для предоставления этих ресурсов для наиболее широкой аудитории:
Связи между этими тремя механизмами ясно представлены в настояшей спецификации.
Каждый ресурс доступный по Сети -- документ HTML, изображение, видео клип, программа, и т.п. -- обладает адресом который может быть закодирован при помощи Единого Указателя Ресурса (Uniform Resource Locator), или "URL"-а (читается "ю-ар-эл").
URL-ы обычно состоят из трех частей:
Рассмотрим URL указывающий на данную спецификацию HTML:
http://www.w3.org/TR/PR-html4/cover.html
Этот URL может быть расшифрован следующим образом: Имеется документ доступный посредством протокола HTTP (см. [RFC2068]), находящийся на компьютере с именем www.w3.org, кооторый может быть найден следуя пути "/TR/PR-html4/cover.html". Другие абревиатуры протоколов которые могут встречаться в документах HTML включают "mailto" для электронной почты и "ftp" для FTP.
Приведем еще один пример URL. Этот URL указывает на почтовый ящик пользователя:
...некоторый текст... Пожалуйста посылайте электронную почту с коментариями на имя <A href="mailto:joe@someplace.com">Joe Cool</A>.
Некоторые URL-ы указывают на определенное место в пределах ресурса. Этот тип URL-ов оканчивается символом "#" за которым следует идентификатор якоря (называемый "идентификатором фрагмента"). На пример, URL указывающий на якорь с именем section_2 выглядит вот так:
http://somesite.com/html/top.html#section_2
Относительный URL не содержит информации о протоколе. Как правило, его путь указывает на ресурс на том-же компьютере что и текуший документ. Относительные URL-ы могут содержать относительные компоненты пути (".." означает один уровень вверх по иерархии определяемой путем), а так-же идентификаторы фрагментов.
Относительные URL-ы разрешаются до полных URL-ов используя базовый URL. В качестве примера разрешения относительного URL-а, допустим что мы имеем базовый URL "http://www.acme.com/support/intro.html". Относительный URL в следующей разметке для гипертекстовой ссылки:
<A href="suppliers.html">Поставщики</A>
разворачивается до полного URL-а "http://www.acme.com/support/suppliers.html", в то время как относительный URL в следующей разметке для изображения
<IMG src="../icons/logo.gif" alt="эмблема">
разворачивается до полного URL-а "http://www.acme.com/icons/logo.gif".
В HTML, URL-ы используются в следующих ситуациях:
За дальнейшей информацией об URL-ах обращайтесь к разделу о типе URL.
Для того чтобы публиковать информацию для повсеместного распространения, необходимо иметь язык понятный для всех, вариант родного издательского языка который в принципе был бы понятен всем компьютерам. Издательский язык используемый на World Wide Web называется HTML (от английского HyperText Markup Language --- язык разметки гипертекста).
HTML дает авторам следующие возможности
HTML был впервые разработан Тимом Бернерс-Ли (Tim Berners-Lee) в то время когда он работал в ЦЕРНе и приобрел популярность благодаря броузеру "Мозаика" разработанному в NCSA. В 90-х годах HTML расцвел благодаря взрывообразному росту Сети. В то-же время HTML был расширен во многих направлениях. Для существования сети необходимо чтобы авторы сетевых страниц и производители програмного обеспечения пользовались одними и теми-же соглашениями об HTML. Это и послыжило причиной для начала совместной работы по созданию спецификации для HTML.
HTML 2.0 (Ноябрь 1995, см. [RFC1866]) был разработан под эгидой Internet Engineering Task Force (IETF) с целью формализовать сложившуюся на конец 1994 года практику. HTML+ (1993) и [HTML30] (1995) предложили значительно более богатые версии HTML. Не смотря на то что эти предложения так и не получили всеобщей поддержки при обсуждении стандарта, они привели к принятию ряда новых возможностей. Усилия рабочих груп WWW консортиума по формализации сложившейся практики в 1996 году привели к созданию HTML 3.2 (Январь 1997, см. [HTML32]).
Хотя большинство людей согласно что HTML документы должны читаться всеми броузерами и на всех компьютерных платформах, достижение этой цели означает дополнительные затраты для издателей так как они должны разрабатывать различные версии документов. Однако, если этого не делать то существует еще больший риск того что Сеть превратится в мир собственников с несовместимыми форматами что в конечном итоге уменьшит комерческий потенциал Сети для всех участников.
В каждой версии HTML пытался отразить все большеее согласие между производителями так чтобы усилия и затраты издателей не оказались выброшеными впустую и их документы не стали вскоре нечитаемыми.
HTML разрабатывался с учетом того, что всевозможные устройства должны иметь возможность использовать информацию из Сети: ПК с экранами обладающими различным разрешением и количеством цветов, сотовые телефоны, миниатюрные устройства, устройства для речевого ввода-вывода, компьютеры с высокой и низкой пропускной способностью и т.д.
HTML 4.0 расширяет HTML добавляя механизмы для листов стилей, использования сценариев, рамок, вложенных объектов, улучшенную поддержку для справа на лево и смешанного направления текста, более богатые таблицы, улучшения для форм направленные на облегчение доступа к ним инвалидам.
В разработке настоящей версии HTML участвовали эксперты по интернационализации с тем чтобы документы могли писаться на любом языке и легко передаваться по всему миру. Это было достигнуто с принятием [RFC2070], стандарта который описывает интернационализацию HTML.
Одним из важных шагов было принятие стандарта ISO/IEC:10646 (см. [ISO10646]) в качестве набора символов для HTML. Это самый инклюзивный стандарт в мире относящийся к вопросам представления национальных символов, направления текста, пунктуации, и другим вопросам о языках мира.
Теперь HTML предоставляет большую поддержку для различных языков в документе. Это позволяет более эфективно индексировать документы для поисковых машин, поддерживать печать высокого качества, лучшее речевое воспроизведение, правильную расстановку переносов и т.д.
По мере того как сетевое сообщество растет, его члены все более разнятся по своим возможностям и умениям, и потому очень важно чтобы технологии соответствовали их конкретным требованиям. HTML разрабатывался так чтобы обеспечить доступ к информации в том числе и людям с физическими недостатками. Достижения HTML 4.0 в области универсального доступа включают:
Авторы, которые разрабатывают страницы с учетом универсального доступа, выигрывают не только благодаря благословению от тех кто нуждается в таком доступе, а также благодаря тому что правильно оформленые HTML документы, которые разделяют структуру и оформление легче приспособить к новым технологиям.
Новый шаблон для таблиц в HTML основывается на [RFC1942]. Теперь авторам предоставлен больший контроль за структурой и версткой (к примеру группы столбцов). Дизайнеры могут указывать рекомендуемую ширину колонок, что позволяет пользовательским програмам отображать данные по частям (по мере того как они приходят) вместо того чтобы ждать пока вся таблица будет загружена до того как ее можно будет воспроизвести.
Осторожно! В настоящее время некоторые редакторы HTML широко используют таблицы для форматирования. Подобная практика может легко провести к проблемам доступа.
Теперь HTML предлагает стандартный механизм для включения произвольных видов информации и програмных приложений в документы HTML. Элемент OBJECT (а также его более специализированные предтечи IMG и APPLET) предоставляет механизм для вставки изображений, видео, звука, математических формул, специализированых програмных приложений и других объектов в документ. Он также позволяет авторам указывать иерархию альтернативных воспроизведений для пользовательских агентов которые не поддерживают конкретного воспроизведения.
Листы стилей упрощают разметку HTML и по большому счету освобождают HTML от ответственности за оформление. Они дают как авторам так и пользователям контроль над оформлением документов --- информация о шрифтах, выравнивание, цвета, и т.п.
Информация о стиле может быть
Механизм привязки листа стилей к документу не зависит от языка на котором лист стилей написан.
До выхода на сцену листов стилей, у авторов был ограниченный контроль над воспроизведением документа. HTML 3.2 включал некоторое число атрибутов и элементов которые осуществляли контроль над выравниванием, размером шрифта и цветом текста. Авторы также использовали таблицы и изображения как средства для верстки страниц. Учитывая, что переход на современные броузеры может занять сравнительно долгий срок, эти средства еще некоторое время будут использоваться. Однако, так как листы стилей предоставляют значительно более мощный механизм для представления, консортиум WWW в конечном итоге исключит многие из этих элементов и атрибутов. На протяжении спецификации элементы и атрибуты из групы риска будут отмечатся как "устаревшие". Их описание будет как правило сопробождаться описанием того как достичь тех-же эфектов используя листы стилей.
Настоящая спецификация включает три Определения Типа Документа (DTD, Document Type Definition) которые можно использовать для проверки документов написанных в HTML 4.0. Одно для использования с наборами рамок (frameset), вольное DTD для переходных документов и строгое DTD которе исключает устаревшие элементы и атрибуты.
Используя сценарии, авторы могут создавать "умные формы" которые реагируют по мере того как пользователь их заполняет. Сценарии позволяют создавать динамические страниицы а так-же использовать HTMLкак средство для построения сетевых приложений. Механизмы предоставленные дле связывания HTML со сценариями не зависят от конкретных языков сценариев.
Черты HTML (элемент LINK) позволяют агентам пользователя печатать собрание документов в разумном виде полагаясь на описания взаимоотношений между документами представляющими части большей работы.
Мы рекомендуем авторам и разработчикам соблюдать следующие общие принципы при работе с HTML 4.0.
HTML произрастает из SGML, языка который всегда был языком для описания структурной разметки. По мере того как HTML созревает, все более и более елементы представления в нем заменяются другими механизмами, в частности листами стилей. Опыт показывает, что разделение структуры и представления документа уменьшает стоимость поддержки широкого спектра платформ, сред и т.п., а так-же облегчает внесение исправлений в доцументы.
Для того чтобы сделать Сеть более доступной для всех, в особенности для людей с физическими недостатками, авторы должны учитывать то как их документы могут быть воспроизведены на различных платформах: броузерах с речевым воспроизведением, устройствах для чтения по азбуке Брайля и т.п. Эта рекомендация не означает что дизайнеры должны ограничивать себя в творчестве, лишь то что они должны учитывать альтернативное воспороизведение в своих проектах. Для этого HTML предлагает набор механизмов (например, атрибут alt атрибут accesskey и т.п.)
Более того, авторы должны иметь ввиду что их документы могут достигать отдаленныю аудиторию с различными конфигурациями компьютеров. Для того чтобы доцументы правильно интерпретировались, дизайнеры должны включать в свои документы информацию о языке и направлении текста, о том как доцумент закодирован и другие атрибуты интернационализации.
Тщательно проектируя свои таблицы и используя новые возможности HTML 4.0, дизайнеры могут способствовать пользовательским агентам в более быстром воспроизведении документов.