Содержание
Данный раздел спецификации описывает основные типы данных, которые могут быть использованы в содержании элементов или значениях атрибутов.
Вводную информацию относительно чтения HTML DTD, можно получить в "Учебнике по SGML".
Каждое описание атрибута включает информацию относительно того, чувствительно к регистру его значение или нет. Информация о регистре представлена следующими ключами:
Если значением атрибута является список, ключи применяются к каждому значению в списке, если не указано иное.
"Декларация типа документа" определяет синтаксис содержания элемента и значения атрибута HTML, используя лексемы SGML (например: PCDATA, CDATA, NAME, ID, и т.п.). Их полное описание смотрите в [ISO8879]. Ниже приведена обобщенная информация о ключах:
Средства просмотра могут игнорировать директивы и оставлять пустое пространство в значении атрибута CDATA (например: " myval " может быть интерпретировано как "myval"). Авторам не следует объявлять значения атрибутов с директивами или оставленным пустым пространством.
Для некоторых атрибутов HTML 4.0 со значением атрибута CDATA, спецификация налагает дальнейшее принуждение на установку правильных значений для атрибута, которое не может быть выражено при помощи DTD.
Несмотря на то, что элементы STYLE и SCRIPT используют CDATA для их моделей данных, для этих элементов атрибут CDATA должен по-разному обрабатываться средствами просмотра. Разметка и объекты должны обрабатываться, как простой текст и передаваться приложению "как есть". Первое расположение последовательности символов "</" (разделитель, открывающий заключительный тег) обрабатывается как ограничивающий содержание атрибута. В реальных документах это будет завершающим тегом для элемента.
Нумерация атрибутов ( %Text; в DTD), делает текст более "читабельным для человека". Вводную информацию относительно атрибутов можно найти в "Обучающем обсуждении атрибутов".
Данная спецификация использует термин URI, как он описан в [URI] (также смотрите [RFC1630]).
Заметьте, что URI-ли включают в себя и URL-ли (как они описаны в [RFC1738] и [RFC1808]).
Относительные URI-ли переводятся в полные URI-ли при помощи базовых URI-лей. Раздел 3 в [RFC1808] определяет нормативный алгоритм для этого процесса. Дополнительную информацию о базовых URI-лях можно найти в разделе "Базовые URI-ли" в главе "Связи".
URI-ли представляются в DTD параметерной сущностью "%URI;".
URI-ли, как правило, чувствительны к регистру. Могут существовать URI-ли, или их части, где регистр не имеет значения (например имена машин), но идентифицировать это не всегда легко. Пользователям следует всегда считать, что URI-ли чувствительны к регистру (на всякий случай).
Информацию о "не-ASCII символах" в значениях атрибутов URI смотрите в Приложениях.
Тип значения атрибута "color" (цвет, %Color;), ссылается на определение цвета, как описано в [SRGB]. Значение цвета может быть как шестнадцатеричным числом (предваряемым знаком "#"), так и одним из нижеприведенных шестнадцати имен цветов. Имена цветов нечувствительны к регистру.
Black (Черный) = "#000000" | Green (Зеленый) = "#008000"
| ||
Silver (Серебряный)= "#C0C0C0" | Lime (Светло-зеленый) = "#00FF00"
| ||
Gray (Серый) = "#808080" | Olive (Оливковый) = "#808000"
| ||
White (Белый) = "#FFFFFF" | Yellow (Желтый) = "#FFFF00"
| ||
Maroon (Коричневый) = "#800000" | Navy (Темно-синий) = "#000080"
| ||
Red (Красный) = "#FF0000" | Blue (Синий) = "#0000FF"
| ||
Purple (Темно-сиреневый) = "#800080" | Teal (Петроль) = "#008080"
| ||
Fuchsia (Сиреневый) = "#FF00FF" | Aqua (Голубой) = "#00FFFF"
|
Таким образом, значение цвета "#800080" и "Purple" оба ссылаются на темно-сиреневый цвет.
Не смотря на то, что цвета могут добавить значительную часть информации документа и сделать его более читабельным, пожалуйста, учитывайте следующие моменты, при использовании цветов в Ваших документах:
HTML определяет три типа значений длин для атрибутов:
Значения длин нейтральны к регистру.
Примечание. "Тип среды" (media type) (описанный в [RFC2045] и [RFC2046]) определяет природу связанного ресурса. Данная спецификация использует термин "тип содержания" (content type) а не "тип среды" (media type) в соответствии с текущим использованием. Более того, в данной спецификации "тип среды" может ссылаться на среду, в которой средство просмотра отображает документ.
Данный тип представляется в DTD посредством "%ContentType;".
Типы содержания нечувствительны к регистру.
Примеры типов содержания включают: "text/html", "image/png", "image/gif", "video/mpeg", "audio/basic", "text/tcl", "text/javascript" и "text/vbscript". Список зарегистрированных на данный момент типов MIME можно найти в [MIMETYPES].
Примечание. Тип содержания "text/css" пока не зарегистрирован в IANA, он должен использоваться в случаях, когда связанным ресурсом является таблица стилей [CSS1].
Значение атрибутов, чьим типом является языковой код (%LanguageCode в DTD), ссылается на языковой код, как описанный в разделе 2 из [RFC1766]. Информацию относительно определяющих языковых кодов в HTML смотрите в разделе "языковые коды". Пустое пространство не допустимо в пределах языкового кода.
Языковые коды нечувствительны к регистру.
Атрибуты "charset" (%Charset в DTD) ссылаются на символьную кодировку, как описано в разделе "Символьные кодировки". Значения должны быть строками (например "euc-jp") из реестра IANA (полный список смотрите в [CHARSETS]).
Имена символьных кодировок нечувствительны к регистру.
Средство просмотра должно следовать шагам, установленным в разделе "Определение символьных кодировок" для того, чтобы детерминировать символьную кодировку внешнего ресурса.
Некоторые атрибуты используются для одиночного символа из набора символов документа. Эти атрибуты используют тип %Character из DTD.
Одиночные символы могут быть определены при помощи символьных ссылок (например "&").
[ISO8601] допускает много выборов и вариантов при представлении даты и времени. Данная спецификация использует один из форматов, описанных в [DATETIME] для определения корректных строк даты/времени (%Datetime в DTD).
Формат:
ГГГГ-ММ-ДДTчч:мм:ссTZDгде:
ГГГГ = четырехзначный год ММ = двухзначный месяц (01=Январь и т.п.) ДД = двухзначный день месяца (от 01 до 31) чч = двухзначный час (от 00 до 23) (до/после полуночи НЕ допустимо) мм = двухзначная минута (от 00 до 59) сс = двухзначная секунда (от 00 до 59) TZD = определитель временной зоны (time zone designator)
Определитель временной зоны может быть одним из:
Должны присутствовать именно показанные здесь компоненты и именно с указанной пунктуацией. Заметьте, что "T" появляется буквально в строке (оно должно быть в верхнем регистре), для указания начала элемента времени, как описано в [ISO8601].
Если генерирующее приложение не распознает время с секундами, оно должно использовать значение "00" для секунд (а также минут и часов, если это необходимо).
Примечание. [DATETIME] не рассматривает вопрос "прыжков" секунд.
Авторы могут использовать следующие распознаваемые типы связей, приведенных здесь с их общепринятой интерпретацией. В DTD %LinkTypes ссылается на список разделенных пробелом типов связей. Символы пустого пространства не допустимы в пределах типов связей.
Эти типы связей нечувствительны к регистру, то есть "Alternate" и "alternate" -- одно и то же.
Средства просмотра, поисковые машины и т.п. могут интерпретировать эти типы связей различными способами. Например, средства просмотра могут предоставлять доступ к связанным документам при помощи навигационной полосы.
Авторы могут пожелать определить дополнительные типы связей, не описанных в данной спецификации. Если они сделают это, им следует использовать "profile" для цитирования соглашений, используемых для описания типов связей. Смотрите дополнительную информацию об атрибуте "profile" элемента HEAD.
Дальнейшее обсуждение типов связей, можно найти в разделе "Связи в документах HTML".
Ниже приведен список распознаваемых описателей среды (%MediaDesc в DTD).
Будущие версии HTML могут представлять новые значения и могут позволять параметризованные значения. Для облегчения введения этих расширений, согласующиеся средства просмотра должны быть способными делать грамматический разбор значений атрибута media следующим образом:
media="screen, 3d-glasses, print and resolution > 90dpi"
отображается в:
"screen" "3d-glasses" "print and resolution > 90dpi"
"screen" "3d-glasses" "print"
Примечание. Таблицы стилей могут включать зависимые от среды варианты (то есть составлять CSS @media). В таком случае это может соответствовать использованию "media=all".
Данные сценария (%Script; в DTD) могут быть содержанием элемента SCRIPT и значением атрибутов внутренних событий. Средства просмотра не должны рассматривать данные сценариев как разметку HTML, они должны передавать их средству обработки сценариев как данные.
Чувствительность к регистру данных сценариев зависит от языка сценария.
Пожалуйста, заметьте, что данные сценариев, являющиеся содержанием элемента не могут содержать символьные ссылки, в то же время, данные сценариев, являющиеся значением атрибута -- могут. Приложения предоставляют дополнительную информацию об "определении не-HTML данных".
Данные таблиц стилей (%StyleSheet; в DTD) могут быть содержанием элемента STYLE и значением атрибута style. Средства просмотра не должны обрабатывать данные стилей как разметку HTML.
Чувствительность к регистру данных стилей зависит от языка таблиц стилей.
Пожалуйста, заметьте, что данные таблиц стилей, которые являются содержанием элемента не могут содержать символьные ссылки, в то же время, данные таблиц стилей, которые являются содержанием значения атрибута -- могут. Приложения предоставляют дополнительную информацию об "определении не-HTML данных".
За исключением зарезервированных слов, приведенных ниже, целевые имена фреймов (%FrameTarget; в DTD) должны начинаться с алфавитного символа (a-z, A-Z). Средства просмотра должны игнорировать все другие целевые имена.
Эти целевые имена зарезервированы и имеют особое значение:
Last modified: Tue Jan 27 14:14:37 1998