Любой, кто хоть раз заглядывал в код страниц, наверняка замечал, что многие из них начинаются со строчки Это так называемое «объявление типа документа» или Document Type Declaration (не путать с DTD Document Type Definition).
Авторы умных книг по HTML, автоматические валидаторы и Джеффри Зельдман (Jeffrey Zeldman) утверждают, что по правилам хорошего тона использовать его нужно всегда. Если учесть тот факт, что многие сайты прекрасно отображаются в браузерах и без него, возникает резонный вопрос: «А нужен ли на самом деле?». Путем несложных рассуждений попытаемся это выяснить.
Откуда он взялся?
Объявление типа документа можно встретить даже в древней версии HTML, не имевшей порядкового номера и носившей странное название HTML Internet Draft. Тогда уже существовало несколько языков разметки (TEX, PostScript и SGML), которые использовались в основном для работы с научными документами (что нисколько не удивляет, так как веб вообще родился в Европейском центре ядерных исследований путем скрещивания простого гипертекста с еще более простым протоколом).
Поскольку эти языки были сложными, разработчики задумались над тем, как облегчить жизнь людям и графическим терминалам, упростив разметку. И придумали HTML, построив его на основе правил «стандартного обобщенного языка разметки» или, как его чаще называют, SGML (Standard Generalized Markup Language).
Именно в SGML было указано, что каждый документ должен начинаться с объявления его типа. В первой публичной версии спецификации HTML 2.0 говорилось о том, что следует начинать с объявления (использовалось слово should), в версии HTML 3.2 его использование стало обязательным (must start with the declaration).
Но ни один браузер тех времен не требовал явного указания типа документа для отображения HTML-страницы. А раз браузеры не требовали, то и разработчикам было все равно они с легким сердцем игнорировали (справедливости ради стоит сказать, что речь идет о тех разработчиках, которые код «писали руками», а не посредством HotDogа).
Стандарты и обратная совместимость
Первым браузером, обратившим внимание на тип документа, стал Internet Explorer 5.0 для Mac OS (движок Tasman). Появился он в начале 2000 года и сразу же стал лучшим с точки зрения поддержки HTML-стандартов (оговорка для зануд: Mozilla была далека от версии 1.0, а Opera продолжала безнадежно копировать MSIE для Windows).
Но на тот момент никому не был нужен браузер, умеющий «рендерить» HTML согласно стандартам. Потому что стандарты не соответствовали тому, как браузеры на практике интерпретировали HTML-код.
В результате Internet Explorer 5.0 для Mac OS показывал страницы не так, как они были задуманы, и понадобился специальный переключатель, с помощью которого можно было сказать: вести себя как обычные браузеры или по стандартам.
И таким переключателем стало объявление типа документа. Правило при этом было простое: если тип документа не объявлен или объявлен без указания адреса DTD (на этот раз речь идет о Document Type Definition), то HTML интерпретировался в режиме совместимости со «старыми» браузерами (quirky mode, впоследствии quirks mode), если же адрес DTD указывался, то элементы отображались согласно стандартам HTML 4.01 и CSS 1.
Internet Explorer 6.0 для Windows узаконил переключение между режимами, и теперь почти все браузеры знают, что такое «стандартный режим» (standards mode) и «режим совместимости со старыми браузерами» (quirks mode). Mozilla и Safari пошли дальше: у них есть «почти стандартный режим», почти соответствующий стандартному режиму Internet Explorer 6.0. Но это уже совсем другая история.
В этой главе рассказывается, как идентифицировать правильный документ XHTML.
Декларация типа документа
В самом начале веб-страницы вы должны определять декларацию типа документа при помощи элемента DOCTYPE. Да, да, именно должны.
Без определения типа документа ваш HTML не полноценен и большинство браузеров будут отображать его в так называемом «режиме обратной совместимости», который означает, что браузеры будут уверены в вашей некомпетентности, и будут исполнять ваш код по своему усмотрению. Будь вы хоть гуру в HTML, ваш код пусть будет безупречен, а CSS идеален, но без декларации типа документа или если она неверна, то ваша веб-страница может выглядеть так, как будто ее делал неграмотный первоклашка.
Декларация для строгого XHTML 1.0 (XHTML 1.0 Strict) выглядит следующим образом:
Ниже приводится декларация для документа XHTML 1.1, который может показаться более предпочтительным, однако так как это последняя версия XHTML, здесь кроется несколько проблем, которые мы объясним в конце этой главы…
Если вы по какой-либо причине хотите использовать HTML 4 или Netscape 4 для вас эталон браузеров, вы можете декларировать документ для переходного XHTML 1.0 (XHTML 1.0 Transitional):
Правда единственной причиной такой декларации может быть желание поддержать старые и редко используемые браузеры. Переходный XHTML 1.0 разрешает использование старых элементов представления HTML 4, что может улучшить представление страницы в таких браузерах как Netscape 4, однако использование таких элементов способно пагубно сказаться на эффективности и доступности вашей веб-страницы.
Наконец, если вы один из тех эксцентричных людей, которые используют фреймы, то специально для вас существует декларация для фреймового XHTML 1.0 (XHTML 1.0 Frameset):
Обратите внимание, что тег DOCTYPE – своего рода бунтовщик, и его необходимо писать в верхнем регистре с восклицательным знаком перед ним. Также он нарушает еще одно правило – это единственный тег, который не нужно закрывать.
Языковая декларация
Например, языковая декларация для документа с русским основным языком будет выглядеть следующим образом:
После декларации основного языка, если на веб-странице есть контент на другом языке, то нужно использовать атрибут xml:lang линейно (например, HTML Hund).
Типы контента
Также необходимо определять медиатип и набор символов документа HTML, и делается это в заголовке HTTP:
Вторая часть заголовка HTTP (в данном примере UTF-8) – это набор символов.
Самый простой способ установить заголовок HTTP – это использовать метатег, например, следующим образом:
Немного более сложный, но и более предпочтительный (так как в этом случае получается правильный заголовок HTTP и при этом размер кода HTML никак не изменяется) способ – это сформировать заголовок и затем отослать его при помощи скриптового языка, работающего на стороне сервера. Например, при помощи PHP это делается следующим образом:
Если вы не хотите (или не можете) использовать скриптовый язык, работающий на стороне сервера, то можно обратиться к самому серверу при помощи файла ‘.htaccess‘. У большинства серверов (совместимых с Apache) есть специальный текстовый файл с именем ‘.htaccess‘, расположенный в корневой директории. Если добавить в него следующую строку, то все файлы с расширением ‘.html’ будут ассоциироваться с указанным MIME типом и набором символов:
Основное правило выбора набора символов заключается в том, чтобы использовать тот набор, который будет распознаваться аудиторией вашего сайта. Наборов символов достаточно много (например, ‘ISO-8859-1’ – для большинства западных, основанных на латинице, языков, ‘SHIFT_JIS’ – для японского языка, а ‘UTF-8’ – в значительной степени универсальный набор, в котором есть огромное число уникальных символов, использующихся в большинстве языках). Здесь можно посоветовать использовать набор ‘UTF-8’, так как он может отображать почти все символы большинства языков и можно с большой долей вероятности быть уверенным, что текст вашей веб-страницы увидят большинство пользователей.
Документы XHTML должны обрабатываться как MIME тип application/xhtml+xml. Это именно тот тип, чем они и являются – приложениями XML. К несчастью, большинство браузеров совсем не знают, что это такое. Поэтому считается вполне нормальным обрабатывать их по типу text/html. Согласно стандартам документы XHTML 1.0 могут обрабатываться по типу text/html, а вот документы XHTML 1.1 нет. Вот почему все примеры в учебниках на этом сайте имеют декларацию XHTML 1.0 Strict, предполагающую обработку по типу text/html. Но вы можете назначать правильный MIME тип для тех браузеров, которые умеют работать с соответствующими документами, прибегнув к небольшой обработке на стороне сервера.
Этот скрипт следует вставлять в начале каждой веб-страницы. Он проверяет, принимает ли браузер MIME тип application/xhtml+xml, и если принимает, то отсылается именно этот MIME тип, а в декларации прописывается тип документа XHTML 1.1. Если же MIME тип не распознается браузером, тогда отсылается MIME тип text/html, а в декларации прописывается тип документа XHTML1.0 Strict.
DOCTYPE чем-то похож на заголовок для статьи. Он пишется в начале HTML-документа. Если его не будет, то браузер может отобразить вашу страницу в неожиданном виде. Читайте о том, из чего состоит DOCTYPE, и как его использовать правильно.
Определение и значение
История
Из истории HTML мы знаем, что спецификация менялась с момента первой публикации в 1992-м году и до наших дней. Вместе с ней, соответственно, менялись и типы документов. Актуальная версия HTML сейчас — это HTML Living Standard. Начиная с версии 4.0 многие элементы стали устаревшими (их рекомендовали не использовать на страницах) — стандарт очистился.
Типы синтаксиса в DOCTYPE
Синтаксис HTML-документа бывает:
Сравниваем DOCTYPE для HTML 1.0 и HTML 4.01 на примерах
Переходный синтаксис
Есть все элементы и атрибуты HTML. С устаревшими и презентационными. Фреймов нет. А разметка должна быть сделана как качественно созданный XML.
Тут есть все элементы и атрибуты HTML, в том числе устаревший тег шрифта. А также новые. Фреймов нет.
Строгий синтаксис
В этом уже нет устаревших и презентационных элементов. Всё ещё нет фреймов. От разметки ждут вида хорошо сформированного XML.
Есть все элементы и атрибуты без устаревших. Фреймов нет.
Фреймы
Здесь определение типа документа как у переходного с XHTML 1.0, но можно пользоваться содержимым фреймов.
Тут DTD как у переходного HTML 4.01 переходный, но тоже есть фреймы. Сейчас применяется редко, потому что фреймы устарели.
Формула с расшифровкой параметров (элементов)
И что теперь?
Время проходит, мы во многом стараемся двигаться к упрощению и унификации. В HTML5 декларация типа документа выглядит очень просто:
DOCTYPE для него самый простой из существовавших.
Что происходит, если указать DOCTYPE неправильно или не указывать его вообще
Браузеры покажут страницу по совместимости со своими старыми версиями.
Формально регистр тут значения не имеет. Но корректнее всё же писать заглавными буквами. Потому что в XHTML5 есть разница между именами элементов, написанными в нижнем регистре и ключевыми словами, которые пишут в верхнем регистре.
— запомнить слишком просто.
Напоминалка на дорожку
Простыми словами, прописывая DOCTYPE, мы говорим браузерам/валидаторам, каким языком разметки мы писали свой документ. Вы помните, что кроме простого HTML бывает XHTML и XML. Кроме этого мы можем указать и степень строгости синтаксиса.
Доктайп нужен на каждой странице
Но не только он. Узнайте всё о структуре HTML-документов в интерактивных тренажёрах.
Нажатие на кнопку — согласие на обработку персональных данных
Для начала небольшой спойлер: объявление Doctype в HTML5 имеет скромный минималистичный вид:
При этом вовсе не обязательно писать DOCTYPE большими буквами, так как он не является регистрозависимым. Такие варианты написания, как и также являются верными.
Однако, касательно расположения doctype в html-документе действует строгое правило: doctype должен всегда располагаться в верхней строке! Почему? Чтобы ответить на этот вопрос, необходимо сначала разобраться: для чего нужен doctype и что произойдет, если веб-мастер забудет его указать?
Зачем нужен DOCTYPE?
Позвольте мне начать эту главу с небольшой доброй истории. В далеком 1989 году на свет родился язык гипертекстовой разметки по имени HTML. Он был еще совсем малышом и позволял строить только самые простые веб-конструкции, которые с гордым видом передавал веб-браузеру. Браузер, в свою очередь, радостно считывал html-код и отображал страницы по заранее оговоренным с HTML правилам. Эти правила называются спецификацией. Тогда, в 1989 году HTML был первым представителем династии гипертекстовых языков разметки, подающим надежды на рождение более продвинутых потомков. Поэтому ему дали гордое имя HTML1.0 и издали для него свод правил, собственную спецификацию. По мере развития языка HTML, в мире веб-строительства стали появляться «более продвинутые потомки» HTML: HTML2.0, HTML3.2, HTML4.1 и другие. Для каждой версии HTML создавался свой свод правил, т. е. своя спецификация. Вы только представьте, насколько вырос уровень ответственности браузера! Теперь, читая файл с html расширением, браузер должен был выяснить, какой из потомков HTML «приложил руки» к созданию файла, и отобразить страницу в соответствии с его спецификацией! Поэтому во избежании ошибок со стороны браузера при отображении страницы, был введен doctype. В доктайпе мы сообщаем браузеру, какой свод правил(читай — спецификацию) использовать при отображении страницы.
DOCTYPE— это сокращение от словосочетания «document type«. Что в переводе с английского языка значит «тип документа».
Что случится, если не указать доктайп?
Если веб-мастер не укажет тип документа, то браузер останется наедине со своими мыслями о выборе спецификации для отображения страницы, и может представить страницу совершенно неожиданным для веб-мастера образом. Если разметка страницы составлена абсолютно верно и не содержит ошибок, то больших сюрпризов, конечно, не возникнет. Но если в разметке есть ошибки, то, уважаемый веб-мастер, пеняй на себя! Причем пеняй столько раз, сколько ты будешь открывать страницу в разных браузерах. Ведь у каждого браузера может быть своя версия о спецификации. Поэтому гораздо проще указать doctype в верхней строке html-файла и не переживать о том, что в Mozille страница отображается иначе, чем в Opere. Тем более, что сейчас объявление doctype не требует громоздких строк типа:
как это было в случае использования веб-мастером строгого синтаксиса HTML версии 4.01. А если вдруг в html-файле появились фреймы, то doctype этой же 4.01 версии приобретал уже немного другие очертания:
Согласитесь, запомнить такое количество букв проблематично. Иное дело — лаконичный doctype, появившийся с приходом HTML5:
Что означает: тип документа — html.И запомнить легко, и написать не жалко. Единственный вопрос, возникающий в голове искушенного веб-мастера: почему doctype для 5 версии HTML так сильно отличается от doctype предыдущих версий?
Почему DOCTYPE для HTML5 так отличается от DOCTYPE для прошлых версий HTML?
Таким образом, разумный подход, подкрепленный логическими выводами, облегчает жизнь не только людям, но и браузерам ;-).
Что случиться если не указать декларацию документа в html
DOCTYPE: история и варианты применения
DOCTYPE чем-то похож на заголовок для статьи. Он пишется в начале HTML-документа. Если его не будет, то браузер может отобразить вашу страницу в неожиданном виде. Читайте о том, из чего состоит DOCTYPE, и как его использовать правильно.
Определение и значение
История
Из истории HTML мы знаем, что спецификация менялась с момента первой публикации в 1992-м году и до наших дней. Вместе с ней, соответственно, менялись и типы документов. Актуальная версия HTML сейчас — это HTML Living Standard. Начиная с версии 4.0 многие элементы стали устаревшими (их рекомендовали не использовать на страницах) — стандарт очистился.
Типы синтаксиса в DOCTYPE
Синтаксис HTML-документа бывает:
Сравниваем DOCTYPE для HTML 1.0 и HTML 4.01 на примерах
Переходный синтаксис
Есть все элементы и атрибуты HTML. С устаревшими и презентационными. Фреймов нет. А разметка должна быть сделана как качественно созданный XML.
Тут есть все элементы и атрибуты HTML, в том числе устаревший тег шрифта. А также новые. Фреймов нет.
Строгий синтаксис
В этом уже нет устаревших и презентационных элементов. Всё ещё нет фреймов. От разметки ждут вида хорошо сформированного XML.
Есть все элементы и атрибуты без устаревших. Фреймов нет.
Фреймы
Здесь определение типа документа как у переходного с XHTML 1.0, но можно пользоваться содержимым фреймов.
Тут DTD как у переходного HTML 4.01 переходный, но тоже есть фреймы. Сейчас применяется редко, потому что фреймы устарели.
Формула с расшифровкой параметров (элементов)
И что теперь?
Время проходит, мы во многом стараемся двигаться к упрощению и унификации. В HTML5 декларация типа документа выглядит очень просто:
DOCTYPE для него самый простой из существовавших.
Что происходит, если указать DOCTYPE неправильно или не указывать его вообще
Браузеры покажут страницу по совместимости со своими старыми версиями.
Формально регистр тут значения не имеет. Но корректнее всё же писать заглавными буквами. Потому что в XHTML5 есть разница между именами элементов, написанными в нижнем регистре и ключевыми словами, которые пишут в верхнем регистре.
— запомнить слишком просто.
Напоминалка на дорожку
Простыми словами, прописывая DOCTYPE, мы говорим браузерам/валидаторам, каким языком разметки мы писали свой документ. Вы помните, что кроме простого HTML бывает XHTML и XML. Кроме этого мы можем указать и степень строгости синтаксиса.
Доктайп нужен на каждой странице
Но не только он. Узнайте всё о структуре HTML-документов в интерактивных тренажёрах.
HTML декларация
Декларация определяет версию HTML, которая используется в данном документе. Объявление версии является обязательным условием, так как браузер должен понимать, как интерпретировать страницу. В случае, если декларация отсутствует, браузер может некорректно отображать содержимое веб-страницы.
Декларация указывается до тега. Декларация не чувствительна к регистру.
Синтаксис ¶
Параметры ¶
Публичность —документ может быть публичным (PUBLIC) или системным (SYSTEM). К системным относятся, например, локальные файлы. Для HTML/XHTML значением является PUBLIC.
Регистрация — различают два значения: плюс (+) — разработчик DTD зарегистрирован в международной организации по стандартизации (International Organization for Standardization, ISO) и — (минус) — разработчик не зарегистрирован в ISO. Для W3C значением является «-».
Тип — тип описываемого документа. Для HTML/XHTML значение указывается DTD
Имя — уникальный идентификатор документа для описания DTD.
Язык — язык, на котором составлено описание типа документа (две буквы в верхнем регистре). Для документа HTML/XHTML указывается английский язык (EN).
URL — ссылка на описание типа документа (например, https://www.w3.org/TR/html4/loose.dtd ).
Типы деклараций ¶
Различают три типа деклараций :
Строгий (Strict): не содержит «устаревшие» и «не одобряемые» (deprecated) элементы.
Переходный (Transitional): содержит все элементы и атрибуты, включая устаревшие и не рекомендованные теги (для совместимости и перехода с более старых версий HTML). Использование фреймов запрещено.
С фреймами (Frameset): такой же как переходный, но при этом разрешает использование тегов для создания фреймов.
Декларации типа документа
В этой главе рассказывается, как идентифицировать правильный документ XHTML.
Декларация типа документа
В самом начале веб-страницы вы должны определять декларацию типа документа при помощи элемента DOCTYPE. Да, да, именно должны.
Без определения типа документа ваш HTML не полноценен и большинство браузеров будут отображать его в так называемом «режиме обратной совместимости», который означает, что браузеры будут уверены в вашей некомпетентности, и будут исполнять ваш код по своему усмотрению. Будь вы хоть гуру в HTML, ваш код пусть будет безупречен, а CSS идеален, но без декларации типа документа или если она неверна, то ваша веб-страница может выглядеть так, как будто ее делал неграмотный первоклашка.
Декларация для строгого XHTML 1.0 (XHTML 1.0 Strict) выглядит следующим образом:
Ниже приводится декларация для документа XHTML 1.1, который может показаться более предпочтительным, однако так как это последняя версия XHTML, здесь кроется несколько проблем, которые мы объясним в конце этой главы…
Если вы по какой-либо причине хотите использовать HTML 4 или Netscape 4 для вас эталон браузеров, вы можете декларировать документ для переходного XHTML 1.0 (XHTML 1.0 Transitional):
Правда единственной причиной такой декларации может быть желание поддержать старые и редко используемые браузеры. Переходный XHTML 1.0 разрешает использование старых элементов представления HTML 4, что может улучшить представление страницы в таких браузерах как Netscape 4, однако использование таких элементов способно пагубно сказаться на эффективности и доступности вашей веб-страницы.
Наконец, если вы один из тех эксцентричных людей, которые используют фреймы, то специально для вас существует декларация для фреймового XHTML 1.0 (XHTML 1.0 Frameset):
Обратите внимание, что тег DOCTYPE – своего рода бунтовщик, и его необходимо писать в верхнем регистре с восклицательным знаком перед ним. Также он нарушает еще одно правило – это единственный тег, который не нужно закрывать.
Языковая декларация
Например, языковая декларация для документа с русским основным языком будет выглядеть следующим образом:
После декларации основного языка, если на веб-странице есть контент на другом языке, то нужно использовать атрибут xml:lang линейно (например, HTML Hund).
Типы контента
Также необходимо определять медиатип и набор символов документа HTML, и делается это в заголовке HTTP:
Первая часть (в данном примере text/html) – это MIME тип файла. Это позволяет браузеру понять, с каким типом файла он имеет дело, и решить, что с ним делать. У всех файлов есть свой MIME тип. Например, у изображения JPEG тип image/jpeg, у файла CSS — text/css, а обычный тип HTML документа — text/html.
Вторая часть заголовка HTTP (в данном примере UTF-8) – это набор символов.
Самый простой способ установить заголовок HTTP – это использовать метатег, например, следующим образом:
Немного более сложный, но и более предпочтительный (так как в этом случае получается правильный заголовок HTTP и при этом размер кода HTML никак не изменяется) способ – это сформировать заголовок и затем отослать его при помощи скриптового языка, работающего на стороне сервера. Например, при помощи PHP это делается следующим образом:
Если вы не хотите (или не можете) использовать скриптовый язык, работающий на стороне сервера, то можно обратиться к самому серверу при помощи файла ‘.htaccess‘. У большинства серверов (совместимых с Apache) есть специальный текстовый файл с именем ‘.htaccess‘, расположенный в корневой директории. Если добавить в него следующую строку, то все файлы с расширением ‘.html’ будут ассоциироваться с указанным MIME типом и набором символов:
Основное правило выбора набора символов заключается в том, чтобы использовать тот набор, который будет распознаваться аудиторией вашего сайта. Наборов символов достаточно много (например, ‘ISO-8859-1’ – для большинства западных, основанных на латинице, языков, ‘SHIFT_JIS’ – для японского языка, а ‘UTF-8’ – в значительной степени универсальный набор, в котором есть огромное число уникальных символов, использующихся в большинстве языках). Здесь можно посоветовать использовать набор ‘UTF-8’, так как он может отображать почти все символы большинства языков и можно с большой долей вероятности быть уверенным, что текст вашей веб-страницы увидят большинство пользователей.
Документы XHTML должны обрабатываться как MIME тип application/xhtml+xml. Это именно тот тип, чем они и являются – приложениями XML. К несчастью, большинство браузеров совсем не знают, что это такое. Поэтому считается вполне нормальным обрабатывать их по типу text/html. Согласно стандартам документы XHTML 1.0 могут обрабатываться по типу text/html, а вот документы XHTML 1.1 нет. Вот почему все примеры в учебниках на этом сайте имеют декларацию XHTML 1.0 Strict, предполагающую обработку по типу text/html. Но вы можете назначать правильный MIME тип для тех браузеров, которые умеют работать с соответствующими документами, прибегнув к небольшой обработке на стороне сервера.
Скипт на PHP, который для браузеров, понимающих стандарт XHTML 1.1, (как Mozilla) присваивает документу соответствующую декларацию и MIME тип application/xhtml+xml, а для остальных браузеров (как IE) — XHTML1.0 Strict и MIME тип text/html, может выглядеть следующим образом:
Этот скрипт следует вставлять в начале каждой веб-страницы. Он проверяет, принимает ли браузер MIME тип application/xhtml+xml, и если принимает, то отсылается именно этот MIME тип, а в декларации прописывается тип документа XHTML 1.1. Если же MIME тип не распознается браузером, тогда отсылается MIME тип text/html, а в декларации прописывается тип документа XHTML1.0 Strict.