Любой документ имеет три составляющих:
Обычно содержание документа представляется не в произвольном порядке, а имеет определенную структуру . Структура это состав и порядок следования частей (блоков) документа.
Стиль документа определяет форму вывода его содержания на то или иное устройство (например, принтер или дисплей). В понятие стиль входят характеристики шрифта (наименование, размер, цвет) всего выводимого документа или отдельных его блоков, порядок разбивки на страницы, расположение блоков на страницах и другие параметры.
Языки разметки документов являются искусственными языками, предназначенными для описания структуры документа и отношений между различными объектами структуры. Данные разметки называются также метаданными .
Первым языком разметки является язык GML .Его непосредственным наследником стал язык SGML стандартный обобщенный язык разметки, определяющий правила записи элементов разметки документа.
требования к языку разметки документов:
В языке SGML и подобных ему языках используются специальные инструменты разметки документа:
Документы SGML имеют древовидную структуру.
Дескрипторы в SGML размещаются в начале (открывающий дескриптор) и в конце (закрывающий дескриптор) каждого элемента (item ).
Атрибуты это простые символьные конструкции (items ), которые добавляются к элементам для придания им уточнения действия дескрипторов.
Языки обобщенной разметки, подобные SGML , допускают использование атрибутов, с которыми могут быть соотнесены до 15 различных типов значений, в том числе:
Комментарии позволяют добавить информацию, которая не будет видна после обработки документа. Комментарии не влияют на скорость обработки документа, не рассматриваются и не обрабатываются как часть содержания SGML -документа. Они просто включаются в исходный текст.
Для проверки соответствия документа разметке заданного типа используется специальные программы анализаторы (parsers). Анализаторы являются либо отдельными программами, либо частью программы обработки документа SGML. Чтобы анализатор мог выполнить проверку документа, создается специальный документ, называемый определением типа документа
Язык HTML является приложением языка SGML для использования в Internet с фиксированной структурой, фиксированным набором элементов (дескрипторов) и их атрибутов, а также фиксированным набором сущностей. расширенный язык разметки XML (Extensible Markup Language ). Язык XML является подмножеством языка SGML , полностью совместимым с ним.
Язык XML обеспечивает широкий спектр функциональных возможностей, которые отсутствуют в HTML
4 . 3 .2. Версии и расширения HTML и XMLПервая версия языка гипертекстовой разметки HTML (HyperText Markup Language), так же, как и сама технология Web, была разработана Тимом Бернерсом Ли в 1991 г. Язык HTML является реализаций правил языка SGML для типа документов, которые были названы документами HTML. Язык задает фиксированную структуру, фиксированный набор тегов и их атрибутов, а также фиксированный набор сущностей. Программы обработки документов HTML называются Web -браузерами . Результатом обработки документа является Web -страница , выводимая на экран дисплея.
В 1994 г. группа поддержки Интернет IETF (Internet Engineering Task Force ) разработала спецификацию HTML 2.0, с которой началось широкое распространение языка HTML в сети Internet . В том же году был создан консорциум W3C (World Wide Web Corporation), объединивший 165 коммерческих и академических организаций, разработчиков и пользователей (с момента создания и по настоящее время эту организацию возглавляет Т.Б. Ли). Последняя версия спецификации HTML HTML 4.01 была принята консорциумом в декабре 1999 г.
Последняя версия спецификации языка XML XML 1.1 была принята в апреле 2004 г.
На основе языка XML концерн W3C разработал дальнейшее развитие языка HTML язык XHTML (Extended HTML расширенный HTML). Первая версия этого языка XHTML 1.0 была принята в январе 2000 г. Эта версия фактически представляет собой переформулирование HTML 4 как приложения XML 1.0. Предполагается, что дальнейшее развитие языка HTML будет осуществляться в соответствии со спецификациями XHTML.
Новая версия XHTML XHTML 1.1 была принята консорциумом W3C в мае 2001 г. Эта рекомендация определяют новый тип документа XHTML на основе модулей. Каждый модуль XHTML 1.1 содержит один или несколько элементов и/или атрибутов языка HTML.
В соответствии со спецификацией, документы XHTML 1.1 состоит из следующих групп модулей XHTML :
Модули ядра это модули, наличие которых необходимо в любом типе документа, соответствующего спецификации XHTML (в эту группу входят модули Structure , Text , Hypertext и List ).
Модуль Applet , содержащий единственный элемент < applet > (этот элемент признан устаревшим и вместо него рекомендуется использовать элемент < object > ).
Модули текстовых расширений, в которых определены различные дополнительные модули текстовой разметки (в эту группу входят модули Presentation , Edit и Bi - directional Text ).
Модули форм (в эту группу входят модули Basic Forms и Forms ).
Модули таблиц (в эту группу входят модули Basic Tables и Tables ).
Модуль Image , предоставляющий базовые возможности внедрения изображений (этот модуль также может независимо использоваться в некоторых реализациях клиентскими картами-изображениями).
Модуль Client - side Image Map , предоставляющий элементы для клиентских карт-изображений (для функционирования этого модуля необходимо включение модуля Image ).
Модуль Object , предоставляющий поддержку включения объектов общего назначения.
Модуль Frames , предоставляющий элементы, относящиеся к фреймам.
URL (с помощью этого элемента вычисляются относительные URL документа).
Модуль Name Identification , используемый для идентификации определённых элементов в документах HTML.
Модуль Legacy , определяющий элементы и атрибуты, которые уже не рекомендовались в предыдущих версиях HTML и XHTML и не рекомендуются в дальнейшем.
4 . 3 .3. Типы структур HTML и XHTMLСогласно спецификации HTML 4.01 для документов HTML определены три структуры , описываемые тремя DTD. Разработчики Web -страниц должны включать в свои документы одно из трех объявлений типов. Разница между DTD заключается в поддерживаемых ими элементах. Объявление DTD должно размещаться в самом начале документа.
HTML 4.01 Strict DTD (строгое определение) включает все элементы и атрибуты, не являющиеся отмененными (deprecated ) и не использующиеся в документах с фреймами.
Определение HTML 4.0 Transitional DTD (переходное определение) включает все элементы, включенные в строгом DTD , а также отмененные элементы и атрибуты.
Определение HTML 4.0 Frameset DTD (определение для фреймов) включает, помимо элементов переходного DTD, фреймы.
Первая строка документа HTML , определенного в соответствии со спецификацией XHTML
Эта строка определяет используемую версию XML и кодировку символов документа. При кодировании символов в XML используется двухбайтовый код Unicode . В качестве значений параметра encoding наиболее часто используются кодировки UTF -8 , в котором значения первых 128 символов представляются в однобайтовой кодировке, символы наиболее распространенных языков (в том числе русского и украинского) двумя байтами, а остальные символы тремя байтами. В кодировке UTF -16 все символы представляются двумя байтами (эти кодировку рекомендуется использовать для русских и украинских документов HTML ).
В 1969 году три научных сотрудника компании IBM разработали GML, язык форматирования для публикации документов. GML - это не только аббревиатура от Generalized Markup Language, но также инициалы его создателей - Чарлз Гольдфарб, Эдвард Мошер и Реймонд Лорье.
GML поддерживает редактирование и форматирование текстов, позволяет подсистемам извлечения информации обмениваться документами. В то же время вместо простой схемы разметки GML представляет концепцию формально определенных типов документов, содержащих строгую иерархию структурированных элементов.
Основные компоненты GML были реализованы в издательских системах для мэйнфреймов, и сам язык пользуется большой популярностью в отрасли. GML применяется в IBM, причем с его помощью создается более 90% документов компании.
За счет расширения GML такими концепциями, как короткие сноски, обработка ссылок и параллельные типы документов, был создан язык Standard Generalized Markup Language. SGML стал активно применяться в издательском бизнесе, к тому же был принят к использованию в Государственном издательстве США и в 1986 году получил статус международного стандарта.
Тем не менее SGML был малоизвестен до 1990 года, когда Тим Бернерc-Ли, автор идеи World Wide Web, создал Hypertext Markup Language, который является подмножеством SGML. Вскоре после этого все виды документов и данных в начале и в конце каждого текстового элемента стали содержать тэги в стиле и. В конце 1990-х годов появился Extensible Markup Language (XML)... и вселенная ИТ необратимо изменилась.
Фактически создается впечатление, что не проходит и дня без известия о создании или описании нового языка разметки. Действительно, Computerworld в разделе Quick Study опубликовал уже 10 статей, посвященных описанию различных языков разметок, и то лишь самых основных. Поиск в Google выражения markup language дает ссылки на более чем 6 млн. страниц. Ниже предлагается краткий «путеводитель» по современному «пространству языков разметки». Безусловно, он не претендует на полноту, но дает представление о гибкости и возможностях этой концепции, а также о том, как они используются. Большинство этих языков представляют собой расширения XML или определения типов документов, предназначенных для конкретной сферы деятельности, хотя некоторые из них достаточно сложны.
ЯзыкиДалеко не каждый язык или акроним, оканчивающийся на ML, является языком разметки. Вот наиболее известные исключения.
Первоначально символы ML использовались как сокращение слова «метаязык», то есть язык программирования общего назначения, предназначенный для крупных проектов. Сейчас используется два основных диалекта этого языка. Это Standard ML (SML; см. www.dcs.ed.ac.uk/home/stg/NOTES ), математически определенная версия языка, сформулированная частично разработчиками исходного языка, и Objective Caml (OCaml; см http://caml.inria.fr/ ), производная версия оригинального ML, к которой по желанию разработчика добавляются возможности, без их определения в стандарте. К другим известным диалектам относятся Extended ML (EML; см http://homepages.inf.ed.ac.uk/dts/eml ) и Alice ML (www.ps.uni-sb.de/alice ).
ML и его варианты - это функциональные языки, и они не поддерживают никакой записи в память. Они трудны для программирования, но созданные с их помощью программы значительно лучше подходят для формального анализа и подтверждения корректности.
Здравствуй, дорогой читатель. Настала пора рассказать про язык разметкиHTML , с помощью которого созданы абсолютно все сайты Интернета - и российского и буржуйского и даже китайского. Но это не язык программирования, как думают некоторые, а язык разметки гипертекста.
Напомню, что гипертекстом называют текст, в котором есть ссылки на другие страницы и документы. Язык разметки показывает, где и как должен быть размещён какой-то элемент текста, например, абзац, заголовок, список и др. За оформление этих элементов отвечает тесно связанный с HTML язык CSS, который делает оформление страниц сайтов красивым, читаемым и легковесным из-за разгрузки кода страниц.
Кроме CSS html может быть дополнен функциями языков программирования PHP и JavaScript, придающими страницам интерактивность, т.е. способность реагировать на действия пользователя.
С помощью этих всех инструментов можно любой сложности и любой функциональности. Сам же язык HTML отвечает только за разметку
Это мой сайт
Это мой текст
В этом приведённом коде ты видишь команды-теги , которые иногда называют дескрипторами . Они заключены в угловые скобки. Теги в большинстве своём парные. Открывающий и закрывающий, со слэшем впереди . Весь код языка разметки html является вложенным друг в друга, и напоминает как бы «матрёшку», где один контейнер вложен в другой.
На рисунке ниже показана расшифровка этого кода:
А вот как выглядит эта же страница в браузере Mozilla Firefox. Я показал, где отображаются текст заголовка Title и текст тега Body
Как создать html-страницуДля наглядности скопируй текст с тегами, что находится выше, в любой текстовый редактор, например, блокнот и сохрани его на рабочий стол. Нажми правую кнопку и выбери «переименовать». Вместо расширения.txt, как у обычного текстового файла, укажи расширение.html или.htm. Значок блокнота сменится на значок браузера, щёлкнув по которому, ты увидишь свою первую веб-страницу.
Если же расширение не отображается, тогда нужно сделать следующее.
Найти на компьютере: Оформление и персонализация - Параметры папок - Вид.
Показывать расширение файлов всегда полезно, чтобы злоумышленники не могли рассчитывать, что вы откроете файл с заразой типа «подарочек.jpg», который в самом деле будет «подарочек.jpg.exe». Очень легко без расширения, которое Виндос скрывает по умолчанию, принять запускающий файл «зловреда» со скрытым расширением.EXE за обычную картинку.
Смотри видео по созданию HTML-страницПисать код гипертекстовой разметки Html вручную без опыта может показаться тяжким испытанием на внимательность и выносливость. Но, поверь мне, что только таким образом закрепив свои навыки, ты сможешь с гордостью называть себя вебмастером.
Для интеллектуального контроля за написанием html кода вручную существует множество программ с подсветкой кода. Среди любителей-разработчиков наиболее популярны Notepad++, PHP Designer, Dreamweaver
Последние две программы платные, но старые версии, которые ничем не хуже новых, можно найти в сети бесплатно и легально использовать для своих нужд. Dreamweaver является визуальным редактором. Он сам преобразует твой текст с оформлением в код. В любом случае ты не пожалеешь, что познакомишься с этим инструментом.
Зачем же тогда учиться писать код вручную? Дело всё в том, что любые визуальные редакторы, даже редактор, встроенный в Вордпресс, генерируют иногда столько много мусорного собственного кода, что страницы весят во много раз больше написанных с помощью головы и рук. Да если ещё учесть, что поисковые системы сейчас обращают внимание на чистоту кода, тогда поневоле задумаешься об изучении Html, чтобы контролировать весь процесс.
В целом же Дримвейвер заменит на первых порах хорошего учителя. Пользуйся этой программой и смотри, как пишется html-страница. Главное, не ленись посматривать в верхнее окно программы, где формируется код. Отмечай для себя, где программа делает что-то лишнее.
Много людей считают, что браузер предназначен для поиска сайтов в интернете, что это и есть его назначение. Таким образом, в понимании пользователя ПК создаётся ошибочное мнение о назначении браузера. В самом деле же, браузер – это программа для интерпретации html-кода, CSS-кода, JS-кода и др. Иными словами – это прикладное программное средство для отображения веб-страниц и других документов.
Возможности современных браузеров по-настоящему велики. Ведь веб-страницы содержат графику, видео и тексты разных форматов. Браузер читает html-код, видит внедрённый туда видеоматериал, графический и текстовый код и правильно всё это отображает на экранах устройств. В этом ему помогают теги, эти обычные английские слова в угловых скобках .
Браузер видит с помощью тегов, какая часть текста, которую он интерпретирует, является названием сайта, какая заголовком, что нужно представить как абзац, где расположить рисунок и попутно решить множество задач, связанных с различными языками, внедрёнными в обычный HTML.
говорит браузеру, что это Html-документ | |
здесь находится информация для поисковых машин | |
содержимое отображается в окне браузера | |
название страницы | |
Заголовки: от самого большого до самого маленького | |
Жирное и наклонное выделение текста | |
текст ссылки | Говорит браузеру, что это ссылка с текстом «текст ссылки « |
|
Создание нового параграфа |
|
выравнивание параграфа (left, right, justify или center ) |
Говорит браузеру, что нужно создать форму |
Эта таблица приведена с целью показать только основные дескрипторы.
В современной версии HTML5 вместе с новыми тегами появилось огромное количество новых возможностей, которые и не снилось разработчикам сайтов ещё 10 лет назад.
Стили в html-документеКогда браузер отображает содержимое веб-страницы, он отображает заголовки одним стилем, текст абзацев – другим, размеры шрифтов для них применяются также разные. В каждом браузере это задействовано по умолчанию. Но мы хотим видеть индивидуальные оформления веб-страниц, и на помощь тут приходит язык CSS, язык каскадных таблиц стилей . С помощью CSS можно задать оформление любого элемента, можно создать любой дизайн веб-документа.
CSS является стилевым дополнением к языку html и без него не существует.
Стили в Html внедряются так:
Head>
Hr { color: sienna; }
P { margin-left: 20px ; }
Body { background-image: url ("images/back40.gif"); }
Если же применяется внешний файл стилей styles.css, то он подключается к документу html так:
Пример записи CSS-правил:
p {color: black; font: x-small}.
Говорит браузеру, что цвет абзаца
чёрный-black , а шрифт имеет размер x-small (мелкий)
Вот как, например, я задаю стиль содержания в начале каждой статьи этого блога.
Anons
{border: 2px outset green;
border-radius: 10px;
width: 360;
font-family: «Yeseva+One»;
font-size: 16px;
line-height: 1.2em;padding:10px 10px 10px 20px;
margin:10px auto 20px;
text-align:left;
background-color: #a7cece;
}
в последней строке есть интересный фрагмент: background-color: #a7cece ;
#a7cece – это html-цвет. С помощью набора символов HEX – шестнадцатиричной системы: цифр от 0 до 9 и букв от A до F можно задать абсолютно любой цвет. Здесь задан симпатичный аквамариновый.
К теме CSS я ещё вернусь в отдельных публикациях.
Самый лучший способ освоить язык разметки HTML (хтмл) – это скачать самые известные учебные курсы в рунете, к тому же некоторые из них – совершенно бесплатные. Заходи на сайт Попова Евгения и скачивай тонны полезнейшей учебной информации. Для профессиональной подготовки прочти информацию .
Логическая и визуальная разметкиРазличают логическую и визуальную разметки. В первом случае речь идет только о том, какую роль играет данный участок документа в его общей структуре (например, «данная строка является заголовком»). Во втором определяется, как именно будет отображаться этот элемент (например, «данную строку следует отображать жирным шрифтом»). Идея языков разметки состоит в том, что визуальное отображение документа должно автоматически получаться из логической разметки и не зависеть от его непосредственного содержания. Это упрощает автоматическую обработку документа и его отображение в различных условиях (например, один и тот же файл может по-разному отображаться на экране компьютера, мобильного телефона и на печати, поскольку свойства этих устройств вывода существенно различаются). Однако это правило часто нарушается: например, создавая документ в редакторе наподобие MS Word , пользователь может выделять заголовки жирным шрифтом, но нигде не указывать, что эта строка является заголовком.
Примеры языков разметкиЯзыки разметки используются везде, где требуется вывод форматированного текста: в типографии (SGML , TeX , PostScript , PDF), пользовательских интерфейсах компьютеров (Microsoft Word , OpenOffice , troff), Всемирной Сети (HTML , XHTML , XML , WML , VML , PGML , SVG , XBRL).
Облегчённые языки разметкиЯзыки, предназначенные для простого и быстрого написания текста в простом текстовом редакторе, называются облегчёнными (en:Lightweight markup language). Особенности таких языков:
Применяются они там, где человеку приходится подготавливать текст в обычном текстовом редакторе (блоги , форумы , вики), либо там, где важно, чтобы пользователь с обычным текстовым редактором также мог прочитать текст. Вот несколько широко распространённых облегчённых языков разметки:
Термин «разметка» (как результат одноименного процесса, англ. markup ) произошёл от английского словосочетания «marking up » («разметка (как процесс)», букв. «помечивание, размечивание»), взятого из традиционной издательской практики проставления специальных условных пометок на полях и в тексте рукописи или корректуры перед передачей её в печать. Таким образом «разметчики» (markup men) указывали гарнитуру, стиль и размер шрифта для каждой части текста. В наше время разметкой текста занимаются редакторы, корректоры, графические дизайнеры - и, конечно же, сами авторы.
GenCodeИдея использовать языки разметки в компьютерной обработке текстов, вероятнее всего, была впервые обнародована Вильямом Танниклиффом (англ. William W. Tunnicliffe ) на конференции в 1967 году . Сам он именовал своё предложение «универсальным кодированием» (англ. «generic coding» ). В 1970-е годы Танниклифф руководил разработкой стандарта GenCode для издательской индустрии и позже занял пост руководителя одного из комитетов Международной организации по стандартизации (ISO, англ. International Organization for Standartization ), создавшего SGML , первый описательный язык разметки. Брайан Рэйд (англ. Brian Reid ) в своей диссертации, которую он защитил в 1980 году в университете Карнеги (англ. Carnegie Mellon University ), в развитие предложенной концепции осуществил практическую реализацию описательной разметки.
Тем не менее, в настоящее время «отцом» языков разметки обычно называют исследователя IBM Чарльза Голдфарба (англ. Charles Goldfarb ). Основная концепция родилась у него в 1969 году , при работе над примитивной системой управления документами, предназначенной для адвокатских контор. В том же году он принял участие в создании языка IBM GML , который был впервые представлен в 1973 году .
Некоторые ранние реализации компьютерных языков разметки можно обнаружить в типографских утилитах UNIX , таких как troff и nroff. Они позволяют вставлять команды форматирования в текст документа для его форматирования согласно требованиям редактора.
Доступность издательского софта с функцией WYSIWYG (англ. «what you see is what you get» - «что увидишь, то и получишь») вытеснила большинство этих языков среди обычных пользователей, хотя серьёзная издательская работа по-прежнему использует разметку для специфических не визуальных структур текста, а WYSIWYG-редакторы сейчас чаще всего сохраняют документы в форматах, основанных на языках разметки.
ΤΕ ΧДругой важный издательский стандарт - это ΤΕ Χ , созданный и впоследствии улучшенный Дональдом Кнутом в 70е-80е года двадцатого столетия. ΤΕ Χ собрал воедино высокие возможности форматирования текста и описания шрифтов, в особенности для математических книг профессионального качества. В настоящее время ΤΕ Χ является стандартом де-факто во многих научных дисциплинах. Помимо Тех существует LaTeX , который представляет собой широко используемую описательную систему разметки на основе ΤΕ Χ .
Scribe, GML и SGMLВ начале 80х идея, что разметка должна быть сфокусирована на структурных аспектах документа и должна оставить внешнее представление документа интерпретатору, привела к созданию SGML. Язык был разработан комитетом, возглавляемым Голдфарбом. Он объединил идеи со многих источников, включая Тьюнникоффликский проект, GenCode. Шэрон Адлер (Sharon Adler), Андерс Бергланд (Anders Berglund) и Джеймс А. Марк (James A.Marke) так же были ключевыми членами комитета SGML.
SGML точно определял синтаксис для включения разметки в текст, а также отдельно описывал, какие теги разрешены и где (DTD - Document Type Definition). Это давало возможность авторам создавать и использовать любую разметку, какую они захотят, выбирая теги для использования и давая им имена на нормальном языке. Таким образом, SGML следует считать метаязыком ; множественные специальные языки разметок произошли от него. Поздние 80е были наиболее значимыми в появлении новых языков разметок, основанных на SGML, например TEI и DocBook .
В 1986 году SGML был опубликован как международный стандарт организацией ISO под номером 8879. SGML нашел широкое признание и широко использовался в очень больших проектах. Как бы то ни было, в целом было обнаружено, что он громоздок и труден для изучения, побочным эффектом языка было в том, что он пытался сделать слишком много и быть чересчур гибким. Для примера, SGML создавал не всегда нужные закрывающие теги (или открывающие, или даже оба), потому что считал, что эта разметка будет добавлена вручную, штатом поддержки проекта, которые бы оценили экономию нажатий клавиш.
HTMLК 1991 году использование SGML было ограничено бизнес-программами и базами данных, а WYSIWYG-инструменты (которые сохраняли документы в проприетарных бинарных форматах) использовались для остальных программ обработки документов. Ситуация изменилась, когда сэр Тим Бернерс-Ли , узнав о SGML от своего коллеги Андерса Бергланда (англ. Anders Berglund ) и других сотрудников в ЦЕРНе , использовал синтаксис SGML для создания HTML . Этот язык имел сходство с другими основанными на синтаксисе SGML языками разметки, однако начать его использование было гораздо проще даже тем разработчикам, которые никогда этого не делали. Стивен ДеРоуз (Steven DeRose) убеждал, что HTML, использующий описательную разметку (и от языка SGML в частности) - это основной фактор в развитии Web, потому что в нем была заложена гибкость и расширяемость (а также другие факторы, включая понятие о URL и свободное использование браузерами). В наше время HTML - наиболее привлекательный и самый часто используемый язык разметки в мире.
Однако статус HTML как языка разметки оспаривается некоторыми компьютерными учеными. Их основным аргументом является то, что HTML ограничивает размещение тегов, требуя, чтобы оба тега были вложены в другие теги или в главные теги документа. Вследствие чего, эти ученые считают HTML контейнерным языком, следующим иерархической модели.
XMLXML (расширяемый язык разметки) - это мета-язык разметки, широко используемый в настоящее время. XML разработан консорциумом World Wide Web в комитете, возглавляемом Джоном Босаком (Jon Bosak). Основное предназначение XML - быть более простым, чем SGML и сфокусироваться на специфичной проблеме - документах в интернете. XML - мета-язык как SGML, пользователям разрешается создавать любые теги, какие необходимы (отсюда «расширяемый»). Становлению XML помогли, так как каждый XML-документ мог быть написан таким же способом, как и SGML-документ, а программы и пользователи, использующие SGML, могли перейти на XML достаточно легко.
Тем не менее, XML лишился многих ориентированных на людей особенностей языка SGML, упрощавших его использование (пока не расширилось количество разметки и не восстановилась читаемость и редактируемость на прежнем уровне). Другие улучшения исправляли некоторые проблемы SGML на международном уровне и делали возможным разбор документа иерархически, даже если не был доступен DTD.
XML был спроектирован, в основном, для не полностью структурированной среды, например для документов и публикаций. Тем не менее, это привело к золотой середине между гибкостью и простотой, и он был быстро принят многими пользователями. В настоящее время XML широко используется для передачи данных между программами. Как HTML, он может быть охарактеризован как «контейнерный» язык.
XHTMLНачиная с января 2000 года, все рекомендации для W3C были основаны на XML в большей степени, чем на SGML, была предложена аббревиатура XHTML (Extensible HyperText Markup Languge - Расширяемый Гипертекстовый Язык Разметки). Спецификации языка требовали, чтобы XHTML-документы были оформлены как XML-документы, это позволяет использовать XHTML для более четких и точных документов, используя теги от HTML.
Одно из самых достойных внимания различий между HTML и XHTML - это правило, гласящее, что все теги должны быть закрытыми: пустые теги, например , должны быть оба закрыты стандартным закрывающим тегом или специальной записью: (пробел перед «/» в закрывающем теге опционален, но часто используется, поскольку его используют некоторые пре-XML браузеры, также SGML-парсеры). Другие атрибуты в тегах должны быть в кавычках. Наконец, все теги и имена атрибутов должны быть написаны в нижнем регистре, чтобы восприниматься правильно; HTML невосприимчив к регистру.
Другие разработки, основанные на XMLСейчас используются многие разработки, основанные на XML, например RDF (Resource Descriprtion Framework - Фреймворк Описания Ресурсов), XFORMS, DocBook, SOAP и OWL (Ontology Web Language).
ОсобенностиОбщая особенность всех языков разметки в том, что они перемешивают текст документа с инструкциями разметки в потоке данных или файле. Это не необходимость, возможно изолировать разметку от текста, используя указатели, метки, идентификаторы или другие методы координации. Такая «отделенная разметка» характерна для внутреннего представления программ, работающих с размеченными документами. Тем не менее, внедренная или «междустрочная» разметка более принята где бы то ни было. Вот, для примера, небольшая часть текста, размеченного при помощи HTML:
Anatidae
The family Anatidae includes ducks, geese, and swans, but not the closely-related screamers.
Код разметочных инструкций (известный как теги) обведен угловыми скобками . Текст, находящийся между этими инструкциями, является текстом документа. Коды h1 , p и em - примеры структурной разметки, они описывают позицию, назначение или значение текста, включенного в них.
Более точно, h1 означает «это заголовок первого уровня», p значит «это параграф», а em означает «это подчеркнутое слово или фраза». Интерпретирующая программа может применять эти правила или стили для показа различных частей текста, используя различные гарнитуры, размеры шрифта, отступы, цвет или другие стили, если это необходимо. Такой тег, как h1, может быть, например, представлен большим жирным типографским шрифтом, или в документе с моноширинным текстом (как на печатной машинке) может быть подчеркнутым, или может вообще не менять внешний вид.
Для контраста, тег i в HTML - пример визуальной разметки; обычно он используется для определения специфичных особенностей текста (в этом блоке использовать наклонную гарнитуру) без объяснения причин.
TEI (Tex Encoding Initiative) опубликовала всесторонние руководящие документы, указывающие кодировать текст в интересах человечества и научных обществ. Эти руководства использовались для кодирования исторических документов, специфичных работах ученых, периодике и так далее.
Альтернативное использованиеПока развивалась идея использовать языки разметки с текстовыми документами, это увеличило использование языков разметки в других областях, предложили использовать их для представления различных типов информации, включая плейлисты, векторную графику, веб-сервисы, интерфейсы пользователя. Большинство этих приложений основано на XML, т. к. это хорошо структурированный и расширяемый язык.
Справочник технического переводчика
язык разметки - 23.06.33 язык разметки : Язык, состоящий из встроенных команд, обеспечивающий поддержку при разметке текста в процессе его обработки.
(Standard Generalized Markup Language), представленный в стандарте ISO 8879. Этот язык принят в качестве основного языка оформления технической документации, в том числе интерактивных электронных технических руководств на создаваемые изделия в CALS-технологиях .
В языке SGML определяется структура документов в виде последовательности объектов данных. Объекты данных, представляющие части документа, могут храниться в различных файлах. Стандарт SGML устанавливает такие множества символов и правил для представления информации, которые позволяют различным системам правильно распознавать и идентифицировать эту информацию. Названные множества описывают в отдельной части документа, называемой декларацией DTD (Document Type Decfinition), которую передают вместе с основным SGML-документом. В DTD указывают соответствие символов и их кодов, максимальные длины используемых идентификаторов, способ представления ограничителей для тегов, другие возможные соглашения, синтаксис DTD, а также тип и версию документа. Следовательно, SGML можно назвать метаязыком для семейства конкретных языков разметки. В частности, подмножествами SGML можно считать языки разметки XML и HTML .
Техническое описание в виде SGML-документа включает:
Однако язык SGML сложен для освоения и применения. Поэтому для широкого применения разметки в документах, представляемых в WWW -технологиях, в 1991 г. на базе SGML был разработан упрощенный язык HTML (HyperText Markup Language), а в 1996 г. язык XML (eXtensible Markup Language), который становится в сочетании с HTML основным языком представления документов в различных приложениях.
Язык HTML разработан с целью широкого применения разметки в документах, представляемых в WWW-технологиях.
Описание на языке HTML представляет собой текст в формате ASCII и последовательность включенных в него команд (управляющих кодов), называемых также дескрипторами или тегами. Этот текст называют HTML-документом, или HTML-страницей, или после размещения на Web-сервере — Web-страницей . Теги расставляются в нужных местах исходного текста, они определяют шрифты, переносы, появление графических изображений, ссылки и т.п. При использовании WWW-редакторов вставка команд осуществляется простым нажатием соответствующих клавиш.
Язык XML, как и HTML, считается подмножеством языка SGML. В настоящее время язык XML претендует на роль основного языка представления документов в информационных технологиях, его можно рассматривать как метаязык, служащий основой для создания частных языков разметки в различных приложениях. При этом XML более удобен, чем SGML, что обеспечивается устранением в XML некоторых второстепенных особенностей SGML. Описания на XML легче воспринимаются, приспособлены для использования в современных браузерах при сохранении основных возможностей SGML.
Для конкретных приложений создаются свои варианты XML, называемые XML-словарями или XML-приложениями. Так, для описания текстов со специфической математической символикой разработано XML-приложение OSD (Open Software Description). Для CALS интерес представляет вариант Product Definition eXchange (PDX), посвященный обмену данными. Известны словари для химии (CML — Chemical Markup Language), биологии (BSML — Bioinformatic Sequence Markup Language) и др.
Трудно сказать, когда впервые возник вопрос о появлении и формировании человека. Этой проблемой интересовались как мыслители древних цивилизаций, так и наши современники. Как развивается общество? Можно ли выделить определенные критерии и этапы этого проц
В основе ритмического строения частушек лежат обычные для литературного стихосложения стопы (двусложные и трехсложные). Исполнение частушки и под балалайку, и под гармонь, и без музыкального сопровождения приводит к тому, что ритмическая четкость метричес
Каждое предприятие стремится к постоянному улучшению показателей экономической эффективности. Практические меры, связанные с достижением желаемых индикаторов, могут быть реализованы в самом широком спектре. При этом важно не только внедрить соответствующи
Ранние годы. Семья Фемистокл родился в Афинах около 524 года до н. э. Его отцом был афинянин из не очень знатного рода Неокл. Матерью Фемистокла, согласно Плутарху , была либо фракиянка Абротонон, либо женщина родом из Галикарнаса Эвтерпа . В независимос
Анна Иоанновна Романова Российская императрица Годы жизни: 1693-1740 Годы правления: 1730-1740 Вторая дочь Ивана V Алексеевича (брата и соправителя царя Петра I) и Прасковьи Федоровны Салтыковой, племянница . Анна Иоановна краткая биография В 3 года Ан
Для эффективной деятельности любого предприятия одним из важных факторов является степень сплочённости коллектива. От этого зависит успешность в достижении поставленных целей.Коллектив – общность людей, объединённых достижением единой цели. Члены такой ко