Язык гипертекстовой разметки HTML. Основы HTML, язык разметки гипертекста Hyper Text Markup Language
Гипертекстовая разметка применяется для указания, в какой части экрана и каким образом должен быть отображен текст и как связаны между собой тексты, составляющие гипертекстовую базу данных. С этими целями в те кст вв одятся специальные управляющие символы. Текст с управляющими символами хранится в обычном текстовом файле в кодах ASCII и может быть обработан практически любым текстовым редактором.
Язык гипертекстовой разметки HTML был предложен Тимом Бернерсом-Ли в 1989г. К моменту создания создания HTML существовал стандарт языка разметки печатных документов - SGML (Standart Generalised Markup Language), который и был взят в качестве основы HTML . Предполагалось, что такое решение поможет использовать существующее программное обеспечение для интерпретации нового языка.
В качестве элемента гипертекстовой базы данных для HTML был выбран обычный текстовый файл, который хранится средствами файловой системы операционной Среды ЭВМ.
Таким образом, гипертекстовая база данных в концепции WWW -это набор текстовых файлов, написанных на языке HTML , который определяет:
Форму представления информации (разметка);
Структуру связей файлов между собой (гипертекстовые ссылки). Такой подход предполагает наличие еще одной компоненты
технологии - интерпретатора языка. В WWW функции интерпретатора разделены между сервером гипертекстовой базы данных и интерфейсом пользователя. Сервер, кроме доступа к документам и обработки гипертекстовых ссылок, осуществляет так же препроцессорную обработку документов, тогда, как интерфейс пользователя осуществляет интерпретацию конструкций языка, связанных с представлением информации.
В 1990г. появилась нулевая версия HTML 0.
Первая версия (HTML 1.0) была направлена на представление языка как такового, где описание его возможностей носило скорее рекомендательный характер.
Прогнозирования являются стержнем любой торговой системы, поэтому отлично составленные могут сделать вас бешено богатым.
Вторая версия (HTML 2.0) фиксировала практику использования конструкций языка и явилась стандартом для построения WWW .
Версия ++ HTML ++ представляла новые возможности по представлению научной информации и таблиц, улучшения стиля компоновки текста и изображений.
Третья версия (HTML 3.0) упорядочила все нововведения и формализовала интерфейс пользователя гипертекстовой распределенной системы.
В 1996г. выпущена новая версия языка: HTML 3.2 ,включающая средства для создания таблиц, конструкции языка Java , карты-изображения (располагающиеся на машине-клиенте) и новые типы форматирования текста.
HTML - это текстовый язык, в котором инструкции по форматированию, называемые тэгами (tags), встроены в текст документа.
Процесс создания HTML - документа заключается во включении тэгов внутрь неформатированного текста, несущего информационную нагрузку.
Тэги HTML - это последовательности символов, начинающиеся знаком “меньше” (<) и заканчивающиеся знаком “больше” (>).
Большинство функций форматирования в HTML специфицирует логические, а не физические стили. Например, тэги заголовков, которые обычно обозначают больший размер букв, не указывают, какой именно размер надо использовать. Браузер (который выполняет роль клиентской программы) выбирает размер текста для заголовков, превышающий обычный. Этот подход позволяет избавиться от платформы - документ, созданный на Macintosh может быть использован UNIX или Windows . Недостатком является то, что на разных платформах документ выглядит по-разному.
Браузеры WWW при анализе предложений HTML работают по следующим правилам:
Пробелы и другие “невидимые” символы игнорируются;
Все тэги могут быть разделены на группы: базовые тэги, тэги форматирования, структурные тэги, указатели, и т.д.;
Тэги форматирования могут быть написаны строчными и/или прописными буквами;
Большинство тэгов форматирования пишутся парами. Открывающий тэг активирует данный эффект, а закрывающий -в ыключает его. Пара тэгов иногда называется контейнером, поскольку эффект, который они включают и выключают проявляется на тексте, расположенном внутри них. Например, для того, чтобы указать, что строка должна быть напечатана жирными символами, надо написать: < B > Эта строка будет напечатана жирным текстом B >
Текст, находящийся внутри закрывающего тэга, всегда предваряется символом “обратная косая черта”. Среди базовых тэгов HTML исключением из этого правила являются: < BASE > (основная информация), < BR > (конец строки), < HR > (горизонтальная линейка), и < IMG > (изображение). Эти тэги существуют в единичном экземпляре.
Каждый документ HTML имеет граничные тэги: < HTML > и HTML >. Эта пара тэгов заключает в себе все другие тэги Web -страницы и все информационное содержание документа. Фактически они декларируют, что все содержимое контейнера является кодом HTML . Тэг < HTML > должен располагаться в первой строке файла, а тэг HTML > - в последней.
Каждый HTML -документ содержит заголовок документа и его тело.
Заголовок документа идентифицирует документ. Он должен идти сразу после тэга < HTML > и начинаться с < HEAD >. Заканчивается заголовок тэгом HEAD >.
В заголовке документа обязательно должны присутствовать название документа и его базовый URL -адрес.
Название документа располагается между тэгами < TITLE > и TITLE >. Оно используется браузером и Web -сервером. Длина названия не должна превышать 40 символов. Название документа должно быть информативным, отражать содержание документа, чтобы его можно было идентифицировать. Название встречается в строке заголовка Internet Explorer , в списках журнала (History) и “Избранных стрницах” (Favorites).
Базовый URL должен быть полным (абсолютным) и содержать протокол, адрес компьютера в Internet и имя файла. Он указывается в тэге < BASE HREF = “базовый_URL”>. Все остальные URL в документе могут указываться относительно базового. Например, если базовый URL имеет адрес: http://www.microsoft.com/products/office/word/datasheets.html и необходимо указать URL файла features . html , расположенного в каталоге / products / office / excel на том же сервере, можно указать: ../ excel / features . html , а не набирать полный адрес.
Символы. ./ указывают, что нужно перейти на один уровень каталогов вверх относительно базового адреса.
Наличие базового адреса облегчает перенос документа на другой сервер, так как если все остальные URL в документе относительные, то при переносе необходимо изменить только имя сервера в базовом URL .
Тело документа содержит весь текст, несущий информацию и все тэги HTML , используемые для форматирования текста. Тело документа начинается сразу же после заголовка и ограничивается тэгами < BODY > и BODY >.
Пример HTML -документа:
< TITLE > Название документа TITLE >
< BASE HREF = “базовый_URL” >
Тэги, используемые в теле документа, позволяют указывать следующие элементы разметки текста:
Начало абзаца и конец строки
Стили заголовков
Физические стили -л огические стили
Специальные символы.
Гипертекстовые ссылки состоят из двух частей: указателя и URL . Указатель - это текст, по которому пользователь должен щелкнуть для того, чтобы куда-то переместиться. URL указывает адрес, с которого браузер будет загружать документ, когда пользователь щелкнет по указателю.
Текстовые указатели в графических браузерах обычно подчеркнуты и выделены цветом. В чисто текстовых браузерах они выделяются жирным шрифтом.
В качестве указателя может использоваться любой текст, независимо от его размеров и особенностей форматирования. Указатель может состоять из нескольких букв, слов или даже строк текста.
Формат указателя:
< A HREF = “ URL ”> текст указателя A > ,
где буква А в тэге < A HREF > означает указатель (anchor), а HREF -гипертекстовую ссылку (Hypertext REFerence). Все, что находится между тэгами < A HREF = “ URL ”> и A > является текстом указателя, который выводится на экран подчеркнутым или жирным шрифтом.
Вместе с гипертекстовыми указателями могут быть использованы другие форматирующие коды. Например:
< A HREF = “ URL ”> < I > I > A > или
< I > < A HREF = “ URL ”> Переход к более подробному изложению A > I >
Технология WWW
Служба World Wide Web (WWW) – самая популярная служба Internet. WWW – это единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов, хранящихся на Web-серверах. Отдельные документы, составляющие пространство Web, называют Web-страницами. Группы тематически объединенных Web-страниц называют Web-узлами (Web-сайт).Один физический Web-сервер может содержать достаточно много Web-узлов, каждому из которых отводится отдельный каталог на жестком диске сервера.
От обычных текстовых документов Web-страницы отличаются тем, что они оформлены без привязки к конкретному носителю. Например, оформление Word-документа, напечатанного на бумаге привязано к параметрам печатного листа, который имеет определенную высоту, ширину и размер полей. Электронные Web-документы предназначены для просмотра на экране ПК, причем заранее не известно на каком. Поэтому Web-документы не могут иметь жесткое форматирование. Оформление выполняется во время их воспроизведения на ПК клиента и производится оно в соответствии с настройками программы, выполняющей просмотр (браузера). Браузер выполняет отображение документа в соответствии с теми командами, которые записаны в тексте Web-документа. Команды могут записываться либо непосредственно автором документа, либо внедряться автоматическими средствами подготовки Web-документов.
Такие команды называются тегами. Теги заключаются в скобки <>. Большинство тегов используются парами: открывающий тег и закрывающий.
Сложные теги кроме ключевого слова имеют дополнительные атрибуты и параметры. Правила записи тегов содержатся в спецификации специального языка разметки гипертекста – HTML (Hyper Text Markup Language). Т. е. Web-документ представляет собой обычный текстовый документ, размеченный тегами HTML.
Наиболее важной чертой Web-документов являются гипертекстовые ссылки. Гиперссылку можно установить на любой фрагмент текста. Для создания гиперссылки используется парный тег . Этот тег содержит обязательный атрибут HREF, который задает адрес URL документа, на который указывает ссылка.
Адрес может быть задан в абсолютной и в относительной форме. Адрес в абсолютной форме начинается с указания протокола и адреса Web-узла. Такая запись используется, когда необходимо направить посетителя на другой Web-узел, и рассматривается как внешняя ссылка. При использовании относительного адреса в ссылке задается только относительный путь поиска для документа. При этом предполагается использование того же протокола и того же Web-узла, а ссылка рассматривается как внутренняя. Внутренняя ссылка сохраняет свою работоспособность в случае изменения адреса Web-узла как целого (например, на другой сервер). Полный формат гиперссылки включает возможность ссылки на определенное место внутри страницы. Но это можно сделать только для страниц собственной разработки. Для этого место, на которое ставится ссылка помечается с помощью специального элемента- якоря. Якорь задается с помощью парного тега c обязательным атрибутом NAME. Значением этого атрибута является произвольная последовательность латинских букв и цифр – имя якоря. Для ссылки на якорь его имя указывается в конце адреса URL после символа #.
Браузер будет искать документ на данном сервере в текущей папке
Браузер выполнит переход на сайт http://www.midi.ru.
Совокупность огромного числа гипертекстовых документов, хранящихся на серверах WWW, образует своеобразное пространство гипердокументов, между которыми возможно перемещение. Произвольное перемещение между документами называют Web-серфингом, а целенаправленное (выполняется с целью поиска нужной информации) – Web-навигацией.
Гипертекстовая связь между огромным количеством документов, хранящихся на физических серверах Internet, является основой существования логического пространства WWW.
Рассмотрим аппаратные и программные средства, которые в совокупности образуют Веб.
· Клиенты и серверы. Веб-сервер - это подключенный к Интернету компьютер, на котором выполняется специальная программа, также называемая веб-сервером. В задачи этой программы входит хранение, поиск и распределение определенных файлов в Веб. Клиент Веб - это браузер, запрашивающий файлы из Веб. Когда клиентский компьютер хочет получить доступ к одному из файлов, запрос направляется на веб-сервер. Сервер отыскивает указанный файл и отправляет его клиентскому компьютеру, передавшему запрос. Тысячи компьютеров, которые образуют Веб, представляют собой самые разнообразные сочетания аппаратных и программных средств. Когда компьютер-клиент запрашивает какой-либо файл, он практически ничего не знает ни об особенностях сервера, где хранится искомый файл, ни о других компьютерах, которые будут передавать файл друг другу на его пути от сервера к клиенту. Чтобы такая система работала, она должна использовать набор языков и протоколов, не зависящих от аппаратных средств или операционных систем.
· URL и протоколы передачи данных. Если фрагменты документа разбросаны по всему миру, а вы хотите предоставить его пользователю в виде цельного, выдержанного в едином стиле документа» понадобится очень хорошая адресная система. Каждый файл в Интернете имеет адрес, называемый URL (Uniform Resource Locator - унифицированный указатель информационного ресурса). Например, URL сайта Европейской федерации футбола - http://ru.uefa.com.
Первая часть URL определяет метод, посредством которого компьютер получает доступ к файлу, то есть коммуникационный протокол. К большинству веб-страниц доступ осуществляется с помощью протокола HTTP (Hypertext Transfer Protocol - протокол передачи гипертекстовых документов). Вот почему веб-адрес обычно указывают с использованием букв «http», а браузеры автоматически вставляют эти буквы перед вводимым пользователем веб-адресом. Нередко часть адреса http:// в начале URL опускается.
Следующая часть адреса - это хост-имя веб-сервера. Система доменных имен направит ваш запрос веб-серверу где бы он ни находился.
Некоторые URL содержат информацию, указываемую вслед за хост-именем веб-сервера. Эти данные точно определяют файл, который вы хотите просмотреть и каталог, где он хранится. Если имена каталога и файла не указаны, на экран выводится веб-страница этого веб-сервера, заданная по умолчанию.
· HTML (Hypertext Markup Language - язык разметки гипертекстовых до-нтов) является универсальным языком Веб. Он используется для компоновки страниц, на которых может быть воспроизведена информация, размещенная в Веб: текстовая, графическая, а также аудио- и видеоинформация.
· Java и JavaScript. ЯзыкJava предназначен для пересылки через Веб небольших приложений (называемых апплетами или Java-приложениями). А язык JavaScript расширяет возможности НTML с целью встраивания небольших программ (или сценариев) в веб-страницы. Основное назначение апплетов и сценариев состоит в повышении интерактивности веб-страниц - вместо взаимодействия с удаленным веб-сервером вы работаете с апплетом и сценарием, которые выполняются на вашем компьютере.
Существуют также Java-апплеты и сценарии JavaScript для построения анимации, они пересылаются веб-сервером по сети, чтобы быть выполненными на компьютере пользователя; они позволяют избежать передачи кадров анимации по Интернету. Описанные процессы обычно происходят незаметно для пользователя.
· VBScript и элементы управления ActiveX. Язык VBScript и элементы управления ActiveX - это стандартные средства, поддерживаемые браузером Internet Explorer.
VBScript представляет собой упрощенную версию языка Visual Basic, разработанного компанией Microsoft. С его помощью можно создавать сценарии, которые придают веб-страницам динамичность. Таким образом, по своим возможностям VBScript аналогичен языку JavaScript.
Элементы управления ActiveX, подобно Java-апплетам, применяются для встраивания выполняемых программ в веб-страницы. Когда Internet Explorer встречает веб-страницу, где используются элементы управления ActiveX, он проверяет, установлен ли конкретный элемент управления на вашем компьютере, и если нет -инсталлирует его.
· XML и другие расширенные языки Веб. XML (Extensible Markup Language - расширенный язык описания документов) представляет собой очень мощный язык, который должен заменить HTML в качестве языка разработки приложений для Веб. В отличие от HTML, XML не содержит никаких инструкций о том, как должны отображаться описанные в XML-документе данные. Способ их отображения задается языком описания стилей, который играет для XML примерно ту же роль, что каскадные таблицы стилей для HTML. Консорциум W3C работает с двумя спецификациями таблиц стилей: XSL (Extensible Style Language - расширенный язык стилей) и CSS (Cascading Style Sheets - каскадные таблицы стилей). Другое принципиальное отличие XML от HTML состоит в том, что он может содержать любые теги, которые сочтут нужным использовать создатели XML-словаря.
Более совершенной версией HTML является язык DHTML (Dynamic HTML -динамический HTML), включающий три компонента - HTML, JavaScript и CSS.
· Графические объекты. Рисунки, чертежи, карты, диаграммы и другие графические изображения, представленные в Веб, могут иметь множество форматов. Наиболее распространенными форматами отображения графической информации являются JPEG и GIF.
· Аудио- и видеофайлы. Веб предоставляет множество аудио- и видеофайлов, которые воспроизводятся посредством интегрированных программных модулей обозревателя. Существует два способа передачи таких данных: браузер может либо загрузить их в виде целого файла (тогда воспроизводить придется весь объем информации, что займет немало времени, поскольку звуковые файлы имеют большие размеры, а видеофайлы - просто огромны), либо взять только ту часть файла, которую необходимо воспроизвести в данный момент. Второй метод называется потоковым аудио или потоковым видео.
HyperText Markup Language (HTML) – язык разметки гипертекста – предназначен для написания гипертекстовых документов, публикуемых в World Wide Web.
Гипертекстовый документ – это текстовый файл, имеющий специальные метки, называемые тегами, которые впоследствии опознаются браузером и используются им для отображения содержимого файла на экране компьютера. С помощью этих меток можно выделять заголовки документа, изменять цвет, размер и начертание букв, вставлять графические изображения и таблицы. Но основным преимуществом гипертекста перед обычным текстом является возможность добавления к содержимому документа гиперссылок – специальных конструкций языка HTML, которые позволяют щелчком мыши перейти к просмотру другого документа.
Существует два способа создания гипертекстовых документов. Можно воспользоваться одним из WYSIWYG HTML-редакторов (например, Microsoft FrontPage, или др.), для работы с которыми не требуется специальных знаний о внутренней структуре создаваемого документа. Этот способ позволяет создавать документы для WWW без знания языка HTML. HTML-редакторы автоматизируют создание гипертекстовых документов, избавляют от рутинной работы. Однако их возможности ограничены, они сильно увеличивают размер получаемого файла и не всегда полученный с их помощью результат соответствует ожиданиям разработчика. Но, безусловно, этот способ незаменим для новичков в деле подготовки гипертекстовых документов.
Альтернативой служит создание и разметка документа при помощи обычного редактора текста (NotePad). При этом способе в текст вручную вставляются команды языка HTML. Создавая документы таким способом, вы точно знаете, что делаете.
Как уже отмечалось, HTML-документ содержит символьную информацию. Одна ее часть - собственно текст, т. е. данные, составляющие содержимое документа. Другая – теги (markup tags), называемые также флагами разметки , – специальные конструкции языка HTML, используемые для разметки документа и управляющие его отображением. Именно теги языка HTML определяют, в каком виде будет представлен текст, какие его компоненты будут исполнять роль гипертекстовых ссылок, какие графические или мультимедийные объекты должны быть включены в документ. Графическая и звуковая информация, включаемая в HTML-документ, хранится в отдельных файлах. Программы просмотра HTML-документов (браузеры) интерпретируют флаги разметки и располагают текст и графику на экране соответствующим образом. Для файлов, содержащие HTML-документы, приняты расширения.htm или.html.
Прописные и строчные буквы при записи тегов не различаются. В большинстве случаев теги используются парами. Пара состоит из открывающего (start tag) и закрывающего (end tag) тегов. Синтаксис открывающего тега:
<имя_тега [атрибуты]>
Прямые скобки, используемые в описании синтаксиса, означают, что данный элемент может отсутствовать. Имя закрывающего тега отличается от имени открывающего лишь тем, что перед ним ставится наклонная черта:
имя_тега>
Атрибуты тега записываются в следующем формате:
имя[="значение"]
Кавычки при задании значения аргумента не обязательны и могут быть опущены. Для некоторых атрибутов значение может не указываться. У закрывающего тега атрибутов не бывает.
Действие любого парного тега начинается с того места, где встретился открывающий тег и заканчивается при встрече соответствующего закрывающего тега. Часто пару, состоящую из открывающего и закрывающего тегов, называют контейнером , а часть текста, окаймленную открывающим и закрывающим тегом, – элементом .
Последовательность символов, составляющая текст, может состоять из пробелов, табуляций, символов перехода на новую строку, символов возврата каретки, букв, знаков препинания, цифр, и специальных символов (например, +, #, $, @), за исключением следующих четырех символов, имеющих в HTML специальный смысл: < (меньше), > (больше), & (амперсенд) и " (двойная кавычка). Если необходимо включить в текст какой-либо из этих символов, то следует закодировать его особой последовательностью символов.
HyperText Markup Language (HTML) – язык разметки гипертекста – предназначен для написания гипертекстовых документов, публикуемых в World Wide Web.
Гипертекстовый документ – это текстовый файл, имеющий специальные метки, называемые тегами, которые впоследствии опознаются браузером и используются им для отображения содержимого файла на экране компьютера. С помощью этих меток можно выделять заголовки документа, изменять цвет, размер и начертание букв, вставлять графические изображения и таблицы. Но основным преимуществом гипертекста перед обычным текстом является возможность добавления к содержимому документагиперссылок – специальных конструкций языка HTML, которые позволяют щелчком мыши перейти к просмотру другого документа.
Существует два способа создания гипертекстовых документов. Можно воспользоваться одним из WYSIWYG HTML-редакторов (например, Microsoft FrontPage, или др.), для работы с которыми не требуется специальных знаний о внутренней структуре создаваемого документа. Этот способ позволяет создавать документы для WWW без знания языка HTML. HTML-редакторы автоматизируют создание гипертекстовых документов, избавляют от рутинной работы. Однако их возможности ограничены, они сильно увеличивают размер получаемого файла и не всегда полученный с их помощью результат соответствует ожиданиям разработчика. Но, безусловно, этот способ незаменим для новичков в деле подготовки гипертекстовых документов.
Альтернативой служит создание и разметка документа при помощи обычного редактора текста (NotePad). При этом способе в текст вручную вставляются команды языка HTML. Создавая документы таким способом, вы точно знаете, что делаете.
Как уже отмечалось, HTML-документ содержит символьную информацию. Одна ее часть - собственно текст, т. е. данные, составляющие содержимое документа. Другая – теги (markup tags), называемые такжефлагами разметки , – специальные конструкции языка HTML, используемые для разметки документа и управляющие его отображением. Именно теги языка HTML определяют, в каком виде будет представлен текст, какие его компоненты будут исполнять роль гипертекстовых ссылок, какие графические или мультимедийные объекты должны быть включены в документ. Графическая и звуковая информация, включаемая в HTML-документ, хранится в отдельных файлах. Программы просмотра HTML-документов (браузеры) интерпретируют флаги разметки и располагают текст и графику на экране соответствующим образом. Для файлов, содержащие HTML-документы, приняты расширения.htm или.html.
Прописные и строчные буквы при записи тегов не различаются. В большинстве случаев теги используются парами. Пара состоит из открывающего (start tag) и закрывающего (end tag) тегов. Синтаксис открывающего тега:
<имя_тега [атрибуты]>
Прямые скобки, используемые в описании синтаксиса, означают, что данный элемент может отсутствовать. Имя закрывающего тега отличается от имени открывающего лишь тем, что перед ним ставится наклонная черта:
имя_тега>
Атрибуты тега записываются в следующем формате:
имя[="значение"]
Кавычки при задании значения аргумента не обязательны и могут быть опущены. Для некоторых атрибутов значение может не указываться. У закрывающего тега атрибутов не бывает.
Действие любого парного тега начинается с того места, где встретился открывающий тег и заканчивается при встрече соответствующего закрывающего тега. Часто пару, состоящую из открывающего и закрывающего тегов, называют контейнером , а часть текста, окаймленную открывающим и закрывающим тегом, –элементом .
Последовательность символов, составляющая текст, может состоять из пробелов, табуляций, символов перехода на новую строку, символов возврата каретки, букв, знаков препинания, цифр, и специальных символов (например, +, #, $, @), за исключением следующих четырех символов, имеющих в HTML специальный смысл: < (меньше), > (больше), & (амперсенд) и " (двойная кавычка). Если необходимо включить в текст какой-либо из этих символов, то следует закодировать его особой последовательностью символов.
Структура HTML-документа
Самым главным из тегов HTML является одноименный тег – . Он должен всегда открывать ваш документ, так же, как тег должен непременно стоять в последней его строке. Эти теги обозначают, что находящиеся между ними строки представляют единый гипертекстовый документ. Без этих тегов браузер или другая программа просмотра не в состоянии идентифицировать формат документа и правильно его интерпретировать.
Закрывающий тег так же важен, как и открывающий. Если, например, документ включен в электронное письмо, тег