Технический текст всегда строгий и упорядоченный, поскольку в нём важно правильно выстроить иерархию. Чтобы задать в нём логическую структуру, обязательно нужно знать, что такое XML. Этот формат особенно актуален в Java-разработке, а также при тестировании API.
Чтобы разобраться, зачем нужен XML формат, что это такое, рассмотрим стандартную ситуацию.
В организации создается внушительный объем документов для общего доступа. Сотрудники их корректируют, в том числе исправляют ошибки, делают уточнения, меняют местами абзацы. Руководители отделов контролируют этот процесс и тоже могут вносить комментарии. Обычно для подобной совместной работы используется MS Word, а чтобы применить функцию, в меню нужно выбрать «отслеживание изменений».
Корректное название таких пометок в текстовом документе – разметка. Чтобы её сделать, нужны специальные элементы для определения структуры – теги.
Набор таких тегов – это язык разметки. Наиболее известным и востребованным из них является XML, что расшифровывается как eXtensible Markup Language (расширяемый язык разметки).
Таким образом, можно сказать про xml формат, что это метаязык, на котором создаётся разметка данных, а также описание её языков.
Протокол XML помогает разработчикам наладить уникальную разметку, адаптировав её под конкретный проект или задачу. Благодаря таким возможностям его и называют расширенным.
Однако стоит помнить про расширение xml, что это не сам код, а язык описания данных. А чтобы с этими данными можно было работать, в том числе передавать, принимать или обрабатывать, необходимо писать сам код уже на языке программирования.
Используется XML для различных задач.
У XML есть 3 ключевых достоинства.
В HTML тоже хранятся данные в тегах. Но они отвечают за представление информации в структурированном виде, то есть можно настроить расположение заголовков, отступы абзацев и т.д. XML-теги на этом фоне более сложные, поскольку задают смысл информации. Поэтому HTML не может заменить XML. При этом XML-данные допустимо представлять в HTML-тегах.
Существуют и другие метаязыки. Но у них довольно узкая специализация, то есть они предназначены для конкретных задач.
Файл XML представляет собой текстовый документ, в котором присутствуют теги для описания структуры и других его функций. Теги пишут в угловых скобках, причём их всегда два – один открывает запись, другим она заканчивается.
<первый тег>
ставят перед элементом, для которого требуется разметка.
</второй тег>
— закрывает разметку и располагается после элемента.
Теги бывают вложенными. Это значит, что внутри одного тега находится другой. Например, они могут выглядеть так.
<message>
<warning>
Обязательно к изучению!
</warning>
</message>
В свою очередь, вложенные теги дополняют другие вложенности. Такая сложная структура называется «дерево тегов».
У тегов есть атрибуты, то есть уточняющие сведения. В данном примере для тега «PLAYER» атрибутами являются «TEAM», «TRAINER» и «RESULT».
Первой записью в документе XML часто указывают сведения о кодировке и версии XML. Называется она «prolog» и выглядит так.
<?xml version="3.0" encoding="UTF-8"?>
Кроме того, расширение XML помогает создать новую версия сайта, не переделывая предыдущую. Например, мы запустили интернет-магазин. Сначала продавали исключительно чай оптом, но позже решили расширять ассортимент и добавить раздел с кофе. С помощью тегов можно расширить существующую версию, не прописывая дочерние теги, как для первой версии сайта.
<data>
<owner first="CHAI" last="OPTOM"/>
</owner>
<name="KOFE" last="OPTOM"/>
</data>
Для различных задач в некоторых ситуациях может использоваться общий элемент, это называется пространство имен и префиксы.
# xmlns:<name>=<«uri»>
В данном случае «name» — имя элемента, а «uri» — URL, определяющий пространство имен.
Префиксы актуальны, если возник конфликт двух версий. Например, компания занимается продажей автомобилей, но в каталоге появились игрушечные модели. Чтобы отличать реальный транспорт от детских машинок, достаточно ввести два префикса «real» и «toy».
Однако, чтобы эти префиксы работали, им необходимо задать уникальное имя в namespace. Сделать это можно через URI, в том числе подставив ссылку на описание функций или назначение пространства имен.
Самый простой способ посмотреть информацию – открыть файл через браузер. Нажмите на него правой кнопкой мыши, затем плавно перейдите на «открыть» и выберете подходящий браузер.
Таблицы открываются через Excel. Запустите программу и нажмите сочетание клавиш «CTRL+O». Укажите путь к файлу, то есть папку на компьютере, в которой он расположен. Также можно просто перетащить файл из нужной папки, удерживая левую кнопку мыши.
Текстовый документ можно открыть с помощью любого программного продукта, поддерживающего XML-разрешение. Это может быть MS Word, блокнот и т.д.
Часто файлы находятся на сайте, скачивать их необязательно. Для их просмотра существуют специализированные сервисы, такие как codebeautify.org, XMLGrid и другие.
XML помогает делать в документах разметку, то есть структурировать его, делать удобным для восприятия. Это единственный универсальный формат, который подходит для разнообразных целей и задач. Кроме того, он доступен для многих типов устройств, совместим со множеством клиентских платформ и операционными системами. И хотя для создания тегов в XML-файлов необходима подготовка и минимальный набор профильных знаний, открыть и прочитать документы может любой человек.