Standalone yes xml что это
Что означает «автономная» директива в XML?
Что означает директива ‘ standalone ‘ в документе XML?
4 ответа
Другой вопрос, действительно ли это делает ваш синтаксический анализатор, но соответствующий стандартам проверяющий синтаксический анализатор (например, браузер) должен.
Обратите внимание: если вы не укажете DTD, то отдельное объявление «не имеет значения», поэтому нет причин использовать его, если вы также не укажете DTD.
Объявления разметки могут влиять на содержимое документа при передаче от процессора XML к приложению; примерами являются значения атрибутов по умолчанию и объявления сущностей. Объявление автономного документа, которое может появиться как компонент объявления XML, сигнализирует, существуют ли такие объявления, которые кажутся внешними по отношению к объекту документа или в объектах параметров. [Определение: объявление внешней разметки определяется как объявление разметки, встречающееся во внешнем подмножестве или в объекте параметра (внешнем или внутреннем, последний включается, потому что непроверяющие процессоры не обязаны их читать).]
Автономное объявление не имеет смысла, если документ не имеет внешнего DTD, а внутренний DTD не имеет ссылок на сущности параметров, поскольку эти документы уже неявно являются автономными.
При синтаксическом анализе документа, не объявленного как автономный, непроверяющий процессор может остановить синтаксический анализ внутреннего DTD, как только он обнаружит ссылку на объект параметра. Объявление документа автономным заставляет непроверяющие процессоры анализировать объявления разметки во внутреннем DTD даже после того, как они игнорируют одну или несколько ссылок на сущности параметров.
Заставляет проверяющие процессоры выдавать ошибку, если в документе обнаружено одно из следующего, и их соответствующие объявления находятся во внешнем DTD или в тексте замены объекта параметра:
Непроверяющий процессор может рассмотреть возможность получения внешнего DTD и расширения всех ссылок на сущности параметров для документов, которые не являются автономными, даже если он не обязан это делать, т.е. установка standalone=yes теоретически может улучшить производительность для неподтвержденных процессоры (предупреждение о спойлере: это, вероятно, не будет иметь значения).
Остальные ответы здесь либо неполные, либо неверные, главное заблуждение состоит в том, что
standalone = «yes» означает, что процессор XML должен использовать DTD только для проверки.
Напротив, объявление документа как автономного фактически заставит непроверяющий процессор анализировать внутренние объявления, которые он обычно должен игнорировать (то есть те, которые находятся после ссылки на объект игнорируемого параметра). Непроверяющие процессоры должны по-прежнему использовать информацию во внутреннем DTD для предоставления значений атрибутов по умолчанию и нормализации токенизированных атрибутов, поскольку это не зависит от проверки.
standalone описывает, зависит ли текущий XML-документ от объявления внешней разметки.
W3C описывает свою цель в «Расширяемом языке разметки (XML) 1.0 (пятое издание)»:
Что означает «автономная» директива в XML?
Что это ‘ standalone ‘директива означает в документе XML?
В качестве примера рассмотрим скромную тег. Если вы посмотрите на XHTML 1.0 DTD, вы увидите объявление разметки, сообщающее синтаксическому анализатору, что теги должны быть ПУСТЫМИ и иметь src а также alt атрибуты. Когда браузер просматривает документ XHTML 1.0 и находит тег, он должен заметить, что DTD требует src а также alt атрибуты и добавьте их, если их нет. Он также автоматически закроет тег, поскольку он должен быть ПУСТО. Это то, что спецификация XML подразумевает под словами «объявления разметки могут повлиять на содержимое документа». Затем вы можете использовать standalone объявление, указывающее синтаксическому анализатору игнорировать эти правила.
Другой вопрос, действительно ли это делает ваш синтаксический анализатор, но соответствующий стандартам проверяющий синтаксический анализатор (например, браузер) должен.
Обратите внимание: если вы не укажете DTD, то отдельное объявление «не имеет значения», поэтому нет причин использовать его, если вы также не укажете DTD.
Источник: автономный псевдоатрибут актуален, только если используется DTD.
standalone описывает, зависит ли текущий XML-документ от объявления внешней разметки.
W3C описывает свое назначение в «Extensible Markup Language (XML) 1.0 (пятое издание)»:
Объявления разметки могут влиять на содержимое документа при передаче от процессора XML к приложению; примерами являются значения атрибутов по умолчанию и объявления сущностей. Объявление автономного документа, которое может появиться как компонент объявления XML, сигнализирует, существуют ли такие объявления, которые кажутся внешними по отношению к объекту документа или в объектах параметров. [Определение: объявление внешней разметки определяется как объявление разметки, имеющееся во внешнем подмножестве или в объекте параметра (внешнем или внутреннем, последний включается, потому что непроверяющие процессоры не обязаны их читать).]
Намерение standalone=yes декларация призвана гарантировать, что информация внутри документа может быть достоверно извлечена только на основе внутреннего DTD, т.е. документ может быть «автономным» без внешних ссылок. Проверка автономного документа гарантирует, что непроверяющие процессоры будут иметь всю доступную информацию для правильного анализа документа.
Автономное объявление не имеет смысла, если документ не имеет внешнего DTD, а внутренний DTD не имеет ссылок на сущности параметров, поскольку эти документы уже неявно являются автономными.
При синтаксическом анализе документа, не объявленного как автономный, непроверяющий процессор может прекратить синтаксический анализ внутреннего DTD, как только он обнаружит ссылку на объект параметра. Объявление документа как автономного заставляет непроверяющие процессоры анализировать объявления разметки во внутреннем DTD даже после того, как они игнорируют одну или несколько ссылок на сущности параметров.
Заставляет проверяющие процессоры выдавать ошибку, если в документе обнаружено одно из следующего, и их соответствующие объявления находятся во внешнем DTD или в тексте замены объекта параметра:
Непроверяющий процессор может рассмотреть возможность получения внешнего DTD и расширения всех ссылок на сущности параметров для документов, которые не являются автономными, даже если он не обязан это делать, т.е. standalone=yes теоретически может улучшить производительность непроверяющих процессоров (предупреждение о спойлере: это, вероятно, не будет иметь значения).
Остальные ответы здесь либо неполные, либо неверные, главное заблуждение состоит в том, что
standalone = «yes» означает, что процессор XML должен использовать DTD только для проверки.
Напротив, объявление документа как автономного фактически заставит непроверяющий процессор анализировать внутренние объявления, которые он обычно должен игнорировать (то есть те, которые находятся после ссылки на объект игнорируемого параметра). Непроверяющие процессоры должны по-прежнему использовать информацию во внутреннем DTD для предоставления значений атрибутов по умолчанию и нормализации токенизированных атрибутов, поскольку это не зависит от проверки.
Что означает директива «standalone» в XML?
что значит ‘ standalone ‘ директива означает в XML-документе?
5 ответов
на standalone объявление-Это способ сказать парсеру игнорировать любые объявления разметки в DTD. После этого DTD используется только для проверки.
в качестве примера, рассмотрим скромный тег. Если вы посмотрите на В XHTML 1.0 ДТД, вы видите объявление разметки, сообщающее синтаксическому анализатору, что теги должны быть пустыми и обладают src и alt атрибуты. Когда браузер проходит через документ XHTML 1.0 и находит тег, он должен заметить, что DTD требует src и alt атрибуты и добавьте их, если они не присутствуют. Он также самостоятельно закроет тег, так как он должен быть пустым. Это спецификация XML означает, что » объявления разметки могут влиять на содержимое документа.»Тогда вы можете использовать standalone объявление, чтобы сообщить синтаксическому анализатору игнорировать эти правила.
действительно ли ваш парсер делает это, это другой вопрос, но совместимый со стандартами проверяющий парсер (например, браузер) должен.
обратите внимание, что если вы не указываете DTD, то автономное объявление «не имеет значения», поэтому нет причин использовать его, если вы также не укажете DTD.
standalone описывает, зависит ли текущий XML-документ от объявления внешней разметки.
W3C описывает свое назначение в » расширяемом языке разметки (XML) 1.0 (пятое издание)»:
объявления разметки могут повлиять на содержание документа, как передано от процессора XML к применение; примеры атрибут значения по умолчанию и объявления сущностей. Этот автономное объявление документа, которое может появиться в качестве компонента в XML объявление, сигналы ли или не есть такие заявления, которые появляются внешние сущности документа или в объектах параметров. [Определение: Объявление внешней разметки определенными в качестве разметки декларация происходящие во внешнем подмножестве или в объект параметра (внешний или внутреннее, последнее будучи включенным поскольку недопустимые процессоры не обязательно их читать).]
намерение standalone=yes декларация должна гарантировать, что информация внутри документа может быть точно восстановлена только на основе внутреннего DTD, т. е. документ может «стоять отдельно» без внешних ссылок. Проверка автономного документа гарантирует, что не проверяющие процессоры будут иметь всю информацию, доступную для правильного анализа документа.
автономное объявление не служит никакой цели если документ не имеет никакое внешнее DTD, и внутреннее DTD не имеет ссылок на сущности параметров, поскольку эти документы уже неявно автономны.
при разборе документа, не объявленного как автономный, не-проверяющий процессор может прекратить разбор внутреннего DTD, как только он встречает ссылку на объект параметра. Объявление документа как автономного заставляет не проверяющие процессоры анализировать объявления разметки во внутреннем DTD даже после того, как они игнорируют один или несколько объектов параметров ссылки на литературу.
заставляет проверяющие процессоры выдавать ошибку, если в документе найдено любое из следующего, и их соответствующие объявления находятся во внешнем DTD или в тексте замены сущности параметра:
недопустимый процессор может рассмотреть возможность извлечения внешнего DTD и расширения всех ссылок на сущности параметров для документов, которые не являются автономными, даже если он не обязан это делать, т. е. установка standalone=yes теоретически может улучшить производительность недопустимые процессоры (предупреждение спойлера: это, вероятно, не будет иметь значения).
другие ответы здесь либо неполные, либо неправильные, основное заблуждение заключается в том, что
автономное объявление-Это способ сказать синтаксическому анализатору игнорировать любые объявления разметки в DTD. После этого DTD используется только для проверки.
standalone= » yes » означает, что XML-процессор должен использовать DTD для только проверка.
совсем наоборот, объявление документа как автономного фактически заставит недействительный процессор анализировать внутренние объявления, которые он должен обычно игнорировать (т. е. после ссылки на объект игнорируемого параметра). Не проверяющие процессоры должны по-прежнему использовать информацию во внутреннем DTD для предоставления значений атрибутов по умолчанию и нормализации маркированных атрибутов, поскольку это не зависит от проверки.
Что такое XML
Если вы тестируете API, то должны знать про два основных формата передачи данных:
XML, в переводе с англ eXtensible Markup Language — расширяемый язык разметки. Используется для хранения и передачи данных. Так что увидеть его можно не только в API, но и в коде.
Этот формат рекомендован Консорциумом Всемирной паутины (W3C), поэтому он часто используется для передачи данных по API. В SOAP API это вообще единственно возможный формат входных и выходных данных!
См также:
Что такое API — общее знакомство с API
Что такое JSON — второй популярный формат
Введение в SOAP и REST: что это и с чем едят — видео про разницу между SOAP и REST.
Так что давайте разберемся, как он выглядит, как его читать, и как ломать! Да-да, а куда же без этого? Надо ведь выяснить, как отреагирует система на кривой формат присланных данных.
Содержание
Как устроен XML
Возьмем пример из документации подсказок Дадаты по ФИО:
И разберемся, что означает эта запись.
В XML каждый элемент должен быть заключен в теги. Тег — это некий текст, обернутый в угловые скобки:
Текст внутри угловых скобок — название тега.
Тега всегда два:
Ой, ну ладно, подловили! Не всегда. Бывают еще пустые элементы, у них один тег и открывающий, и закрывающий одновременно. Но об этом чуть позже!
С помощью тегов мы показываем системе «вот тут начинается элемент, а вот тут заканчивается». Это как дорожные знаки:
— На въезде в город написано его название: Москва
— На выезде написано то же самое название, но перечеркнутое: Москва*
* Пример с дорожными знаками я когда-то давно прочитала в статье Яндекса, только ссылку уже не помню. А пример отличный!
Корневой элемент
В любом XML-документе есть корневой элемент. Это тег, с которого документ начинается, и которым заканчивается. В случае REST API документ — это запрос, который отправляет система. Или ответ, который она получает.
Чтобы обозначить этот запрос, нам нужен корневой элемент. В подсказках корневой элемент — «req».
Он мог бы называться по другому:
Да как угодно. Он показывает начало и конец нашего запроса, не более того. А вот внутри уже идет тело документа — сам запрос. Те параметры, которые мы передаем внешней системе. Разумеется, они тоже будут в тегах, но уже в обычных, а не корневых.
Значение элемента
Значение элемента хранится между открывающим и закрывающим тегами. Это может быть число, строка, или даже вложенные теги!
Вот у нас есть тег «query». Он обозначает запрос, который мы отправляем в подсказки.
Внутри — значение запроса.
Это как если бы мы вбили строку «Виктор Иван» в GUI (графическом интерфейсе пользователя):
Пользователю лишняя обвязка не нужна, ему нужна красивая формочка. А вот системе надо как-то передать, что «пользователь ввел именно это». Как показать ей, где начинается и заканчивается переданное значение? Для этого и используются теги.
Система видит тег «query» и понимает, что внутри него «строка, по которой нужно вернуть подсказки».
Параметр count = 7 обозначает, сколько подсказок вернуть в ответе. Если тыкать подсказки на демо-форме Дадаты, нам вернется 7 подсказок. Это потому, что туда вшито как раз значение count = 7. А вот если обратиться к документации метода, count можно выбрать от 1 до 20.
Откройте консоль разработчика через f12, вкладку Network, и посмотрите, какой запрос отправляется на сервер. Там будет значение count = 7.
Атрибуты элемента
У элемента могут быть атрибуты — один или несколько. Их мы указываем внутри отрывающегося тега после названия тега через пробел в виде
Зачем это нужно? Из атрибутов принимающая API-запрос система понимает, что такое ей вообще пришло.
Например, мы делаем поиск по системе, ищем клиентов с именем Олег. Отправляем простой запрос:
А в ответ получаем целую пачку Олегов! С разными датами рождения, номерами телефонов и другими данными. Допустим, что один из результатов поиска выглядит так:
Давайте разберем эту запись. У нас есть основной элемент party.
У него есть 3 атрибута:
Внутри party есть элементы field.
У элементов field есть атрибут name. Значение атрибута — название поля: имя, дата рождения, тип или номер телефона. Так мы понимаем, что скрывается под конкретным field.
Это удобно с точки зрения поддержки, когда у вас коробочный продукт и 10+ заказчиков. У каждого заказчика будет свой набор полей: у кого-то в системе есть ИНН, у кого-то нету, одному важна дата рождения, другому нет, и т.д.
Но, несмотря на разницу моделей, у всех заказчиков будет одна XSD-схема (которая описывает запрос и ответ):
— есть элемент party;
— у него есть элементы field;
— у каждого элемента field есть атрибут name, в котором хранится название поля.
А вот конкретные названия полей уже можно не описывать в XSD. Их уже «смотрите в ТЗ». Конечно, когда заказчик один или вы делаете ПО для себя или «вообще для всех», удобнее использовать именованные поля — то есть «говорящие» теги. Какие плюшки у этого подхода:
— При чтении XSD сразу видны реальные поля. ТЗ может устареть, а код будет актуален.
— Запрос легко дернуть вручную в SOAP Ui — он сразу создаст все нужные поля, нужно только значениями заполнить. Это удобно тестировщику + заказчик иногда так тестирует, ему тоже хорошо.
В общем, любой подход имеет право на существование. Надо смотреть по проекту, что будет удобнее именно вам. У меня в примере неговорящие названия элементов — все как один будут field. А вот по атрибутам уже можно понять, что это такое.
Помимо элементов field в party есть элемент attribute. Не путайте xml-нотацию и бизнес-прочтение:
У элемента attribute есть атрибуты:
Такая вот XML-ка получилась. Причем упрощенная. В реальных системах, где хранятся физ лица, данных сильно больше: штук 20 полей самого физ лица, несколько адресов, телефонов, емейл-адресов…
Но прочитать даже огромную XML не составит труда, если вы знаете, что где. И если она отформатирована — вложенные элементы сдвинуты вправо, остальные на одном уровне. Без форматирования будет тяжеловато…
А так всё просто — у нас есть элементы, заключенные в теги. Внутри тегов — название элемента. Если после названия идет что-то через пробел: это атрибуты элемента.
XML пролог
Иногда вверху XML документа можно увидеть что-то похожее:
Эта строка называется XML прологом. Она показывает версию XML, который используется в документе, а также кодировку. Пролог необязателен, если его нет — это ок. Но если он есть, то это должна быть первая строка XML документа.
UTF-8 — кодировка XML документов по умолчанию.
XSD-схема
XSD (XML Schema Definition) — это описание вашего XML. Как он должен выглядеть, что в нем должно быть? Это ТЗ, написанное на языке машины — ведь схему мы пишем… Тоже в формате XML! Получается XML, который описывает другой XML.
Фишка в том, что проверку по схеме можно делегировать машине. И разработчику даже не надо расписывать каждую проверку. Достаточно сказать «вот схема, проверяй по ней».
Если мы создаем SOAP-метод, то указываем в схеме:
Поэтому зачем запускать сложную процедуру, если запрос заведом «плохой»? И выдавать ошибку через 5 минут, а не сразу? Валидация по схеме помогает быстро отсеять явно невалидные запросы, не нагружая систему.
Более того, похожую защиту ставят и некоторые программы-клиенты для отправки запросов. Например, SOAP Ui умеет проверять ваш запрос на well formed xml, и он просто не отправит его на сервер, если вы облажались. Экономит время на передачу данных, молодец!
А простому пользователю вашего SOAP API схема помогает понять, как составить запрос. Кто такой «простой пользователь»?
Итого, как используется схема при разработке SOAP API:
Правильный запрос | Неправильный запрос |
---|---|
Нет обязательного поля name | |
Опечатка в названии тега (mail вместо email) | |
. | . |
Попробуем написать для него схему. В запросе должны быть 3 элемента (email, name, password) с типом «string» (строка). Пишем:
А в WSDl сервиса она записана еще проще:
Конечно, в схеме могут быть не только строковые элементы. Это могут быть числа, даты, boolean-значения и даже какие-то свои типы:
А еще в схеме можно ссылаться на другую схему, что упрощает написание кода — можно переиспользовать схемы для разных задач.
Практика: составляем свой запрос
Ок, теперь мы знаем, как «прочитать» запрос для API-метода в формате XML. Но как его составить по ТЗ? Давайте попробуем. Смотрим в документацию. И вот почему я даю пример из Дадаты — там классная документация!
Что, если я хочу, чтобы мне вернуть только женские ФИО, начинающиеся на «Ан»? Берем наш исходный пример:
В первую очередь меняем сам запрос. Теперь это уже не «Виктор Иван», а «Ан»:
Далее смотрим в ТЗ. Как вернуть только женские подсказки? Есть специальный параметр — gender. Название параметра — это название тегов. А внутри уже ставим пол. «Женский» по английски будет FEMALE, в документации также. Итого получили:
Ненужное можно удалить. Если нас не волнует количество подсказок, параметр count выкидываем. Ведь, согласно документации, он необязательный. Получили запрос:
Вот и все! Взяли за основу пример, поменяли одно значение, один параметр добавили, один удалили. Не так уж и сложно. Особенно, когда есть подробное ТЗ и пример )))
Попробуй сам!
Напишите запрос для метода MagicSearch в Users. Мы хотим найти всех Ивановых по полному совпадению, на которых висят актуальные задачи.
Well Formed XML
Разработчик сам решает, какой XML будет считаться правильным, а какой нет. Но есть общие правила, которые нельзя нарушать. XML должен быть well formed, то есть синтаксически корректный.
Чтобы проверить XML на синтаксис, можно использовать любой XML Validator (так и гуглите). Я рекомендую сайт w3schools. Там есть сам валидатор + описание типичных ошибок с примерами.
В готовый валидатор вы просто вставляете свой XML (например, запрос для сервера) и смотрите, всё ли с ним хорошо. Но можете проверить его и сами. Пройдитесь по правилам синтаксиса и посмотрите, следует ли им ваш запрос.
Правила well formed XML:
Давайте пройдемся по каждому правилу и обсудим, как нам применять их в тестировании. То есть как правильно «ломать» запрос, проверяя его на well-formed xml. Зачем это нужно? Посмотреть на фидбек от системы. Сможете ли вы по тексту ошибки понять, где именно облажались?
1. Есть корневой элемент
Нельзя просто положить рядышком 2 XML и полагать, что «система сама разберется, что это два запроса, а не один». Не разберется. Потому что не должна.
И если у вас будет лежать несколько тегов подряд без общего родителя — это плохой xml, не well formed. Всегда должен быть корневой элемент:
Нет | Да |
---|---|
Есть элементы «test» и «dev», но они расположены рядом, а корневого, внутри которого все лежит — нету. Это скорее похоже на 2 XML документа | А вот тут уже есть элемент credential, который является корневым |
Что мы делаем для тестирования этого условия? Правильно, удаляем из нашего запроса корневые теги!
2. У каждого элемента есть закрывающийся тег
Тут все просто — если тег где-то открылся, он должен где-то закрыться. Хотите сломать? Удалите закрывающийся тег любого элемента.
Но тут стоит заметить, что тег может быть один. Если элемент пустой, мы можем обойтись одним тегом, закрыв его в конце:
Это тоже самое, что передать в нем пустое значение
Аналогично сервер может вернуть нам пустое значение тега. Можно попробовать послать пустые поля в Users в методе FullUpdateUser. И в запросе это допустимо (я отправила пустым поле name1), и в ответе SOAP Ui нам именно так и отрисовывает пустые поля.
Итого — если есть открывающийся тег, должен быть закрывающийся. Либо это будет один тег со слешом в конце.
Для тестирования удаляем в запросе любой закрывающийся тег.
3. Теги регистрозависимы
Как написали открывающий — также пишем и закрывающий. ТОЧНО ТАК ЖЕ! А не так, как захотелось.
А вот для тестирования меняем регистр одной из частей. Такой XML будет невалидным
4. Правильная вложенность элементов
Элементы могут идти друг за другом
Один элемент может быть вложен в другой
Но накладываться друг на друга элементы НЕ могут!
5. Атрибуты оформлены в кавычках
Даже если вы считаете атрибут числом, он будет в кавычках:
Для тестирования пробуем передать его без кавычек:
Итого
XML (eXtensible Markup Language) используется для хранения и передачи данных.
Передача данных — это запросы и ответы в API-методах. Если вы отправляете SOAP-запрос, вы априори работаете именно с этим форматом. Потому что SOAP передает данные только в XML. Если вы используете REST, то там возможны варианты — или XML, или JSON.
Хранение данных — это когда XML встречается внутри кода. Его легко понимает как машина, так и человек. В формате XML можно описывать какие-то правила, которые будут применяться к данным, или что-то еще.
Вот пример использования XML в коде open-source проекта folks. Я не знаю, что именно делает JacksonJsonProvider, но могу «прочитать» этот код — есть функционал, который мы будем использовать (featuresToEnable), и есть тот, что нам не нужен(featuresToDisable).
Формат XML подчиняется стандартам. Синтаксически некорректный запрос даже на сервер не уйдет, его еще клиент порежет. Сначала проверка на well formed, потом уже бизнес-логика.
Правила well formed XML:
Если вы тестировщик, то при тестировании запросов в формате XML обязательно попробуйте нарушить каждое правило! Да, система должна уметь обрабатывать такие ошибки и возвращать адекватное сообщение об ошибке. Но далеко не всегда она это делает.
А если система публичная и возвращает пустой ответ на некорректный запрос — это плохо. Потому что разработчик другой системы налажает в запросе, а по пустому ответу даже не поймет, где именно. И будет приставать к поддержке: «Что же у меня не так?», кидая информацию по кусочкам и в виде скринов исходного кода. Оно вам надо? Нет? Тогда убедитесь, что система выдает понятное сообщение об ошибке!
Что такое JSON — второй популярный формат
PS — больше полезных статей ищите в моем блоге по метке «полезное». А полезные видео — на моем youtube-канале