Xml cdata что это

Что означает в XML?

Я часто нахожу этот странный CDATA тег в XML файлах:

Я заметил, что этот CDATA тег всегда появляется в начале, а затем сопровождается некоторыми вещами.

CDATA означает Символьные данные, и это означает, что данные между этими строками включают в себя данные, которые могут быть интерпретированы как разметка XML, но не должны.

Основные различия между CDATA и комментариями:

Это означает, что эти четыре фрагмента XML из одного правильно сформированного документа:

Синтаксически, он ведет себя подобно комментарию:

. но это все еще часть документа:

Этот код манипулирования DOM будет либо генерировать исключение (в Firefox), либо приводить к плохо структурированному XML-документу: http://jsfiddle.net/9NNHA/

Один большой пример использования: ваш xml включает программу в качестве данных (например, учебник по веб-страницам для Java). В этой ситуации ваши данные включают в себя большой набор символов, которые включают «&» и « — не-только-йети
источник

Мне когда-то приходилось использовать CDATA, когда мой элемент xml требовал хранения HTML-кода. Что-то вроде

Таким образом, CDATA означает, что он будет игнорировать любой символ, который в противном случае может быть интерпретирован как тег XML, такой как и т. Д.

Содержащиеся в нем данные не будут анализироваться как XML, и поэтому не обязательно должны быть действительными XML или могут содержать элементы, которые могут выглядеть как XML, но не являются таковыми.

Таким образом: текст внутри CDATA воспринимается синтаксическим анализатором, но только как символы, а не как узлы XML.

В качестве другого примера его использования:

Если у вас есть RSS-канал (XML-документ) и вы хотите включить некоторую базовую кодировку HTML в отображение описания, вы можете использовать CData для его кодирования:

RSS Reader извлекает описание и отображает HTML-код в CDATA.

И как объяснение того, почему в этом примере используются CData (а не соответствующие теги pubData и dc: creator): это для отображения веб-сайта с использованием виджета RSS, для которого у нас нет реального элемента управления форматированием.

Это позволяет нам указать высоту и положение включенного изображения, правильно отформатировать имена и дату автора и т. Д. Без необходимости создания нового виджета. Это также означает, что я могу написать это и не добавлять их вручную.

CDATA расшифровывается как Character Data. Вы можете использовать это для экранирования некоторых символов, которые в противном случае будут рассматриваться как обычный XML. Данные внутри этого не будут проанализированы. Например, если вы хотите передать URL-адрес, содержащийся & в нем, вы можете использовать CDATA для этого. В противном случае вы получите ошибку, поскольку она будет проанализирована как обычный XML.

Он используется для хранения данных, которые в противном случае могут рассматриваться как xml, поскольку содержат определенные символы.

Таким образом, данные внутри будут отображаться, но не интерпретироваться.

Источник

Литеральное представление XML-раздела CDATA (Visual Basic)

Литерал, представляющий XCData объект.

Синтаксис

Компоненты

Обязательный элемент. Обозначает начало раздела XML CDATA.

content
Обязательный элемент. Текстовое содержимое, отображаемое в разделе CDATA XML.

]]>
Обязательный элемент. Обозначает конец раздела.

Возвращаемое значение

Комментарии

Разделы XML CDATA содержат необработанный текст, который должен быть добавлен, но не проанализирован, с XML-кодом, содержащим его. Раздел CDATA XML может содержать любой текст. Сюда входят зарезервированные символы XML. Раздел CDATA XML заканчивается последовательностью «]] >». Это подразумевает следующие моменты:

Нельзя использовать внедренное выражение в XML-литерале CDATA, так как разделители внедренных выражений являются допустимыми содержимым XML CDATA.

Разделы CDATA XML не могут быть вложенными, поскольку content не могут содержать значение «]] >».

Можно назначить литерал XML CDATA переменной или включить его в литерал XML-элемента.

XML-литерал может охватывать несколько строк, но не использует символы продолжения строки. это позволяет копировать содержимое из XML-документа и вставлять его непосредственно в Visual Basic программу.

компилятор Visual Basic преобразует литерал CDATA XML в вызов XCData конструктора.

Пример

В следующем примере создается раздел CDATA, содержащий текст «может содержать литеральные теги».

Источник

Что означает в XML?

Я часто нахожу этот странный тег CDATA в файлах XML :

Я заметил, что этот тег CDATA всегда приходит в начале, а затем сопровождается некоторыми вещами.

ОТВЕТЫ

Ответ 1

CDATA означает Персональные данные, и это означает, что данные между этими строками включают данные, которые могут быть интерпретированы как разметка XML, но не должны быть.

Ключевыми отличиями между CDATA и комментариями являются:

Это означает, что эти три фрагмента XML из одного хорошо сформированного документа:

Ответ 2

Синтаксически он ведет себя аналогично комментарию:

. но он все еще является частью документа:

Этот код манипуляции DOM либо генерирует исключение (в Firefox), либо приводит к плохо структурированному XML-документу: http://jsfiddle.net/9NNHA/

Ответ 3

Один большой случай использования: ваш xml включает в себя программу в качестве данных (например, учебник для веб-страниц для Java). В этой ситуации ваши данные содержат большой кусок символов, которые включают «&» и ‘

Ответ 4

Мне когда-то пришлось использовать CDATA, когда мой XML-тег должен был хранить HTML-код. Что-то вроде

Таким образом, CDATA означает, что он игнорирует любой символ, который в противном случае можно было бы интерпретировать как XML-тэг типа и т.д.

Ответ 5

Данные, содержащиеся в нем, не будут анализироваться как XML и, следовательно, не должны быть действительными XML или могут содержать элементы, которые могут казаться XML, но не являются.

Ответ 6

[В] документе XML или внешнем анализируемом объекте, раздел CDATA является раздел содержимого элемента, который помечен для интерпретатора для интерпретации как только символьные данные, а не разметка.

Таким образом: текст внутри CDATA рассматривается синтаксическим анализатором, но только как символы не как узлы XML.

Ответ 7

CDATA обозначает символы. Вы можете использовать это, чтобы избежать некоторых символов, которые иначе будут обрабатываться как обычный XML. Данные внутри этого не будут анализироваться. Например, если вы хотите передать URL-адрес, содержащий & в нем, вы можете использовать CDATA для этого. В противном случае вы получите сообщение об ошибке, поскольку оно будет проанализировано как обычный XML.

Ответ 8

В качестве другого примера использования.

Если у вас есть RSS-канал (XML-документ) и вы хотите включить некоторые основные HTML-кодировки в отображение описания, вы можете использовать CData для его кодирования:

RSS Reader извлекает описание и отображает HTML внутри CDATA.

Примечание. Не все HTML-теги работают. Я думаю, что это зависит от используемого вами читателя RSS.

И как объяснение того, почему в этом примере используются CData (а не соответствующие теги pubData и dc: creator). это для отображения веб-сайта с использованием виджета RSS, для которого у нас нет реального управления форматированием.

Это позволяет нам указать высоту и положение включенного изображения, правильно отформатировать имена и дату автора и т.д., без необходимости в новом виджете. Это также означает, что я могу использовать script и не добавлять их вручную.

Ответ 9

Он содержал данные, которые иначе можно было бы рассматривать как xml, поскольку они содержат определенные символы.

Таким образом, данные внутри будут отображаться, но не интерпретироваться.

Ответ 10

Обычно используется для встраивания пользовательских данных, например изображений или звуковых данных в документ XML.

Ответ 11

Источник

СОДЕРЖАНИЕ

Разделы CDATA в XML

Синтаксис и интерпретация

Раздел CDATA начинается со следующей последовательности:

и заканчивается следующим появлением последовательности:

Все символы, заключенные между этими двумя последовательностями, интерпретируются как символы, а не как разметка или ссылки на объекты. Каждый символ воспринимается буквально, за исключением ]]> последовательности символов. В:

начальный и конечный теги «отправитель» интерпретируются как разметка. Однако код:

Таким образом, «теги» будут иметь тот же статус, что и «Джон Смит»; они будут рассматриваться как текст.

Точно так же, если числовая ссылка на символ ð появляется в содержимом элемента, она будет интерпретироваться как единственный символ Unicode 00F0 (строчная буква eth ). Но если то же самое появляется в разделе CDATA, он будет проанализирован как шесть символов: амперсанд, решетка, цифра 2, цифра 4, цифра 0, точка с запятой.

Использование разделов CDATA

Гнездование

Это означает, что для кодирования » ]]> » в середине раздела CDATA замените все вхождения » ]]> » следующим:

Это эффективно останавливает и перезапускает раздел CDATA.

Проблемы с кодировкой

Другая проблема заключается в том, что XML- документ можно перекодировать из одной кодировки в другую во время транспортировки. Когда XML- документ преобразуется в более ограниченный набор символов, такой как ASCII, символы, которые больше не могут быть представлены, преобразуются в &#nnn; ссылки на символы для преобразования без потерь. Но в разделе CDATA эти символы вообще не могут быть представлены, и их необходимо удалить или преобразовать в какой-либо эквивалент, изменяя содержимое раздела CDATA.

Использование CDATA в выводе программы

Источник

Информационные технологии, интернет, веб программирование, IT, Hi-Tech, …

CDATA

Здравствуйте, уважаемые посетители сайта okITgo.ru! Настоящая статья посвящена XML парсингу (разбору) и тому, как добавить в документ информацию, которую парсер разбирать не должен.

Весь текст в XML документе будет разобран парсером.

Но текст внутри секции CDATA парсер проигнорирует.

PCDATA – Разбираемые Символьные Данные

XML парсеры обычно разбирают весь текст в XML документе.

Когда XML элемент разбирается, текст между XML тегами также подвергается разбору (парсингу):

Этот текст также разбирается

Парсер поступает так, поскольку XML элементы могут содержать другие элементы, как в этом примере, где элемент содержит два других элемента (first и last):

и парсер разобьет его на подэлементы, примерно так:

Разбираемые Символьные Данные (Parsed Character Data или PCDATA) – это термин, используемый для текстовых данных, которые будут разобраны XML парсером.

CDATA – (Неразбираемые) Символьные Данные

Термин CDATA (Character Data – Символьные Данные) используется для обозначения текстовых данных, которые XML парсер не должен разбирать.

В примере выше все, что находится внутри секции CDATA, будет проигнорировано xml парсером.

Замечания по секциям CDATA:

Секция CDATA не может содержать строку «]]>». Вложенные секции CDATA не допустимы.

Последовательность символов «]]>», которая обозначает конец секции CDATA, не может содержать пробелов и переносов строки.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *