Атрибут XML против элемента XML

Question

Атрибут XML против элемента XML

209

На работе нас просят создать файлы XML для передачи данных в другое автономное приложение, которое затем создаст второй XML файл для возврата, чтобы обновить некоторые наши данные. Во время процесса мы обсуждали с командой другого приложения структуру XML файла.

Образец, с которым я столкнулся, по существу выглядит примерно так:

<INVENTORY>
   <ITEM serialNumber="something" location="something" barcode="something">
      <TYPE modelNumber="something" vendor="something"/> 
   </ITEM>
</INVENTORY>

Другая команда заявила, что это не отраслевой стандарт, и что атрибуты должны использоваться только для метаданных. Они предложили:

<INVENTORY>
   <ITEM>
      <SERIALNUMBER>something</SERIALNUMBER>
      <LOCATION>something</LOCATION>
      <BARCODE>something</BARCODE>
      <TYPE>
         <MODELNUMBER>something</MODELNUMBER>
         <VENDOR>something</VENDOR>
      </TYPE>
   </ITEM>
</INVENTORY>

Причина, по которой я предположил, что первый заключается в том, что размер создаваемого файла намного меньше. Будет около 80000 элементов, которые будут в файле во время передачи. На самом деле предложение действительно в три раза больше, чем я предложил. Я искал загадочный "отраслевой стандарт", который был упомянут, но ближайший, который я мог найти, - это атрибуты XML, которые должны использоваться только для метаданных, но сказал, что дискуссия о том, что было фактически метаданными.

После долгого объяснения (извините), как вы определяете, что такое метаданные, и при разработке структуры документа XML, как вы должны решить, когда использовать атрибут или элемент?

Jacob Schoen 29 авг. 2008, в 00:16

Источник

3

Я нашел этот действительно хороший ресурс: ibm.com/developerworks/xml/library/x-eleatt.html
Laurens Holst 27 сен. 2010, в 10:59
5

+1 за "... спор был о том, что на самом деле было метаданными".
Withheld 24 июль 2013, в 14:00
0

Обратите внимание на имена тегов в нижнем регистре с дефисами: stackoverflow.com/questions/1074447/…
Ben 08 март 2015, в 17:04

Показать ещё 1 комментарий

Теги:

xml

xsd

20 ответов

38

Некоторые из проблем с атрибутами:

атрибуты не могут содержать несколько значений (дочерние элементы могут)
атрибуты не просто расширяемы (для будущих изменений)
атрибуты не могут описывать структуры (дочерние элементы могут)
атрибуты сложнее манипулировать программным кодом Значения атрибутов
нелегко протестировать против DTD

Если вы используете атрибуты в качестве контейнеров для данных, вы получаете документы, которые трудно читать и поддерживать. Попытайтесь использовать элементы для описания данных. Используйте атрибуты только для предоставления информации, не относящейся к данным.

Не заканчивайте так (это не то, как следует использовать XML):

<note day="12" month="11" year="2002" 
      to="Tove" from="Jani" heading="Reminder"  
      body="Don't forget me this weekend!"> 
</note>

Источник: http://www.w3schools.com/xml/xml_dtd_el_vs_attr.asp

user44350 07 янв. 2009, в 14:48

2

Первый пункт неверен, см .: w3.org/TR/xmlschema-2/#derivation-by-list
porges 27 июнь 2010, в 23:31
6

Я бы сказал, что первый пункт верен, а list - это частичное решение этой проблемы. Не может быть нескольких атрибутов с одним и тем же именем. Атрибут list прежнему имеет только одно значение, которое представляет собой список некоторых типов данных, разделенных пробелами. Разделительные символы являются фиксированными, поэтому вы не можете иметь несколько значений, если одно значение требуемого типа данных может содержать пробелы. Это исключает возможность наличия, например, нескольких адресов в одном атрибуте «адрес».
jasso 05 сен. 2010, в 01:49
7

«Атрибуты труднее манипулировать программным кодом» - не могу согласиться с этим. На самом деле я обнаружил, что все наоборот. Это не достаточно разницы, чтобы действительно заявить в любом случае.
Paul Alexander 08 март 2012, в 23:19
4

Я также добавил бы, что проверка на соответствие DTD больше не актуальна, с XML-Schema, Schematron и Relax, et. и др. все они предоставляют значительно более мощные, а в некоторых случаях более интуитивно понятные способы проверки документов XML. Кроме того, W3Schools действительно плохой ориентир для всего
user764357 16 май 2013, в 01:34

Показать ещё 2 комментария

29

"XML" означает "расширяемый язык разметки". Язык разметки подразумевает, что данные представляют собой текст, помеченный метаданными о структуре или форматировании.

XHTML - пример XML, используемый так, как он был предназначен:

<p><span lang="es">El Jefe</span> insists that you
    <em class="urgent">MUST</em> complete your project by Friday.</p>

Здесь различается различие между элементами и атрибутами. Текстовые элементы отображаются в браузере, а атрибуты - инструкции о том, как их отображать (хотя есть несколько тегов, которые не работают таким образом).

Путаница возникает, когда XML используется не как язык разметки, а как язык сериализации данных, в котором различие между "данными" и "метаданными" более неопределенно. Таким образом, выбор между элементами и атрибутами более или менее произволен, за исключением вещей, которые не могут быть представлены атрибутами (см. Ответ feenster).

dan04 24 июнь 2010, в 05:16

25

XML Element vs XML Attribute

XML - это соглашение. Сначала отложите все существующие схемы XML или установленные соглашения в рамках вашего сообщества или отрасли.

Если вы действительно в ситуации, чтобы определить свою схему с нуля, вот некоторые общие соображения, которые должны сообщать о выборе элемента vs:

<versus>
  <element attribute="Meta content">
    Content
  </element>
  <element attribute="Flat">
    <parent>
      <child>Hierarchical</child>
    </parent>
  </element>
  <element attribute="Unordered">
    <ol>
      <li>Has</li>
      <li>order</li>
    </ol>
  </element>
  <element attribute="Must copy to reuse">
    Can reference to re-use
  </element>
  <element attribute="For software">
    For humans
  </element>
  <element attribute="Extreme use leads to micro-parsing">
    Extreme use leads to document bloat
  </element>
  <element attribute="Unique names">
    Unique or non-unique names
  </element>
  <element attribute="SAX parse: read first">
    SAX parse: read later
  </element>
  <element attribute="DTD: default value">
    DTD: no default value
  </element>
</versus>

kjhughes 17 апр. 2014, в 14:18

19

Это может зависеть от вашего использования. XML, который используется для представления данных, созданных из базы данных, может хорошо работать, и в конечном итоге значения полей помещаются как атрибуты.

Однако XML, используемый в качестве транспорта сообщений, часто лучше использовать большее количество элементов.

Например, скажем, что у нас был этот XML, как предлагается в ответе: -

<INVENTORY>
   <ITEM serialNumber="something" barcode="something">
      <Location>XYX</LOCATION>
      <TYPE modelNumber="something">
         <VENDOR>YYZ</VENDOR>
      </TYPE>
    </ITEM>
</INVENTORY>

Теперь мы хотим отправить элемент ITEM на устройство для печати штрих-кода, однако есть выбор типов кодирования. Как мы представляем требуемый тип кодирования? Неожиданно мы несколько с опозданием понимаем, что штрих-код не является одним автоматическим значением, а скорее может быть квалифицирован с кодировкой, требуемой при печати.

   <ITEM serialNumber="something">
      <barcode encoding="Code39">something</barcode>
      <Location>XYX</LOCATION>
      <TYPE modelNumber="something">
         <VENDOR>YYZ</VENDOR>
      </TYPE>
   </ITEM>

Дело в том, что если вы не строите какой-либо XSD или DTD вместе с пространством имен, чтобы исправить структуру в камне, вам может быть лучше всего оставить свои варианты открытыми.

IMO XML наиболее полезен, когда его можно сгибать, не нарушая при этом существующий код.

AnthonyWJones 30 сен. 2008, в 11:49

0

Хорошая мысль о «штрих-коде», я поторопился со своим примером и определенно разбил бы его на собственный элемент. Также хороший момент на XSD / DTD.
Chuck 23 фев. 2009, в 21:26

9

В моей схеме я использую следующие рекомендации в отношении атрибутов и элементов:

Использовать элементы для длинного текста (обычно это строки или normalizedString)
Не используйте атрибут, если есть группировка из двух значений (например, eventStartDate и eventEndDate) для элемента. В предыдущем примере, должен быть новый элемент для "события", который может содержать startDate и endDate.
Дата, дата и время (например, подсчеты, сумма и ставка) должны быть элементы.
Элементы, не относящиеся к бизнес-периодам, такие как последнее обновление, атрибуты.
Некоммерческие номера, такие как хэш-коды и индексы, должны быть атрибутами. * Используйте элементы, если тип будет сложным.
Использовать атрибуты, если значение является простым типом и не повторяется.
xml: id и xml: lang должны быть атрибутами, ссылающимися на схему XML
При необходимости технически возможны атрибуты.

Предпочтение атрибутов заключается в следующем:

уникальный (атрибут не может появляться несколько раз)
порядок не имеет значения
вышеуказанные свойства наследуются (это то, что "все" модель содержимого не поддерживает на текущем языке схемы)
бонус - они менее подробные и используют меньшую пропускную способность, но это не является основанием для предпочтения атрибутов над элементами.

Я добавил, когда технически возможно, потому что бывают случаи, когда использование атрибутов невозможно. Например, выбор набора атрибутов. Например использование (startDate и endDate) xor (startTS и endTS) невозможно с текущим языком схемы

Если XML Schema начинает разрешать ограниченную или расширенную модель контента "все", я бы, вероятно, сбросил ее

Archimedes Trajano 16 дек. 2010, в 07:54

7

Нет универсального ответа на этот вопрос (я активно участвовал в создании спецификации W3C). XML может использоваться для многих целей - текстовые документы, данные и декларативный код являются тремя наиболее распространенными. Я также использую его как модель данных. Существуют аспекты этих приложений, где атрибуты более распространены и другие, где дочерние элементы более естественны. Существуют также функции различных инструментов, которые упрощают или упрощают их использование.

XHTML - это одна область, где атрибуты имеют естественное использование (например, в class= 'foo'). Атрибуты не имеют порядка, и это может облегчить для некоторых людей разработку инструментов. Атрибуты OTOH сложнее вводить без схемы. Я также нахожу атрибуты с именами (foo: bar = "zork" ), которые зачастую сложнее управлять в различных наборах инструментов. Но посмотрите на некоторые из языков W3C, чтобы увидеть смесь, которая является общей. SVG, XSLT, XSD, MathML - некоторые примеры хорошо известных языков, и все они имеют богатый запас атрибутов и элементов. Некоторые языки даже допускают больше, чем один способ, например,

<foo title="bar"/>;

или

<foo>
  <title>bar</title>;
</foo>;

Обратите внимание, что они НЕ эквивалентны синтаксически и требуют явной поддержки в инструментах обработки)

Моим советом было бы взглянуть на обычную практику в ближайшей к вашей области, а также рассмотреть, какие инструменты вы можете применить.

Наконец, убедитесь, что вы различаете пространства имен из атрибутов. Некоторые XML-системы (например, Linq) представляют пространства имен в качестве атрибутов API. ИМО это уродливое и потенциально запутанное.

peter.murray.rust 05 июль 2009, в 12:30

7

Если вы сомневаетесь, KISS - зачем смешивать атрибуты и элементы, когда у вас нет ясной причины использовать атрибуты. Если позже вы решите определить XSD, это также станет более чистым. Затем, если вы даже позже решите создать структуру классов из своего XSD, это будет проще.

Luke 29 авг. 2008, в 01:40

4

Как насчет того, чтобы использовать нашу интуицию, ориентированную на твердую заработную плату? Обычно я считаю, что прямо думать о том, что является объектом и является атрибутом объекта или объекта, на который он ссылается.

Каким бы интуитивно не было смысла, поскольку объекты должны вписываться в элементы. Его атрибуты (или свойства) будут атрибутами для этих элементов в xml или дочернем элементе с атрибутом.

Я думаю, что для более простых случаев, как в примере, аналогия объектной ориентации работает нормально, чтобы определить, что является элементом и который является атрибутом элемента.

rpattabi 09 фев. 2011, в 14:40

4

Другие рассмотрели, как различать атрибуты от элементов, но с более общей точки зрения, помещая все в атрибуты, потому что это делает полученный XML меньше ошибочным.

XML не предназначен для компактности, но для переносимости и чтения человеком. Если вы хотите уменьшить размер данных в пути, используйте другое (например, буферы протокола Google).

Patrick 10 нояб. 2009, в 17:27

0

Или оставьте его как XML и используйте что-то вроде EXI ( w3.org/TR/exi ).
james.garriss 03 апр. 2012, в 14:26
0

Меньший текст XML более удобен для чтения только потому, что он меньше!
Nashev 13 март 2018, в 10:51

4

Использовать элементы для данных и атрибутов для метаданных (данные о данных элемента).

Если элемент отображается как предикат в ваших строках выбора, у вас есть хороший знак того, что он должен быть атрибутом. Аналогично, если атрибут никогда не используется как предикат, то, возможно, это не полезные метаданные.

Помните, что XML должен быть машиносчитываемым, не читаемым человеком, а для больших документов XML сжимается очень хорошо.

Michael J 15 янв. 2009, в 21:03

4

Это спорно так или иначе, но ваши коллеги правы в том смысле, что XML должен быть использован для "накрутку" или мета-данных вокруг фактических данных. Со своей стороны, вы правы в том, что иногда трудно решить, где линия между метаданными и данными при моделировании вашего домена в XML. На практике я делаю вид, что что-то в разметке скрыто, и только данные вне разметки читаются. Имеет ли этот документ какой-то смысл?

XML, как известно, громоздкий. Для транспортировки и хранения настоятельно рекомендуется сжатие, если вы можете позволить себе вычислительную мощность. XML сжимается хорошо, иногда феноменально хорошо, из-за его повторяемости. У меня было сжатие больших файлов до менее чем 5% от их первоначального размера.

Еще один момент, чтобы укрепить вашу позицию, заключается в том, что в то время как другая команда спорит о стиле (в том, что большинство инструментов XML будут обрабатывать полностью атрибутный документ так же просто, как и документ all-# PCDATA), вы утверждаете практичность. Хотя стиль не может быть полностью проигнорирован, технические достоинства должны нести больше веса.

erickson 29 авг. 2008, в 02:21

4

вопрос в миллион долларов!

Вначале не беспокойтесь о производительности. вы будете удивлены тому, как быстро оптимизированный синтаксический анализатор xml будет копировать ваш XML файл. что более важно, каков ваш дизайн на будущее: по мере развития XML, как вы будете поддерживать свободную связь и функциональную совместимость?

более конкретно, вы можете сделать контентную модель элемента более сложной, но сложнее расширить атрибут.

Adam 29 авг. 2008, в 01:29

3

В основном это вопрос предпочтения. Я использую Elements для группировки и атрибуты для данных, где это возможно, поскольку я считаю это более компактным, чем альтернатива.

Например, я предпочитаю.....

<?xml version="1.0" encoding="utf-8"?>
<data>
    <people>
         <person name="Rory" surname="Becker" age="30" />
        <person name="Travis" surname="Illig" age="32" />
        <person name="Scott" surname="Hanselman" age="34" />
    </people>
</data>

... Вместо....

<?xml version="1.0" encoding="utf-8"?>
<data>
    <people>
        <person>
            <name>Rory</name>
            <surname>Becker</surname>
            <age>30</age>
        </person>
        <person>
            <name>Travis</name>
            <surname>Illig</surname>
            <age>32</age>
        </person>
        <person>
            <name>Scott</name>
            <surname>Hanselman</surname>
            <age>34</age>
        </person>
    </people>
</data>

Однако, если у меня есть данные, которые не могут легко отображаться внутри, например, 20-30 символов или содержат много кавычек или других символов, которые нужно экранировать, я бы сказал, что это время, чтобы разбить элементы... возможно, с блоками CData.

<?xml version="1.0" encoding="utf-8"?>
<data>
    <people>
        <person name="Rory" surname="Becker" age="30" >
            <comment>A programmer whose interested in all sorts of misc stuff. His Blog can be found at http://rorybecker.blogspot.com and he on twitter as @RoryBecker</comment>
        </person>
        <person name="Travis" surname="Illig" age="32" >
            <comment>A cool guy for who has helped me out with all sorts of SVn information</comment>
        </person>
        <person name="Scott" surname="Hanselman" age="34" >
            <comment>Scott works for MS and has a great podcast available at http://www.hanselminutes.com </comment>
        </person>
    </people>
</data>

Rory Becker 30 сен. 2008, в 09:50

2

Я боюсь, что это совершенно неправильно - вы должны следовать рекомендациям W3C: w3schools.com/DTD/dtd_el_vs_attr.asp - XML не должен формироваться для удобства чтения или для того, чтобы сделать его «компактным», а скорее для правильного использования элементов или атрибутов для этой цели. для которого они были предназначены.
Vidar 07 янв. 2009, в 12:59
22

Извините, но это вводит в заблуждение. Страница W3schools не является руководством W3C. Рекомендация W3C XML (в которой я был участником) позволяет использовать элементы и атрибуты в соответствии с потребностями и стилями пользователей.
peter.murray.rust 05 июль 2009, в 11:45

3

Оба метода для хранения свойств объекта совершенно верны. Вы должны отказаться от прагматичных соображений. Попробуйте ответить на следующий вопрос:

Какое представление приводит к более быстрому анализу данных\генерация?
Какое представление приводит к более быстрой передаче данных?
Имеет ли смысл чтения?

...

aku 29 авг. 2008, в 02:29

1

Я всегда удивляюсь результатам этих обсуждений. Для меня существует очень простое правило для определения того, принадлежат ли данные в атрибуте или как контент, а именно: имеют ли данные навигационную подструктуру.

Так, например, текст без разметки всегда принадлежит атрибутам. Всегда.

Списки принадлежат субструктуре или контенту. Текст, который со временем может включать встроенный структурированный суб-контент, принадлежит к контенту. (По моему опыту относительно немного - текст с разметкой - при использовании XML для хранения или обмена данными.)

XML-схема, написанная таким образом, краткая.

Всякий раз, когда я вижу такие случаи, как <car><make>Ford</make><color>Red</color></car>, я думаю себе: "Неужели автор подумал, что в элементе make будут элементы?" <car make="Ford" color="Red" /> значительно читаем, нет вопросов о том, как обрабатывать пробелы и т.д.

Учитывая только правила обработки пробелов, я считаю, что это было четкое намерение разработчиков XML.

MGrier 15 май 2015, в 18:51

0

одно из немногих объяснений, которые я могу прочитать. понятия не имею, хорошая это идея или нет ... но по крайней мере я понимаю суть;)
Thufir 10 янв. 2019, в 00:37

1

Это очень ясно в HTML, где различия между атрибутами и разметкой можно четко увидеть:

Все данные находятся между разметкой
Атрибуты используются для характеристики этих данных (например, форматов).

Если у вас есть только чистые данные в виде XML, то есть менее четкое различие. Данные могут стоять между разметкой или атрибутами.

= > Большинство данных должны стоять между разметкой.

Если вы хотите использовать атрибуты здесь: вы можете разделить данные на две категории: данные и "метаданные", где метаданные не являются частью записи, которую вы хотите представить, но такие вещи, как "формат версии", дата создания "и т.д.

<customer format="">
     <name></name>
     ...
</customer>

Можно также сказать: "Использовать атрибуты для характеристики тега, использовать теги для предоставления самих данных".

Walter A. Jablonowski 31 авг. 2011, в 04:28

0

Атрибуты могут легко становиться трудными для управления, со временем доверяйте мне. Я всегда держусь подальше от них лично. Элементы гораздо более ясны и читабельны/могут использоваться как синтаксическими анализаторами, так и пользователями.

Только время, которое я когда-либо использовал, это определить расширение файла URL-адреса ресурса:

<image type="gif">wank.jpg</image> ...etc etc

Я думаю, если вы знаете 100%, атрибут не нужно будет расширять, вы можете их использовать, но сколько раз вы это знаете.

<image>
  <url>wank.jpg</url>
  <fileType>gif</fileType>
</image>

oh pot 08 апр. 2011, в 21:48

0

Всего несколько поправок на какую-то плохую информацию:

@John Ballinger: Attributies могут содержать любые символьные данные. < > и "" должны быть экранированы соответственно && "". Если вы используете библиотеку XML, это позаботится об этом для вас.

Ад, атрибут может содержать двоичные данные, такие как изображение, если вы действительно хотите, просто с помощью base64-кодирования и создания его URL-адреса данных.

@feenster: Атрибуты могут содержать отдельные элементы, разделенные пробелами, в случае IDS или NAMES, которые будут включать числа. Nitpicky, но это может привести к экономии места.

Использование атрибутов может поддерживать совместимость XML с JSON. См. Толстая разметка: обрезка толщины размножения мифа одной калорией за раз.

brianary 23 июль 2009, в 23:14

0

Не только идентификаторы или имена. Они могут содержать разделенные пробелами списки практически всего.
John Saunders 25 июль 2009, в 11:02
0

@JohnSaunders IDS или NAMES - это определенные типы DTD (я думаю, что и XML-схема), поддерживаемые на низком уровне большинством процессоров XML. Если обрабатывается прикладным уровнем вместо библиотек XML, любой тип символьных данных работает (отдельные значения или что-то еще).
brianary 24 июль 2013, в 20:12
0

Лично, то, что ты можешь, не значит, что ты должен.
Lankymart 02 окт. 2013, в 09:14
1

@Lankymart Как я уже сказал, я просто исправлял некоторую неверную информацию (по некоторым причинам она была высокой). Двоичные данные обычно не принадлежат XML.
brianary 07 окт. 2013, в 23:43

Показать ещё 2 комментария

0

Я согласен с feenster. Держитесь подальше от атрибутов, если сможете. Элементы являются дружественными к эволюции и более совместимыми между инструментариями веб-сервисов. Вы никогда не найдете эти инструментальные средства для сериализации ваших сообщений запроса/ответа с использованием атрибутов. Это также имеет смысл, поскольку наши сообщения - это данные (а не метаданные) для инструментария веб-сервисов.

ottodidakt 07 апр. 2009, в 08:07

Ещё вопросы

Я нашел этот действительно хороший ресурс: ibm.com/developerworks/xml/library/x-eleatt.html
+1 за "... спор был о том, что на самом деле было метаданными".
Обратите внимание на имена тегов в нижнем регистре с дефисами: stackoverflow.com/questions/1074447/…
Первый пункт неверен, см .: w3.org/TR/xmlschema-2/#derivation-by-list
Я бы сказал, что первый пункт верен, а list - это частичное решение этой проблемы. Не может быть нескольких атрибутов с одним и тем же именем. Атрибут list прежнему имеет только одно значение, которое представляет собой список некоторых типов данных, разделенных пробелами. Разделительные символы являются фиксированными, поэтому вы не можете иметь несколько значений, если одно значение требуемого типа данных может содержать пробелы. Это исключает возможность наличия, например, нескольких адресов в одном атрибуте «адрес».
«Атрибуты труднее манипулировать программным кодом» - не могу согласиться с этим. На самом деле я обнаружил, что все наоборот. Это не достаточно разницы, чтобы действительно заявить в любом случае.
Я также добавил бы, что проверка на соответствие DTD больше не актуальна, с XML-Schema, Schematron и Relax, et. и др. все они предоставляют значительно более мощные, а в некоторых случаях более интуитивно понятные способы проверки документов XML. Кроме того, W3Schools действительно плохой ориентир для всего
Хорошая мысль о «штрих-коде», я поторопился со своим примером и определенно разбил бы его на собственный элемент. Также хороший момент на XSD / DTD.
Или оставьте его как XML и используйте что-то вроде EXI ( w3.org/TR/exi ).
Меньший текст XML более удобен для чтения только потому, что он меньше!
Я боюсь, что это совершенно неправильно - вы должны следовать рекомендациям W3C: w3schools.com/DTD/dtd_el_vs_attr.asp - XML не должен формироваться для удобства чтения или для того, чтобы сделать его «компактным», а скорее для правильного использования элементов или атрибутов для этой цели. для которого они были предназначены.
Извините, но это вводит в заблуждение. Страница W3schools не является руководством W3C. Рекомендация W3C XML (в которой я был участником) позволяет использовать элементы и атрибуты в соответствии с потребностями и стилями пользователей.
одно из немногих объяснений, которые я могу прочитать. понятия не имею, хорошая это идея или нет ... но по крайней мере я понимаю суть;)
Не только идентификаторы или имена. Они могут содержать разделенные пробелами списки практически всего.
@JohnSaunders IDS или NAMES - это определенные типы DTD (я думаю, что и XML-схема), поддерживаемые на низком уровне большинством процессоров XML. Если обрабатывается прикладным уровнем вместо библиотек XML, любой тип символьных данных работает (отдельные значения или что-то еще).
Лично, то, что ты можешь, не значит, что ты должен.
@Lankymart Как я уже сказал, я просто исправлял некоторую неверную информацию (по некоторым причинам она была высокой). Двоичные данные обычно не принадлежат XML.

Chuck · Accepted Answer · 2008-08-29T03-15-00.000Z

114

Лучший ответ

Я использую это правило:

Атрибут - это то, что является самодостаточным, т.е. цвет, идентификатор, имя.
Элемент - это то, что делает или может иметь собственные атрибуты или содержать другие элементы.

Итак, ваш близок. Я бы сделал что-то вроде:

EDIT: обновлен исходный пример, основанный на обратной связи ниже.

  <ITEM serialNumber="something">
      <BARCODE encoding="Code39">something</BARCODE>
      <LOCATION>XYX</LOCATION>
      <TYPE modelNumber="something">
         <VENDOR>YYZ</VENDOR>
      </TYPE>
   </ITEM>

Chuck 29 авг. 2008, в 03:15

0

Это хорошее эмпирическое правило;) Я использую его сам и думаю, что многие люди используют.
ivan_ivanovich_ivanoff 24 март 2009, в 22:46
21

Я прочитал некоторые ответы и что-то, что не было достаточно подчеркнуто из моего опыта, состоит в том, что, если вы данные в «атрибуте» и вдруг имеете> или <ваш XML-документ сломается, я думаю, что есть пять символов ascii (>, <, &,?, "), что убьет его. Если этот специальный символ был в элементе, вы можете просто добавить некоторые теги CDATA вокруг этих данных. Я бы сказал, использовать атрибуты только тогда, когда вы на 100% знаете, какие значения будут помещены там, например, целое число или дата, возможно, все, что генерируется компьютером. Если BarCode был создан человеком, то он не должен быть атрибутом.
John Ballinger 05 июль 2009, в 12:06
0

Хороший вопрос, Джон!
Chuck 06 июль 2009, в 19:24
37

Действительно опоздал на вечеринку, но специальный аргумент char ASCII неверен - вот для чего нужен экранирование, как для атрибутов, так и для текстовых данных.
micahtan 25 нояб. 2009, в 04:11
0

@micahtan: Если вам нужно уйти, сериализация / десериализация будет дороже. Если вы знаете, что этого никогда не произойдет, вы можете просто пропустить эти дополнительные издержки, и это будет выполняться гораздо быстрее.
awe 07 май 2010, в 05:47
0

@awe: я не знал, что десериализацию обходится дороже. У вас есть ссылка на источник для этого? Я имею дело прежде всего с .NET, и я не видел ничего такого, что упоминало бы это. Что касается того, что «никогда не случится», меня это несколько раз сжигало. Если ваш XML содержит цифры или коды, это может быть безопасным допущением. Собственные имена или пользовательский ввод текста имеют неприятную привычку вводить эти символы, особенно амперсанд и одинарные и двойные кавычки.
micahtan 07 май 2010, в 16:54
0

@micahtan: убегать недостаточно. Правила для атрибутов разные. Примечание Джона Баллинджера верно. В частности, символ «<» не может быть в атрибуте независимо от экранирования. См. W3.org/TR/xml/#CleanAttrVals
Don Roby 17 май 2010, в 13:49
2

@donroby - Извините, это была бы моя ошибка в общении. Под экранированием я имею в виду кодирование XML. '<' = & lt; и т.д. Мне кажется странным выбирать между атрибутом или элементом, основанным на символах, составляющих контент, а не на смысле контента.
micahtan 17 май 2010, в 21:29
0

@micahtan - Нет, я думаю, что на самом деле версия в кодировке XML не допускается. Но я основываю это только на чтении спецификации - возможно, я напишу тест JUnit / XMLUnit для проверки вместо того, чтобы продолжать доверять моему пониманию спецификации, что действительно довольно сложно расшифровать. Но при выборе между атрибутом или значением вы действительно должны учитывать то, что они на самом деле допускают, а атрибуты, по-видимому, допускают меньше, чем элементы.
Don Roby 18 май 2010, в 01:10
0

Я написал тест JUnit / XMLUnit, чтобы проверить мое понимание спецификации, как отмечено выше, и кажется, что реализация SAX в Java вполне с радостью принимает закодированные «<» в значениях атрибутов. Я все еще подозреваю, что это не очень хорошая идея, но я не могу подтвердить это кодом ...
Don Roby 18 май 2010, в 12:50
3

@donroby: это неправильно. Текст замены < это < , который является ссылкой на символ, а не на сущность. < все в порядке в атрибутах. Смотрите: w3.org/TR/REC-xml/#sec-predefined-ent
porges 24 июнь 2010, в 04:10
14

@John: если это проблема, то в вашем наборе инструментов есть что-то, что не производит корректный XML. Я не думаю, что это причина выбора между атрибутами или элементами. (Более того, вы не можете «просто добавлять теги CDATA» вокруг пользовательского ввода, потому что он может содержать ]]> !)
porges 24 июнь 2010, в 04:13
0

Я согласен с @Porges и micahtan - неверные XML-строки не являются аргументом проекта. Как вы думаете, какова цель XML-кодирования строки, если она не защищает вас от подобных проблем?
Waog 19 авг. 2014, в 14:26

Показать ещё 11 комментариев