Как красиво печатать XML из Java?

Question

Как красиво печатать XML из Java?

383

У меня есть строка Java, содержащая XML, без фидов строк или отступов. Я хотел бы превратить его в String с хорошо отформатированным XML. Как это сделать?

String unformattedXml = "<tag><nested>hello</nested></tag>";
String formattedXml = new [UnknownClass]().format(unformattedXml);

Примечание. Мой ввод - Строка. Мой вывод - Строка.

Steve McLeod 26 сен. 2008, в 12:49

Источник

0

проверьте этот вопрос: stackoverflow.com/questions/1264849/…
dfa 12 авг. 2009, в 08:14
10

Просто любопытно, отправляете ли вы этот вывод в файл XML или куда-то еще, где отступ имеет значение? Некоторое время назад я был очень обеспокоен форматированием своего XML, чтобы он правильно отображался ... но, потратив много времени на это, я понял, что мне нужно отправить свои результаты в веб-браузер и любой относительно современный веб-браузер. на самом деле будет отображать XML в красивой древовидной структуре, так что я могу забыть об этой проблеме и двигаться дальше. Я упоминаю об этом только на тот случай, если вы (или другой пользователь с такой же проблемой) могли пропустить ту же деталь.
Abel Morelos 06 окт. 2010, в 17:21
2

@Abel, сохранение в текстовые файлы, вставка в текстовые области HTML и вывод в консоль для целей отладки.
Steve McLeod 06 окт. 2010, в 20:48
1

«отложить в сторону как слишком широкий» - трудно быть более точным, чем вопрос в настоящее время!
Steve McLeod 16 июль 2018, в 11:19

Показать ещё 2 комментария

Теги:

java

xml

pretty-print

30 ответов

215

Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty(OutputKeys.INDENT, "yes");
transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "2");
//initialize StreamResult with File object to save to file
StreamResult result = new StreamResult(new StringWriter());
DOMSource source = new DOMSource(doc);
transformer.transform(source, result);
String xmlString = result.getWriter().toString();
System.out.println(xmlString);

Примечание. Результаты могут различаться в зависимости от версии Java. Поиск обходных решений, характерных для вашей платформы.

Lorenzo Boccaccia 26 сен. 2008, в 13:20

1

Как сделать так, чтобы вывод не содержал <?xml version="1.0" encoding="UTF-8"?> ?
Thang Pham 19 июль 2011, в 19:26
16

Чтобы пропустить объявление <?xml ...> , добавьте transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes")
rustyx 25 авг. 2015, в 20:01
3

Случайные читатели могут найти полезной улучшенную версию решения, описанного здесь ( stackoverflow.com/a/33541820/363573 ).
Stephan 05 нояб. 2015, в 10:20
0

где определяется doc ?
Florian F 26 окт. 2017, в 10:29
0

это переменная типа Document, которая содержит ваш xml для конвертации, она должна быть где-то в вашем коде
Lorenzo Boccaccia 26 окт. 2017, в 13:17
3

Это не отвечает на мой вопрос: как мне отформатировать строку, содержащую XML? Этот ответ уже предполагает, что вы каким-то образом преобразовали объект String в другой объект.
Steve McLeod 11 июль 2018, в 20:49

Показать ещё 4 комментария

124

Вот ответ на мой вопрос. Я объединил ответы из различных результатов, чтобы написать класс, который довольно печатает XML.

Нет гарантий относительно того, как он реагирует на недопустимые XML или большие документы.

package ecb.sdw.pretty;

import org.apache.xml.serialize.OutputFormat;
import org.apache.xml.serialize.XMLSerializer;
import org.w3c.dom.Document;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.IOException;
import java.io.StringReader;
import java.io.StringWriter;
import java.io.Writer;

/**
 * Pretty-prints xml, supplied as a string.
 * <p/>
 * eg.
 * <code>
 * String formattedXml = new XmlFormatter().format("<tag><nested>hello</nested></tag>");
 * </code>
 */
public class XmlFormatter {

    public XmlFormatter() {
    }

    public String format(String unformattedXml) {
        try {
            final Document document = parseXmlFile(unformattedXml);

            OutputFormat format = new OutputFormat(document);
            format.setLineWidth(65);
            format.setIndenting(true);
            format.setIndent(2);
            Writer out = new StringWriter();
            XMLSerializer serializer = new XMLSerializer(out, format);
            serializer.serialize(document);

            return out.toString();
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

    private Document parseXmlFile(String in) {
        try {
            DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
            DocumentBuilder db = dbf.newDocumentBuilder();
            InputSource is = new InputSource(new StringReader(in));
            return db.parse(is);
        } catch (ParserConfigurationException e) {
            throw new RuntimeException(e);
        } catch (SAXException e) {
            throw new RuntimeException(e);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

    public static void main(String[] args) {
        String unformattedXml =
                "<?xml version=\"1.0\" encoding=\"UTF-8\"?><QueryMessage\n" +
                        "        xmlns=\"http://www.SDMX.org/resources/SDMXML/schemas/v2_0/message\"\n" +
                        "        xmlns:query=\"http://www.SDMX.org/resources/SDMXML/schemas/v2_0/query\">\n" +
                        "    <Query>\n" +
                        "        <query:CategorySchemeWhere>\n" +
                        "   \t\t\t\t\t         <query:AgencyID>ECB\n\n\n\n</query:AgencyID>\n" +
                        "        </query:CategorySchemeWhere>\n" +
                        "    </Query>\n\n\n\n\n" +
                        "</QueryMessage>";

        System.out.println(new XmlFormatter().format(unformattedXml));
    }

}

Steve McLeod 26 сен. 2008, в 14:17

13

Сразу отмечу, что этот ответ требует использования Xerces. Если вы не хотите добавлять эту зависимость, вы можете просто использовать стандартные библиотеки jdk и javax.xml.transform.Transformer (см. Мой ответ ниже).
khylo 17 дек. 2010, в 16:28
43

Еще в 2008 году это был хороший ответ, но теперь все это можно сделать с помощью стандартных классов JDK, а не классов Apache. См. Xerces.apache.org/xerces2-j/faq-general.html#faq-6 . Да, это часто задаваемые вопросы Xerces, но ответ охватывает стандартные классы JDK. Первоначальная реализация этих классов в версии 1.5 имела много проблем, но с 1.6 все работает нормально. Скопируйте пример LSSerializer в FAQ, writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE); бит "..." и добавьте writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE); после LSSerializer writer = ... строка.
George Hawkins 04 май 2011, в 08:43
2

Я создал небольшой класс, используя пример, приведенный Apache, на который @GeorgeHawkins дал ссылку. Не хватало того, как был инициализирован переменный document , поэтому я подумал, что мог бы добавить замедление и сделать из него быстрый пример. Дайте мне знать, если я должен что-то изменить, pastebin.com/XL7932aC
samwell 16 июль 2012, в 16:52
0

это не правда, что вы можете сделать это только с JDK. по крайней мере, не надежно. это зависит от некоторой реализации внутреннего реестра, которая по умолчанию не активна с моим jdk7u72. так что вам лучше использовать Apache напрямую.
user1050755 17 нояб. 2014, в 17:16
0

Это решение работало для меня в Java 1.7.
John 23 сен. 2015, в 17:31
0

Вот решение без каких-либо зависимостей: stackoverflow.com/a/33541820/363573 .
Stephan 05 нояб. 2015, в 10:21
0

Я на самом деле поддерживаю проект LOL 2008 года, спасибо!
MewX 05 окт. 2018, в 05:07

Показать ещё 5 комментариев

118

более простое решение, основанное на этом ответе:

public static String prettyFormat(String input, int indent) {
    try {
        Source xmlInput = new StreamSource(new StringReader(input));
        StringWriter stringWriter = new StringWriter();
        StreamResult xmlOutput = new StreamResult(stringWriter);
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        transformerFactory.setAttribute("indent-number", indent);
        Transformer transformer = transformerFactory.newTransformer(); 
        transformer.setOutputProperty(OutputKeys.INDENT, "yes");
        transformer.transform(xmlInput, xmlOutput);
        return xmlOutput.getWriter().toString();
    } catch (Exception e) {
        throw new RuntimeException(e); // simple exception handling, please review it
    }
}

public static String prettyFormat(String input) {
    return prettyFormat(input, 2);
}

TestCase:

prettyFormat("<root><child>aaa</child><child/></root>");

возвращает:

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <child>aaa</child>
  <child/>
</root>

dfa 12 авг. 2009, в 09:12

1

Это код, который я всегда использовал, но в этой компании он не работал, я предполагаю, что они используют другую библиотеку преобразования XML. Я создал фабрику отдельной строкой, а затем сделал factory.setAttribute("indent-number", 4); и теперь это работает.
Adrian Smith 21 окт. 2010, в 13:25
0

Как сделать так, чтобы вывод не содержал <?xml version="1.0" encoding="UTF-8"?> ?
Thang Pham 19 июль 2011, в 19:13
4

@Harry: transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
jjmontes 07 окт. 2011, в 09:06
4

Привет, я использую этот точный код, и мои форматы правильно, за исключением первого элемента Итак, это: <?xml version="1.0" encoding="UTF-8"?><root> все в одной строке. Есть идеи почему?
CodyK 10 март 2015, в 18:28
0

@dfa: мне понравился комментарий // simple exception handling, please review it . Можете ли вы указать на некоторые ресурсы, которые рекомендуют этот тип обработки исключений? Благодарю.
John 23 сен. 2015, в 17:34
2

@Codemiester: похоже, ошибка (см. Stackoverflow.com/a/18251901/3375325 ). Добавление transformer.setOutputProperty(OutputKeys.DOCTYPE_PUBLIC, "yes"); работал на меня.
lazlev 10 авг. 2016, в 16:53

Показать ещё 4 комментария

49

Только для того, чтобы отметить, что для наиболее подходящего ответа требуется использование xerces.

Если вы не хотите добавлять эту внешнюю зависимость, вы можете просто использовать стандартные библиотеки jdk (которые фактически построены с использованием внутренних ксерок).

N.B. Была ошибка с jdk версии 1.5, см. http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6296446, но она разрешена сейчас.,

(Обратите внимание, что если произошла ошибка, это вернет исходный текст)

package com.test;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;

import javax.xml.transform.OutputKeys;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.sax.SAXSource;
import javax.xml.transform.sax.SAXTransformerFactory;
import javax.xml.transform.stream.StreamResult;

import org.xml.sax.InputSource;

public class XmlTest {
    public static void main(String[] args) {
        XmlTest t = new XmlTest();
        System.out.println(t.formatXml("<a><b><c/><d>text D</d><e value='0'/></b></a>"));
    }

    public String formatXml(String xml){
        try{
            Transformer serializer= SAXTransformerFactory.newInstance().newTransformer();
            serializer.setOutputProperty(OutputKeys.INDENT, "yes");
            //serializer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
            serializer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "2");
            //serializer.setOutputProperty("{http://xml.customer.org/xslt}indent-amount", "2");
            Source xmlSource=new SAXSource(new InputSource(new ByteArrayInputStream(xml.getBytes())));
            StreamResult res =  new StreamResult(new ByteArrayOutputStream());            
            serializer.transform(xmlSource, res);
            return new String(((ByteArrayOutputStream)res.getOutputStream()).toByteArray());
        }catch(Exception e){
            //TODO log error
            return xml;
        }
    }

}

khylo 17 дек. 2010, в 16:58

0

В этом случае левые вкладки не используются. Все теги начинаются с первого символа строки, как обычный текст.
Ruslan 23 дек. 2010, в 09:57
0

Вам не нужно указывать кодировку при преобразовании между байтами и строками?
Will Glass 02 дек. 2011, в 01:18
2

Там не должно быть необходимости конвертировать из и в байтовые массивы / String. По крайней мере, вы должны будете указать кодировку при этом. Лучше было бы использовать классы StringReader и StringWriter, обернутые в InputSource и StreamResult.
maximdim 21 дек. 2012, в 16:00
0

не работает. вам нужно возиться с какой-то внутренней реализацией реестра.
user1050755 17 нояб. 2014, в 17:14
0

Вот более простой вариант этого решения: stackoverflow.com/a/33541820/363573
Stephan 05 нояб. 2015, в 10:37

Показать ещё 3 комментария

25

В прошлом я довольно печально использовал метод org.dom4j.io.OutputFormat.createPrettyPrint()

public String prettyPrint(final String xml){  

    if (StringUtils.isBlank(xml)) {
        throw new RuntimeException("xml was null or blank in prettyPrint()");
    }

    final StringWriter sw;

    try {
        final OutputFormat format = OutputFormat.createPrettyPrint();
        final org.dom4j.Document document = DocumentHelper.parseText(xml);
        sw = new StringWriter();
        final XMLWriter writer = new XMLWriter(sw, format);
        writer.write(document);
    }
    catch (Exception e) {
        throw new RuntimeException("Error pretty printing xml:\n" + xml, e);
    }
    return sw.toString();
}

mlo55 03 нояб. 2008, в 23:55

3

Принятое решение не делает правильные отступы для вложенных тегов в моем случае, это делает.
Chase Seibert 06 нояб. 2008, в 17:37
0

Вот решение без DOM4J: stackoverflow.com/a/33541820/363573
Stephan 05 нояб. 2015, в 10:38
2

Я использовал это в сочетании с удалением всех конечных пробелов в конце строк: prettyPrintedString.replaceAll("\\s+\n", "\n")
jediz 05 сен. 2017, в 11:32

Показать ещё 1 комментарий

16

Вот способ сделать это с помощью dom4j:

Импорт

import org.dom4j.Document;  
import org.dom4j.DocumentHelper;  
import org.dom4j.io.OutputFormat;  
import org.dom4j.io.XMLWriter;

Код:

String xml = "<your xml='here'/>";  
Document doc = DocumentHelper.parseText(xml);  
StringWriter sw = new StringWriter();  
OutputFormat format = OutputFormat.createPrettyPrint();  
XMLWriter xw = new XMLWriter(sw, format);  
xw.write(doc);  
String result = sw.toString();

Scobal 08 апр. 2010, в 10:44

1

Это не сработало для меня. Он просто дал что-то вроде: <?xml version... в одной строке и все остальное в другой строке.
sixtyfootersdude 03 фев. 2012, в 20:39
1

Решение, не связанное с dom4j: stackoverflow.com/a/33541820/363573
Stephan 05 нояб. 2015, в 10:38

12

Поскольку вы начинаете с String, перед тем, как использовать Transformer, вам нужно скрывать объект DOM (например, Node). Однако, если вы знаете, что ваша строка XML действительна и вы не хотите нести накладные расходы на память при разборе строки в DOM, тогда запустите преобразование по DOM, чтобы получить строку обратно - вы могли бы просто сделать несколько старомодных символьный синтаксический анализ. Вставьте новую строку и пробелы после каждого символа </...>, счетчик keep и indent (чтобы определить количество пробелов), которое вы увеличиваете для каждого <...> и уменьшаете для каждых </...>, которые вы видите.

Отказ от ответственности - я сделал вырезание/вставку/текстовое редактирование функций ниже, поэтому они не могут компилироваться как есть.

public static final Element createDOM(String strXML) 
    throws ParserConfigurationException, SAXException, IOException {

    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    dbf.setValidating(true);
    DocumentBuilder db = dbf.newDocumentBuilder();
    InputSource sourceXML = new InputSource(new StringReader(strXML))
    Document xmlDoc = db.parse(sourceXML);
    Element e = xmlDoc.getDocumentElement();
    e.normalize();
    return e;
}

public static final void prettyPrint(Node xml, OutputStream out)
    throws TransformerConfigurationException, TransformerFactoryConfigurationError, TransformerException {
    Transformer tf = TransformerFactory.newInstance().newTransformer();
    tf.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
    tf.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
    tf.setOutputProperty(OutputKeys.INDENT, "yes");
    tf.transform(new DOMSource(xml), new StreamResult(out));
}

Kevin Hakanson 26 сен. 2008, в 14:06

1

«Тем не менее, если вы знаете, что ваша XML-строка является действительной ...» - хорошая мысль. Смотрите мое решение на основе этого подхода ниже.
David Easley 27 май 2010, в 10:51

11

Если использовать стороннюю XML-библиотеку в порядке, вы можете уйти с чем-то значительно более простым, чем то, что в настоящее время с наибольшим числом голосов ответы.

Было указано, что как входные, так и выходные данные должны быть строками, поэтому здесь используется метод утилиты, который выполняется с помощью XOM:

import nu.xom.*;
import java.io.*;

[...]

public static String format(String xml) throws ParsingException, IOException {
    ByteArrayOutputStream out = new ByteArrayOutputStream();
    Serializer serializer = new Serializer(out);
    serializer.setIndent(4);  // or whatever you like
    serializer.write(new Builder().build(xml, ""));
    return out.toString("UTF-8");
}

Я тестировал, что он работает, и результаты не зависят от вашей версии JRE или чего-то подобного. Чтобы узнать, как настроить формат вывода по своему усмотрению, ознакомьтесь с Serializer API.

Это на самом деле получилось дольше, чем я думал - нужны некоторые дополнительные строки, потому что Serializer хочет записать OutputStream. Но обратите внимание, что здесь очень мало кода для фактического слияния XML.

(Этот ответ является частью моей оценки XOM, которая была предложена в качестве одного из вариантов в моем вопросе о лучшем Java XML library для замены dom4j. Для записи с dom4j вы могли бы добиться этого с такой же легкостью, используя XMLWriter и OutputFormat. Изменить:... как показано в mlo55 answer.)

Jonik 07 июнь 2009, в 18:17

2

Спасибо, это то, что я искал. Если у вас есть XML, уже проанализированный с XOM в объекте «Document», вы можете передать его напрямую в serializer.write (document);
Thibault D. 13 авг. 2013, в 06:07

10

Хммм... столкнулся с чем-то вроде этого, и это известная ошибка... просто добавьте этот OutputProperty..

transformer.setOutputProperty(OutputPropertiesFactory.S_KEY_INDENT_AMOUNT, "8");

Надеюсь, что это поможет...

Sandeep Phukan 22 дек. 2009, в 19:34

1

Более полное решение здесь: stackoverflow.com/a/33541820/363573
Stephan 05 нояб. 2015, в 10:40
1

Откуда этот OutputPropertiesFactory?
helenov 20 окт. 2016, в 13:19

8

Использование scala:

import xml._
val xml = XML.loadString("<tag><nested>hello</nested></tag>")
val formatted = new PrettyPrinter(150, 2).format(xml)
println(formatted)

Вы можете сделать это и на Java, если вы зависите от scala -library.jar. Это выглядит так:

import scala.xml.*;

public class FormatXML {
    public static void main(String[] args) {
        String unformattedXml = "<tag><nested>hello</nested></tag>";
        PrettyPrinter pp = new PrettyPrinter(150, 3);
        String formatted = pp.format(XML.loadString(unformattedXml), TopScope$.MODULE$);
        System.out.println(formatted);
    }
}

Объект PrettyPrinter сконструирован с двумя ints, первый - макс длина строки, а второй - шаг отступа.

Synesso 08 март 2011, в 03:51

1

Решение без Scala: stackoverflow.com/a/33541820/363573
Stephan 05 нояб. 2015, в 10:40

8

Кевин Хакансон сказал: "Однако, если вы знаете, что ваша строка XML верна, и вы не хотите нести накладные расходы на память для разбора строки в DOM, тогда выполните преобразование по DOM, чтобы получить строку обратно - вы могли бы просто сделать несколько старых вставляйте новую строку и пробелы после каждого символа, счетчика keep и indent (чтобы определить количество пробелов), которое вы увеличиваете для каждого <... > и декремента для каждого, которое вы видите.

Согласен. Такой подход намного быстрее и имеет гораздо меньше зависимостей.

Пример решения:

/**
 * XML utils, including formatting.
 */
public class XmlUtils
{
  private static XmlFormatter formatter = new XmlFormatter(2, 80);

  public static String formatXml(String s)
  {
    return formatter.format(s, 0);
  }

  public static String formatXml(String s, int initialIndent)
  {
    return formatter.format(s, initialIndent);
  }

  private static class XmlFormatter
  {
    private int indentNumChars;
    private int lineLength;
    private boolean singleLine;

    public XmlFormatter(int indentNumChars, int lineLength)
    {
      this.indentNumChars = indentNumChars;
      this.lineLength = lineLength;
    }

    public synchronized String format(String s, int initialIndent)
    {
      int indent = initialIndent;
      StringBuilder sb = new StringBuilder();
      for (int i = 0; i < s.length(); i++)
      {
        char currentChar = s.charAt(i);
        if (currentChar == '<')
        {
          char nextChar = s.charAt(i + 1);
          if (nextChar == '/')
            indent -= indentNumChars;
          if (!singleLine)   // Don't indent before closing element if we're creating opening and closing elements on a single line.
            sb.append(buildWhitespace(indent));
          if (nextChar != '?' && nextChar != '!' && nextChar != '/')
            indent += indentNumChars;
          singleLine = false;  // Reset flag.
        }
        sb.append(currentChar);
        if (currentChar == '>')
        {
          if (s.charAt(i - 1) == '/')
          {
            indent -= indentNumChars;
            sb.append("\n");
          }
          else
          {
            int nextStartElementPos = s.indexOf('<', i);
            if (nextStartElementPos > i + 1)
            {
              String textBetweenElements = s.substring(i + 1, nextStartElementPos);

              // If the space between elements is solely newlines, let them through to preserve additional newlines in source document.
              if (textBetweenElements.replaceAll("\n", "").length() == 0)
              {
                sb.append(textBetweenElements + "\n");
              }
              // Put tags and text on a single line if the text is short.
              else if (textBetweenElements.length() <= lineLength * 0.5)
              {
                sb.append(textBetweenElements);
                singleLine = true;
              }
              // For larger amounts of text, wrap lines to a maximum line length.
              else
              {
                sb.append("\n" + lineWrap(textBetweenElements, lineLength, indent, null) + "\n");
              }
              i = nextStartElementPos - 1;
            }
            else
            {
              sb.append("\n");
            }
          }
        }
      }
      return sb.toString();
    }
  }

  private static String buildWhitespace(int numChars)
  {
    StringBuilder sb = new StringBuilder();
    for (int i = 0; i < numChars; i++)
      sb.append(" ");
    return sb.toString();
  }

  /**
   * Wraps the supplied text to the specified line length.
   * @lineLength the maximum length of each line in the returned string (not including indent if specified).
   * @indent optional number of whitespace characters to prepend to each line before the text.
   * @linePrefix optional string to append to the indent (before the text).
   * @returns the supplied text wrapped so that no line exceeds the specified line length + indent, optionally with
   * indent and prefix applied to each line.
   */
  private static String lineWrap(String s, int lineLength, Integer indent, String linePrefix)
  {
    if (s == null)
      return null;

    StringBuilder sb = new StringBuilder();
    int lineStartPos = 0;
    int lineEndPos;
    boolean firstLine = true;
    while(lineStartPos < s.length())
    {
      if (!firstLine)
        sb.append("\n");
      else
        firstLine = false;

      if (lineStartPos + lineLength > s.length())
        lineEndPos = s.length() - 1;
      else
      {
        lineEndPos = lineStartPos + lineLength - 1;
        while (lineEndPos > lineStartPos && (s.charAt(lineEndPos) != ' ' && s.charAt(lineEndPos) != '\t'))
          lineEndPos--;
      }
      sb.append(buildWhitespace(indent));
      if (linePrefix != null)
        sb.append(linePrefix);

      sb.append(s.substring(lineStartPos, lineEndPos + 1));
      lineStartPos = lineEndPos + 1;
    }
    return sb.toString();
  }

  // other utils removed for brevity
}

David Easley 27 май 2010, в 10:55

1

Спасибо! Только это сработало для меня (в среде JSF).
Daniel Szalay 01 май 2011, в 16:11
1

Так и должно быть. Формат на лету на уровне строки. Это единственное решение, которое отформатирует неверный или неполный XML.
Florian F 26 окт. 2017, в 10:20

7

Только для справки в будущем, здесь решение, которое сработало для меня (спасибо комментарию, что @George Hawkins опубликовал в одном из ответов):

DOMImplementationRegistry registry = DOMImplementationRegistry.newInstance();
DOMImplementationLS impl = (DOMImplementationLS) registry.getDOMImplementation("LS");
LSSerializer writer = impl.createLSSerializer();
writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE);
LSOutput output = impl.createLSOutput();
ByteArrayOutputStream out = new ByteArrayOutputStream();
output.setByteStream(out);
writer.write(document, output);
String xmlStr = new String(out.toByteArray());

Michael 10 окт. 2011, в 16:34

7

Относительно комментария, что "вы должны сначала построить дерево DOM": Нет, вам не нужно и не должно этого делать.

Вместо этого создайте StreamSource (новый StreamSource (новый StringReader (str)) и отправьте его на указанный трансформатор идентичности. Это будет использовать SAX-парсер, и результат будет намного быстрее. Построение промежуточного дерева является чистым накладным капиталом для этого случая. В противном случае хороший ответ будет хорошим.

StaxMan 26 фев. 2009, в 21:32

1

Я полностью согласен: создание промежуточного дерева DOM - это пустая трата памяти. Спасибо за этот ответ.
Florian F 26 окт. 2017, в 10:18

5

немного улучшена версия milosmns...

public static String getPrettyXml(String xml) {
    if (xml == null || xml.trim().length() == 0) return "";

    int stack = 0;
    StringBuilder pretty = new StringBuilder();
    String[] rows = xml.trim().replaceAll(">", ">\n").replaceAll("<", "\n<").split("\n");

    for (int i = 0; i < rows.length; i++) {
        if (rows[i] == null || rows[i].trim().length() == 0) continue;

        String row = rows[i].trim();
        if (row.startsWith("<?")) {
            pretty.append(row + "\n");
        } else if (row.startsWith("</")) {
            String indent = repeatString(--stack);
            pretty.append(indent + row + "\n");
        } else if (row.startsWith("<") && row.endsWith("/>") == false) {
            String indent = repeatString(stack++);
            pretty.append(indent + row + "\n");
            if (row.endsWith("]]>")) stack--;
        } else {
            String indent = repeatString(stack);
            pretty.append(indent + row + "\n");
        }
    }

    return pretty.toString().trim();
}

private static String repeatString(int stack) {
     StringBuilder indent = new StringBuilder();
     for (int i = 0; i < stack; i++) {
        indent.append(" ");
     }
     return indent.toString();
}

codeskraps 09 июль 2014, в 11:21

0

где - repeatString (стек ++); способ ..?
user1912935 25 июнь 2015, в 09:59
2

закрытая статическая строка String repeatString (int stack) {StringBuilder indent = new StringBuilder (); for (int i = 0; i <stack; i ++) {indent.append (""); } return indent.toString (); }
codeskraps 25 июнь 2015, в 14:16
0

Отступ не работает нормально в конечных тегах. Вам нужно изменить } else if (row.startsWith("</")) { часть этого: else if (row.startsWith("</")) { String indent = repeatIdent(--stack); if (pretty.charAt(pretty.length() - 1) == '\n') { pretty.append(indent + row + "\n"); } else { pretty.append(row + "\n"); } }
Csaba Tenkes 28 дек. 2018, в 10:17

Показать ещё 1 комментарий

4

Все вышеперечисленные решения не сработали для меня, я нашел это http://myshittycode.com/2014/02/10/java-properly-indenting-xml-string/

Ключ удаляет пробелы с XPath

    String xml = "<root>" +
             "\n   " +
             "\n<name>Coco Puff</name>" +
             "\n        <total>10</total>    </root>";

try {
    Document document = DocumentBuilderFactory.newInstance()
            .newDocumentBuilder()
            .parse(new InputSource(new ByteArrayInputStream(xml.getBytes("utf-8"))));

    XPath xPath = XPathFactory.newInstance().newXPath();
    NodeList nodeList = (NodeList) xPath.evaluate("//text()[normalize-space()='']",
                                                  document,
                                                  XPathConstants.NODESET);

    for (int i = 0; i < nodeList.getLength(); ++i) {
        Node node = nodeList.item(i);
        node.getParentNode().removeChild(node);
    }

    Transformer transformer = TransformerFactory.newInstance().newTransformer();
    transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
    transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
    transformer.setOutputProperty(OutputKeys.INDENT, "yes");
    transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "4");

    StringWriter stringWriter = new StringWriter();
    StreamResult streamResult = new StreamResult(stringWriter);

    transformer.transform(new DOMSource(document), streamResult);

    System.out.println(stringWriter.toString());
}
catch (Exception e) {
    e.printStackTrace();
}

Georgy Gobozov 13 май 2015, в 12:25

1

Обратите внимание, что использование свойства '{ xml.apache.org/xslt } indent-amount' свяжет вас с конкретной реализацией преобразователя.
vallismortis 17 июнь 2015, в 14:28
1

Из всех решений это сработало лучше всего. У меня уже были пробелы и новые строки в моем XML, плюс я не хотел добавлять больше зависимостей в свой проект. Хотелось бы мне не разбирать XML, ну да ладно.
Fabio 10 март 2016, в 19:25

4

Если вы уверены, что у вас есть действующий XML, этот простой и избегает XML DOM-деревьев. Может быть, есть некоторые ошибки, сделайте комментарий, если вы видите что-нибудь

public String prettyPrint(String xml) {
            if (xml == null || xml.trim().length() == 0) return "";

            int stack = 0;
            StringBuilder pretty = new StringBuilder();
            String[] rows = xml.trim().replaceAll(">", ">\n").replaceAll("<", "\n<").split("\n");

            for (int i = 0; i < rows.length; i++) {
                    if (rows[i] == null || rows[i].trim().length() == 0) continue;

                    String row = rows[i].trim();
                    if (row.startsWith("<?")) {
                            // xml version tag
                            pretty.append(row + "\n");
                    } else if (row.startsWith("</")) {
                            // closing tag
                            String indent = repeatString("    ", --stack);
                            pretty.append(indent + row + "\n");
                    } else if (row.startsWith("<")) {
                            // starting tag
                            String indent = repeatString("    ", stack++);
                            pretty.append(indent + row + "\n");
                    } else {
                            // tag data
                            String indent = repeatString("    ", stack);
                            pretty.append(indent + row + "\n");
                    }
            }

            return pretty.toString().trim();
    }

milosmns 12 фев. 2014, в 19:06

2

где метод repeatString ..?
user1912935 25 июнь 2015, в 11:07
3

закрытая статическая строка String repeatString (int stack) {StringBuilder indent = new StringBuilder (); for (int i = 0; i <stack; i ++) {indent.append (""); } return indent.toString (); }
codeskraps 25 июнь 2015, в 14:17
0

Да [user1912935], то, что написал @codeskraps, должно быть достаточно простым :)
milosmns 25 июнь 2015, в 16:36
0

Конкатенация со StringBuilder внутри цикла: плохая практика.
james.garriss 22 дек. 2015, в 14:00
0

@ james.garriss Но разделить на новые строки очень просто, это просто иллюстрирует простой подход без каких-либо DOM-деревьев.
milosmns 30 нояб. 2018, в 11:02

Показать ещё 3 комментария

2

Этот код ниже отлично работает

import javax.xml.transform.OutputKeys;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.stream.StreamResult;
import javax.xml.transform.stream.StreamSource;

String formattedXml1 = prettyFormat("<root><child>aaa</child><child/></root>");

public static String prettyFormat(String input) {
    return prettyFormat(input, "2");
}

public static String prettyFormat(String input, String indent) {
    Source xmlInput = new StreamSource(new StringReader(input));
    StringWriter stringWriter = new StringWriter();
    try {
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.setOutputProperty(OutputKeys.INDENT, "yes");
        transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", indent);
        transformer.transform(xmlInput, new StreamResult(stringWriter));

        String pretty = stringWriter.toString();
        pretty = pretty.replace("\r\n", "\n");
        return pretty;              
    } catch (Exception e) {
        throw new RuntimeException(e);
    }
}

maks tkach 02 июнь 2016, в 19:29

0

Пожалуйста, объясните, почему ваш код работает для OP
techspider 02 июнь 2016, в 18:51

2

Еще одно решение, которое работает для нас

import java.io.StringWriter;
import org.dom4j.DocumentHelper;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;

**
 * Pretty Print XML String
 * 
 * @param inputXmlString
 * @return
 */
public static String prettyPrintXml(String xml) {

    final StringWriter sw;

    try {
        final OutputFormat format = OutputFormat.createPrettyPrint();
        final org.dom4j.Document document = DocumentHelper.parseText(xml);
        sw = new StringWriter();
        final XMLWriter writer = new XMLWriter(sw, format);
        writer.write(document);
    }
    catch (Exception e) {
        throw new RuntimeException("Error pretty printing xml:\n" + xml, e);
    }
    return sw.toString();
}

Anand 22 июль 2015, в 20:10

1

Можете ли вы включить заявления на импорт?
simon 06 нояб. 2015, в 12:51

2

В качестве альтернативы ответам max, codeskraps, David Easley и milosmns, посмотрите на мою легкую, высокопроизводительную библиотеку довольно-печатных: xml-formatter

// construct lightweight, threadsafe, instance
PrettyPrinter prettyPrinter = PrettyPrinterBuilder.newPrettyPrinter().build();

StringBuilder buffer = new StringBuilder();
String xml = ..; // also works with char[] or Reader

if(prettyPrinter.process(xml, buffer)) {
     // valid XML, print buffer
} else {
     // invalid XML, print xml
}

Иногда, как при запуске издевающихся SOAP-сервисов непосредственно из файла, хорошо иметь симпатичный принтер, который также обрабатывает уже довольно печатный XML:

PrettyPrinter prettyPrinter = PrettyPrinterBuilder.newPrettyPrinter().ignoreWhitespace().build();

Как некоторые комментируют, довольно-печатная версия - это просто способ представления XML в более удобочитаемой форме - пробелы строго не принадлежат вашим XML-данным.

Библиотека предназначена для красивой печати для целей ведения журнала, а также включает функции фильтрации (удаление/анонимизация поддерева) и довольно-типографию XML в узлах CDATA и Text.

ThomasRS 29 дек. 2014, в 00:18

1

Использование jdom2: http://www.jdom.org/

import java.io.StringReader;
import org.jdom2.input.SAXBuilder;
import org.jdom2.output.Format;
import org.jdom2.output.XMLOutputter;

String prettyXml = new XMLOutputter(Format.getPrettyFormat()).
                         outputString(new SAXBuilder().build(new StringReader(uglyXml)));

BijanE 11 май 2015, в 16:25

1

У меня была такая же проблема, и у меня был большой успех с JTidy (http://jtidy.sourceforge.net/index.html)

Пример:

Tidy t = new Tidy();
t.setIndentContent(true);
Document d = t.parseDOM(
    new ByteArrayInputStream("HTML goes here", null);

OutputStream out = new ByteArrayOutputStream();
t.pprint(d, out);
String html = out.toString();

Kristoffer Lindvall 11 июнь 2010, в 21:42

0

Работает ли jTidy для чистого XML или только для (X) HTML?
khylo 17 дек. 2010, в 16:32
2

Кажется, не работает для чистого XML. Только HTMLS.
BeepDog 29 июнь 2011, в 19:38

0

Я должен был сначала найти эту страницу, прежде чем придумать свое решение! Во всяком случае, my использует рекурсию Java для анализа XML-страницы. Этот код полностью автономный и не зависит от сторонних библиотек. Также.. он использует рекурсию!

// you call this method passing in the xml text
public static void prettyPrint(String text){
    prettyPrint(text, 0);
}

// "index" corresponds to the number of levels of nesting and/or the number of tabs to print before printing the tag
public static void prettyPrint(String xmlText, int index){
    boolean foundTagStart = false;
    StringBuilder tagChars = new StringBuilder();
    String startTag = "";
    String endTag = "";
    String[] chars = xmlText.split("");
    // find the next start tag
    for(String ch : chars){
        if(ch.equalsIgnoreCase("<")){
            tagChars.append(ch);
            foundTagStart = true;
        } else if(ch.equalsIgnoreCase(">") && foundTagStart){
            startTag = tagChars.append(ch).toString();
            String tempTag = startTag;
            endTag = (tempTag.contains("\"") ? (tempTag.split(" ")[0] + ">") : tempTag).replace("<", "</"); // <startTag attr1=1 attr2=2> => </startTag>
            break;
        } else if(foundTagStart){
            tagChars.append(ch);
        }
    }
    // once start and end tag are calculated, print start tag, then content, then end tag
    if(foundTagStart){
        int startIndex = xmlText.indexOf(startTag);
        int endIndex = xmlText.indexOf(endTag);
        // handle if matching tags NOT found
        if((startIndex < 0) || (endIndex < 0)){
            if(startIndex < 0) {
                // no start tag found
                return;
            } else {
                // start tag found, no end tag found (handles single tags aka "<mytag/>" or "<?xml ...>")
                printTabs(index);
                System.out.println(startTag);
                // move on to the next tag
                // NOTE: "index" (not index+1) because next tag is on same level as this one
                prettyPrint(xmlText.substring(startIndex+startTag.length(), xmlText.length()), index);
                return;
            }
        // handle when matching tags found
        } else {
            String content = xmlText.substring(startIndex+startTag.length(), endIndex);
            boolean isTagContainsTags = content.contains("<"); // content contains tags
            printTabs(index);
            if(isTagContainsTags){ // ie: <tag1><tag2>stuff</tag2></tag1>
                System.out.println(startTag);
                prettyPrint(content, index+1); // "index+1" because "content" is nested
                printTabs(index);
            } else {
                System.out.print(startTag); // ie: <tag1>stuff</tag1> or <tag1></tag1>
                System.out.print(content);
            }
            System.out.println(endTag);
            int nextIndex = endIndex + endTag.length();
            if(xmlText.length() > nextIndex){ // if there are more tags on this level, continue
                prettyPrint(xmlText.substring(nextIndex, xmlText.length()), index);
            }
        }
    } else {
        System.out.print(xmlText);
    }
}

private static void printTabs(int counter){
    while(counter-- > 0){ 
        System.out.print("\t");
    }
}

Steve T 04 нояб. 2017, в 04:41

0

Попробуйте следующее:

 try
                    {
                        TransformerFactory transFactory = TransformerFactory.newInstance();
                        Transformer transformer = null;
                        transformer = transFactory.newTransformer();
                        StringWriter buffer = new StringWriter();
                        transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
                        transformer.transform(new DOMSource(element),
                                  new StreamResult(buffer)); 
                        String str = buffer.toString();
                        System.out.println("XML INSIDE IS #########################################"+str);
                        return element;
                    }
                    catch (TransformerConfigurationException e)
                    {
                        e.printStackTrace();
                    }
                    catch (TransformerException e)
                    {
                        e.printStackTrace();
                    }

Sireesh Yarlagadda 14 май 2016, в 02:03

0

Если вам не нужно отступать так много, но несколько разрывов строк, этого может быть достаточно просто для регулярного выражения...

String leastPrettifiedXml = uglyXml.replaceAll("><", ">\n<");

Код хороший, а не результат из-за отсутствия отступа.

(Для решений с отступом см. другие ответы.)

comonad 20 авг. 2015, в 13:55

1

Хмммм ... Просто подумав, кому понадобится такое решение? Единственная область, которую я вижу, - это данные, которые мы получаем от некоторых веб-сервисов, и просто для того, чтобы проверить эти данные и их достоверность, разработчику или тестировщику могут понадобиться такие простые. В противном случае не хороший вариант ....
Sudhakar Chavali 08 фев. 2018, в 16:22
1

@SudhakarChavali Я разработчик. мне может понадобиться это для грязных взломов println () и log.debug (); то есть иногда я могу использовать только файлы журнала из ограниченной серверной среды (с веб-интерфейсом администратора вместо доступа к оболочке) вместо пошаговой отладки программы.
comonad 19 фев. 2018, в 17:23

0

Я видел один ответ с помощью Scala, так что вот еще один в Groovy, на всякий случай кто-то считает это интересным. Отступ по умолчанию - 2 шага, конструктор XmlNodePrinter может быть передан еще одно значение.

def xml = "<tag><nested>hello</nested></tag>"
def stringWriter = new StringWriter()
def node = new XmlParser().parseText(xml);
new XmlNodePrinter(new PrintWriter(stringWriter)).print(node)
println stringWriter.toString()

Использование Java, если groovy jar находится в пути к классам

  String xml = "<tag><nested>hello</nested></tag>";
  StringWriter stringWriter = new StringWriter();
  Node node = new XmlParser().parseText(xml);
  new XmlNodePrinter(new PrintWriter(stringWriter)).print(node);
  System.out.println(stringWriter.toString());

vsnyc 01 май 2015, в 21:05

0

Решения, которые я нашел здесь для Java 1.6+, не переформатируют код, если он уже отформатирован. Тот, который работал у меня (и отформатировал уже отформатированный код), был следующим.

import org.apache.xml.security.c14n.CanonicalizationException;
import org.apache.xml.security.c14n.Canonicalizer;
import org.apache.xml.security.c14n.InvalidCanonicalizerException;
import org.w3c.dom.Element;
import org.w3c.dom.bootstrap.DOMImplementationRegistry;
import org.w3c.dom.ls.DOMImplementationLS;
import org.w3c.dom.ls.LSSerializer;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.TransformerException;
import java.io.IOException;
import java.io.StringReader;

public class XmlUtils {
    public static String toCanonicalXml(String xml) throws InvalidCanonicalizerException, ParserConfigurationException, SAXException, CanonicalizationException, IOException {
        Canonicalizer canon = Canonicalizer.getInstance(Canonicalizer.ALGO_ID_C14N_OMIT_COMMENTS);
        byte canonXmlBytes[] = canon.canonicalize(xml.getBytes());
        return new String(canonXmlBytes);
    }

    public static String prettyFormat(String input) throws TransformerException, ParserConfigurationException, IOException, SAXException, InstantiationException, IllegalAccessException, ClassNotFoundException {
        InputSource src = new InputSource(new StringReader(input));
        Element document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(src).getDocumentElement();
        Boolean keepDeclaration = input.startsWith("<?xml");
        DOMImplementationRegistry registry = DOMImplementationRegistry.newInstance();
        DOMImplementationLS impl = (DOMImplementationLS) registry.getDOMImplementation("LS");
        LSSerializer writer = impl.createLSSerializer();
        writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE);
        writer.getDomConfig().setParameter("xml-declaration", keepDeclaration);
        return writer.writeToString(document);
    }
}

Это хороший инструмент для использования в ваших модульных тестах для полномасштабного сравнения xml.

private void assertXMLEqual(String expected, String actual) throws ParserConfigurationException, IOException, SAXException, CanonicalizationException, InvalidCanonicalizerException, TransformerException, IllegalAccessException, ClassNotFoundException, InstantiationException {
    String canonicalExpected = prettyFormat(toCanonicalXml(expected));
    String canonicalActual = prettyFormat(toCanonicalXml(actual));
    assertEquals(canonicalExpected, canonicalActual);
}

Wojtek 14 окт. 2014, в 13:26

0

Для тех, кто ищет быстрое и грязное решение, для которого XML не должен быть 100% действительным. например в случае регистрации REST/SOAP (вы никогда не знаете, что посылают другие, -))

Я нашел и переработал код, который был отключен. Я нашел онлайн, который, как мне кажется, по-прежнему отсутствует в качестве допустимого возможного подхода:

public static String prettyPrintXMLAsString(String xmlString) {
    /* Remove new lines */
    final String LINE_BREAK = "\n";
    xmlString = xmlString.replaceAll(LINE_BREAK, "");
    StringBuffer prettyPrintXml = new StringBuffer();
    /* Group the xml tags */
    Pattern pattern = Pattern.compile("(<[^/][^>]+>)?([^<]*)(</[^>]+>)?(<[^/][^>]+/>)?");
    Matcher matcher = pattern.matcher(xmlString);
    int tabCount = 0;
    while (matcher.find()) {
        String str1 = (null == matcher.group(1) || "null".equals(matcher.group())) ? "" : matcher.group(1);
        String str2 = (null == matcher.group(2) || "null".equals(matcher.group())) ? "" : matcher.group(2);
        String str3 = (null == matcher.group(3) || "null".equals(matcher.group())) ? "" : matcher.group(3);
        String str4 = (null == matcher.group(4) || "null".equals(matcher.group())) ? "" : matcher.group(4);

        if (matcher.group() != null && !matcher.group().trim().equals("")) {
            printTabs(tabCount, prettyPrintXml);
            if (!str1.equals("") && str3.equals("")) {
                ++tabCount;
            }
            if (str1.equals("") && !str3.equals("")) {
                --tabCount;
                prettyPrintXml.deleteCharAt(prettyPrintXml.length() - 1);
            }

            prettyPrintXml.append(str1);
            prettyPrintXml.append(str2);
            prettyPrintXml.append(str3);
            if (!str4.equals("")) {
                prettyPrintXml.append(LINE_BREAK);
                printTabs(tabCount, prettyPrintXml);
                prettyPrintXml.append(str4);
            }
            prettyPrintXml.append(LINE_BREAK);
        }
    }
    return prettyPrintXml.toString();
}

private static void printTabs(int count, StringBuffer stringBuffer) {
    for (int i = 0; i < count; i++) {
        stringBuffer.append("\t");
    }
}

public static void main(String[] args) {
    String x = new String(
            "<soap:Envelope xmlns:soap=\"http://schemas.xmlsoap.org/soap/envelope/\"><soap:Body><soap:Fault><faultcode>soap:Client</faultcode><faultstring>INVALID_MESSAGE</faultstring><detail><ns3:XcbSoapFault xmlns=\"\" xmlns:ns3=\"http://www.someapp.eu/xcb/types/xcb/v1\"><CauseCode>20007</CauseCode><CauseText>INVALID_MESSAGE</CauseText><DebugInfo>Problems creating SAAJ object model</DebugInfo></ns3:XcbSoapFault></detail></soap:Fault></soap:Body></soap:Envelope>");
    System.out.println(prettyPrintXMLAsString(x));
}

вот результат:

<soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/">
  <soap:Body>
    <soap:Fault>
        <faultcode>soap:Client</faultcode>
        <faultstring>INVALID_MESSAGE</faultstring>
        <detail>
            <ns3:XcbSoapFault xmlns="" xmlns:ns3="http://www.someapp.eu/xcb/types/xcb/v1">
                <CauseCode>20007</CauseCode>
                <CauseText>INVALID_MESSAGE</CauseText>
                <DebugInfo>Problems creating SAAJ object model</DebugInfo>
            </ns3:XcbSoapFault>
        </detail>
    </soap:Fault>
  </soap:Body>
</soap:Envelope>

max 08 окт. 2013, в 00:49

0

Я обнаружил, что в Java 1.6.0_32 обычный метод для корректной печати строки XML (с использованием Transformer с нулем или идентификатором xslt) не ведет себя так, как хотелось бы, если теги просто разделенные пробелами, в отличие от отсутствия разделительного текста. Я попытался использовать <xsl:strip-space elements="*"/> в своем шаблоне безрезультатно. Самое простое решение, которое я нашел, это разделить пространство так, как я хотел, используя фильтр SAXSource и XML. Поскольку мое решение предназначено для ведения журнала, я также расширил его, чтобы работать с неполными фрагментами XML. Обратите внимание, что обычный метод работает нормально, если вы используете DOMSource, но я не хотел использовать его из-за неполноты и издержек памяти.

public static class WhitespaceIgnoreFilter extends XMLFilterImpl
{

    @Override
    public void ignorableWhitespace(char[] arg0,
                                    int arg1,
                                    int arg2) throws SAXException
    {
        //Ignore it then...
    }

    @Override
    public void characters( char[] ch,
                            int start,
                            int length) throws SAXException
    {
        if (!new String(ch, start, length).trim().equals("")) 
               super.characters(ch, start, length); 
    }
}

public static String prettyXML(String logMsg, boolean allowBadlyFormedFragments) throws SAXException, IOException, TransformerException
    {
        TransformerFactory transFactory = TransformerFactory.newInstance();
        transFactory.setAttribute("indent-number", new Integer(2));
        Transformer transformer = transFactory.newTransformer();
        transformer.setOutputProperty(OutputKeys.INDENT, "yes");
        transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "4");
        StringWriter out = new StringWriter();
        XMLReader masterParser = SAXHelper.getSAXParser(true);
        XMLFilter parser = new WhitespaceIgnoreFilter();
        parser.setParent(masterParser);

        if(allowBadlyFormedFragments)
        {
            transformer.setErrorListener(new ErrorListener()
            {
                @Override
                public void warning(TransformerException exception) throws TransformerException
                {
                }

                @Override
                public void fatalError(TransformerException exception) throws TransformerException
                {
                }

                @Override
                public void error(TransformerException exception) throws TransformerException
                {
                }
            });
        }

        try
        {
            transformer.transform(new SAXSource(parser, new InputSource(new StringReader(logMsg))), new StreamResult(out));
        }
        catch (TransformerException e)
        {
            if(e.getCause() != null && e.getCause() instanceof SAXParseException)
            {
                if(!allowBadlyFormedFragments || !"XML document structures must start and end within the same entity.".equals(e.getCause().getMessage()))
                {
                    throw e;
                }
            }
            else
            {
                throw e;
            }
        }
        out.flush();
        return out.toString();
    }

JFK 05 июль 2012, в 21:34

0

есть очень хорошая утилита xml командной строки командной строки, которая называется xmlstarlet (http://xmlstar.sourceforge.net/), которая может делать много вещей, которые много люди используют.

Вы можете выполнить эту программу программно, используя Runtime.exec, а затем прочитать форматированный выходной файл. Он имеет больше опций и улучшает отчет об ошибках, чем может предоставить несколько строк кода Java.

скачать xmlstarlet: http://sourceforge.net/project/showfiles.php?group_id=66612&package_id=64589

anjanb 26 сен. 2008, в 16:20

Ещё вопросы

проверьте этот вопрос: stackoverflow.com/questions/1264849/…
Просто любопытно, отправляете ли вы этот вывод в файл XML или куда-то еще, где отступ имеет значение? Некоторое время назад я был очень обеспокоен форматированием своего XML, чтобы он правильно отображался ... но, потратив много времени на это, я понял, что мне нужно отправить свои результаты в веб-браузер и любой относительно современный веб-браузер. на самом деле будет отображать XML в красивой древовидной структуре, так что я могу забыть об этой проблеме и двигаться дальше. Я упоминаю об этом только на тот случай, если вы (или другой пользователь с такой же проблемой) могли пропустить ту же деталь.
@Abel, сохранение в текстовые файлы, вставка в текстовые области HTML и вывод в консоль для целей отладки.
«отложить в сторону как слишком широкий» - трудно быть более точным, чем вопрос в настоящее время!
Как сделать так, чтобы вывод не содержал <?xml version="1.0" encoding="UTF-8"?> ?
Чтобы пропустить объявление <?xml ...> , добавьте transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes")
Случайные читатели могут найти полезной улучшенную версию решения, описанного здесь ( stackoverflow.com/a/33541820/363573 ).
это переменная типа Document, которая содержит ваш xml для конвертации, она должна быть где-то в вашем коде
Это не отвечает на мой вопрос: как мне отформатировать строку, содержащую XML? Этот ответ уже предполагает, что вы каким-то образом преобразовали объект String в другой объект.
Сразу отмечу, что этот ответ требует использования Xerces. Если вы не хотите добавлять эту зависимость, вы можете просто использовать стандартные библиотеки jdk и javax.xml.transform.Transformer (см. Мой ответ ниже).
Еще в 2008 году это был хороший ответ, но теперь все это можно сделать с помощью стандартных классов JDK, а не классов Apache. См. Xerces.apache.org/xerces2-j/faq-general.html#faq-6 . Да, это часто задаваемые вопросы Xerces, но ответ охватывает стандартные классы JDK. Первоначальная реализация этих классов в версии 1.5 имела много проблем, но с 1.6 все работает нормально. Скопируйте пример LSSerializer в FAQ, writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE); бит "..." и добавьте writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE); после LSSerializer writer = ... строка.
Я создал небольшой класс, используя пример, приведенный Apache, на который @GeorgeHawkins дал ссылку. Не хватало того, как был инициализирован переменный document , поэтому я подумал, что мог бы добавить замедление и сделать из него быстрый пример. Дайте мне знать, если я должен что-то изменить, pastebin.com/XL7932aC
это не правда, что вы можете сделать это только с JDK. по крайней мере, не надежно. это зависит от некоторой реализации внутреннего реестра, которая по умолчанию не активна с моим jdk7u72. так что вам лучше использовать Apache напрямую.
Это решение работало для меня в Java 1.7.
Вот решение без каких-либо зависимостей: stackoverflow.com/a/33541820/363573 .
Я на самом деле поддерживаю проект LOL 2008 года, спасибо!
Это код, который я всегда использовал, но в этой компании он не работал, я предполагаю, что они используют другую библиотеку преобразования XML. Я создал фабрику отдельной строкой, а затем сделал factory.setAttribute("indent-number", 4); и теперь это работает.
Как сделать так, чтобы вывод не содержал <?xml version="1.0" encoding="UTF-8"?> ?
@Harry: transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
Привет, я использую этот точный код, и мои форматы правильно, за исключением первого элемента Итак, это: <?xml version="1.0" encoding="UTF-8"?><root> все в одной строке. Есть идеи почему?
@dfa: мне понравился комментарий // simple exception handling, please review it . Можете ли вы указать на некоторые ресурсы, которые рекомендуют этот тип обработки исключений? Благодарю.
@Codemiester: похоже, ошибка (см. Stackoverflow.com/a/18251901/3375325 ). Добавление transformer.setOutputProperty(OutputKeys.DOCTYPE_PUBLIC, "yes"); работал на меня.
В этом случае левые вкладки не используются. Все теги начинаются с первого символа строки, как обычный текст.
Вам не нужно указывать кодировку при преобразовании между байтами и строками?
Там не должно быть необходимости конвертировать из и в байтовые массивы / String. По крайней мере, вы должны будете указать кодировку при этом. Лучше было бы использовать классы StringReader и StringWriter, обернутые в InputSource и StreamResult.
не работает. вам нужно возиться с какой-то внутренней реализацией реестра.
Вот более простой вариант этого решения: stackoverflow.com/a/33541820/363573
Принятое решение не делает правильные отступы для вложенных тегов в моем случае, это делает.
Вот решение без DOM4J: stackoverflow.com/a/33541820/363573
Я использовал это в сочетании с удалением всех конечных пробелов в конце строк: prettyPrintedString.replaceAll("\\s+\n", "\n")
Это не сработало для меня. Он просто дал что-то вроде: <?xml version... в одной строке и все остальное в другой строке.
Решение, не связанное с dom4j: stackoverflow.com/a/33541820/363573
«Тем не менее, если вы знаете, что ваша XML-строка является действительной ...» - хорошая мысль. Смотрите мое решение на основе этого подхода ниже.
Спасибо, это то, что я искал. Если у вас есть XML, уже проанализированный с XOM в объекте «Document», вы можете передать его напрямую в serializer.write (document);
Более полное решение здесь: stackoverflow.com/a/33541820/363573
Решение без Scala: stackoverflow.com/a/33541820/363573
Спасибо! Только это сработало для меня (в среде JSF).
Так и должно быть. Формат на лету на уровне строки. Это единственное решение, которое отформатирует неверный или неполный XML.
Я полностью согласен: создание промежуточного дерева DOM - это пустая трата памяти. Спасибо за этот ответ.
закрытая статическая строка String repeatString (int stack) {StringBuilder indent = new StringBuilder (); for (int i = 0; i <stack; i ++) {indent.append (""); } return indent.toString (); }
Отступ не работает нормально в конечных тегах. Вам нужно изменить } else if (row.startsWith("</")) { часть этого: else if (row.startsWith("</")) { String indent = repeatIdent(--stack); if (pretty.charAt(pretty.length() - 1) == '\n') { pretty.append(indent + row + "\n"); } else { pretty.append(row + "\n"); } }
Обратите внимание, что использование свойства '{ xml.apache.org/xslt } indent-amount' свяжет вас с конкретной реализацией преобразователя.
Из всех решений это сработало лучше всего. У меня уже были пробелы и новые строки в моем XML, плюс я не хотел добавлять больше зависимостей в свой проект. Хотелось бы мне не разбирать XML, ну да ладно.
закрытая статическая строка String repeatString (int stack) {StringBuilder indent = new StringBuilder (); for (int i = 0; i <stack; i ++) {indent.append (""); } return indent.toString (); }
Да [user1912935], то, что написал @codeskraps, должно быть достаточно простым :)
Конкатенация со StringBuilder внутри цикла: плохая практика.
@ james.garriss Но разделить на новые строки очень просто, это просто иллюстрирует простой подход без каких-либо DOM-деревьев.
Пожалуйста, объясните, почему ваш код работает для OP
Можете ли вы включить заявления на импорт?
Работает ли jTidy для чистого XML или только для (X) HTML?
Кажется, не работает для чистого XML. Только HTMLS.
Хмммм ... Просто подумав, кому понадобится такое решение? Единственная область, которую я вижу, - это данные, которые мы получаем от некоторых веб-сервисов, и просто для того, чтобы проверить эти данные и их достоверность, разработчику или тестировщику могут понадобиться такие простые. В противном случае не хороший вариант ....
@SudhakarChavali Я разработчик. мне может понадобиться это для грязных взломов println () и log.debug (); то есть иногда я могу использовать только файлы журнала из ограниченной серверной среды (с веб-интерфейсом администратора вместо доступа к оболочке) вместо пошаговой отладки программы.

Steve McLeod · Accepted Answer · 2012-07-17T11-24-00.000Z

Теперь 2012 и Java могут делать больше, чем с XML, я хотел бы добавить альтернативу моему принятому ответу. Это не имеет зависимостей вне Java 6.

import org.w3c.dom.Node;
import org.w3c.dom.bootstrap.DOMImplementationRegistry;
import org.w3c.dom.ls.DOMImplementationLS;
import org.w3c.dom.ls.LSSerializer;
import org.xml.sax.InputSource;

import javax.xml.parsers.DocumentBuilderFactory;
import java.io.StringReader;

/**
 * Pretty-prints xml, supplied as a string.
 * <p/>
 * eg.
 * <code>
 * String formattedXml = new XmlFormatter().format("<tag><nested>hello</nested></tag>");
 * </code>
 */
public class XmlFormatter {

    public String format(String xml) {

        try {
            final InputSource src = new InputSource(new StringReader(xml));
            final Node document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(src).getDocumentElement();
            final Boolean keepDeclaration = Boolean.valueOf(xml.startsWith("<?xml"));

        //May need this: System.setProperty(DOMImplementationRegistry.PROPERTY,"com.sun.org.apache.xerces.internal.dom.DOMImplementationSourceImpl");


            final DOMImplementationRegistry registry = DOMImplementationRegistry.newInstance();
            final DOMImplementationLS impl = (DOMImplementationLS) registry.getDOMImplementation("LS");
            final LSSerializer writer = impl.createLSSerializer();

            writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE); // Set this to true if the output needs to be beautified.
            writer.getDomConfig().setParameter("xml-declaration", keepDeclaration); // Set this to true if the declaration is needed to be outputted.

            return writer.writeToString(document);
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }

    public static void main(String[] args) {
        String unformattedXml =
                "<?xml version=\"1.0\" encoding=\"UTF-8\"?><QueryMessage\n" +
                        "        xmlns=\"http://www.SDMX.org/resources/SDMXML/schemas/v2_0/message\"\n" +
                        "        xmlns:query=\"http://www.SDMX.org/resources/SDMXML/schemas/v2_0/query\">\n" +
                        "    <Query>\n" +
                        "        <query:CategorySchemeWhere>\n" +
                        "   \t\t\t\t\t         <query:AgencyID>ECB\n\n\n\n</query:AgencyID>\n" +
                        "        </query:CategorySchemeWhere>\n" +
                        "    </Query>\n\n\n\n\n" +
                        "</QueryMessage>";

        System.out.println(new XmlFormatter().format(unformattedXml));
    }
}

Без отступа, но он работает с этим: System.setProperty (DOMImplementationRegistry.PROPERTY, "com.sun.org.apache.xerces.internal.dom.DOMImplementationSourceImpl");
Как вы добавляете отступ к этому примеру?
Я попробовал это решение и обнаружил, что возвращаемая строка XML всегда имеет UTF-16. Когда документ сериализуется обратно в строку, появляется такая строка кода: ser._format.setEncoding("UTF-16"); Сейчас это может быть стандартом, но для системы, с которой я работаю, используется UTF-8. Кто-нибудь знает, как сохранить кодировку из исходной строки XML?
@DanTemple Похоже, вам нужно использовать LSOutput для управления кодировкой. См. Chipkillmar.net/2009/03/25/pretty-print-xml-from-a-dom
@JoshuaDavis Спасибо, это работает, чтобы установить кодировку в ответе. Мне нужно добавить что-то, что передает оригинальную кодировку симпатичному принтеру, если я хочу сохранить кодировку оригинальной XML-строки.
@JoshA. Существует одна строка, использующая XMLBeam: System.out.println(new XBProjector().projectXMLString("<xml><foo><bar/></foo></xml>", DOMAccess.class).asString());
@ Steve McLeod Безопасны ли реализации LSSerializer?
Я считаю, что это перенос строк на определенную длину - есть ли способ предотвратить перенос?
это добавляет спецификацию FEFF в начале возвращаемой строки.
Я пытался использовать это в Andriod, но я не могу найти пакет `DOMImplementationRegistry. Я использую Java 8.
@ChintanSoni, как ты справился с xml-печатью в Android?
Вот более простой подход: stackoverflow.com/a/33541820/363573
У меня возникли проблемы с этим фрагментом, касающиеся значений атрибута с экранированием. Менее чем escape-последовательность < был правильно сохранен в то время как больше, чем последовательность > был преобразован в фактический знак > .
да, это работа на JDK8 без исключения вместо следующего оцененного ответа.
Чтобы установить кодировку: LSOutput output = impl.createLSOutput (); output.setEncoding ( "UTF-8"); output.setByteStream (new ByteArrayOutputStream ()); writer.write (документ, вывод); return output.getByteStream (). toString ();
Не работал на JDK 8, развернутом в JBoss EAP 7 / Wildfly 10, исключение класса не найдено com.sun.org.apache.xerces.internal.dom.DOMXSImplementationSourceImpl - похоже, связано с этими вопросами.jboss.org/ browse/WFLY-4416 - но я не собираюсь иметь дело с добавлением дополнительной библиотеки или чего-то еще - мне не нужно, чтобы она была напечатана так сильно.
спасибо, что включили также список импорта, так много доступных конфликтующих пакетов, чтобы понять комбинацию, необходимую в противном случае ..