Java: Самый эффективный метод для итерации по всем элементам в org.w3c.dom.Document?

Каков наиболее эффективный способ перебора всех элементов DOM в Java?

Что-то вроде этого, но для каждого отдельного элемента DOM на текущем org.w3c.dom.Document?

for(Node childNode = node.getFirstChild(); childNode!=null;){
    Node nextChild = childNode.getNextSibling();
    // Do something with childNode, including move or delete...
    childNode = nextChild;

Ответ 1

В принципе у вас есть два способа перебора всех элементов:

1. Использование рекурсии (наиболее распространенный способ, я думаю):

public static void main(String[] args) throws SAXException, IOException,
        ParserConfigurationException, TransformerException {

    DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory
    DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
    Document document = docBuilder.parse(new File("document.xml"));

public static void doSomething(Node node) {
    // do something with the current node instead of System.out

    NodeList nodeList = node.getChildNodes();
    for (int i = 0; i < nodeList.getLength(); i++) {
        Node currentNode = nodeList.item(i);
        if (currentNode.getNodeType() == Node.ELEMENT_NODE) {
            //calls this method for all the children which is Element

2. Избегание рекурсии с помощью метода getElementsByTagName() с * в качестве параметра:

public static void main(String[] args) throws SAXException, IOException,
        ParserConfigurationException, TransformerException {

    DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory
    DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
    Document document = docBuilder.parse(new File("document.xml"));

    NodeList nodeList = document.getElementsByTagName("*");
    for (int i = 0; i < nodeList.getLength(); i++) {
        Node node = nodeList.item(i);
        if (node.getNodeType() == Node.ELEMENT_NODE) {
            // do something with the current element

Я думаю, что эти способы эффективны.
Надеюсь, это поможет.

Ответ 2

for (int i = 0; i < nodeList.getLength(); i++)

измените на

for (int i = 0, len = nodeList.getLength(); i < len; i++)

чтобы быть более эффективным. Второй способ может быть лучшим, поскольку он имеет тенденцию использовать более плоскую, прогнозируемую модель памяти.

Ответ 3

Я также наткнулся на эту проблему недавно. Вот мое решение. Я хотел избежать рекурсии, поэтому я использовал цикл while.

Из-за добавления и удаления в произвольных местах в списке, Я пошел с реализацией LinkedList.

/* traverses tree starting with given node */
  private static List<Node> traverse(Node n)
    return traverse(Arrays.asList(n));

  /* traverses tree starting with given nodes */
  private static List<Node> traverse(List<Node> nodes)
    List<Node> open = new LinkedList<Node>(nodes);
    List<Node> visited = new LinkedList<Node>();

    ListIterator<Node> it = open.listIterator();
    while (it.hasNext() || it.hasPrevious())
      Node unvisited;
      if (it.hasNext())
        unvisited = it.next();
        unvisited = it.previous();


      List<Node> children = getChildren(unvisited);
      for (Node child : children)


    return visited;

  private static List<Node> getChildren(Node n)
    List<Node> children = asList(n.getChildNodes());
    Iterator<Node> it = children.iterator();
    while (it.hasNext())
      if (it.next().getNodeType() != Node.ELEMENT_NODE)
    return children;

  private static List<Node> asList(NodeList nodes)
    List<Node> list = new ArrayList<Node>(nodes.getLength());
    for (int i = 0, l = nodes.getLength(); i < l; i++)
    return list;