Я делаю проект для анализа некоторых данных из XML.
Например, XML
<abc>abcdefghijklmno</abc>
Мне нужно разобрать "abcdefghijkmnlp".
Но пока я проверяю свой синтаксический анализ, я обнаруживаю большую проблему:
public class parser{
private boolean hasABC = false;
//Constructor HERE
......................
......................
@Override
public void startDocument () throws SAXException{
}
@Override
public void endDocument () throws SAXException{
}
@Override
public void startElement(String namespaceURI, String localName, String qName, Attributes atts) throws SAXException{
if ("abc".equalsIgnoreCase(localName)) {
this.hasABC = true;
}
}
@Override
public void endElement(String namespaceURI, String localName, String qName) throws SAXException{
if ("abc".equalsIgnoreCase(localName)) {
this.hasABC = false;
}
}
@Override
public void characters(char ch[], int start, int length){
String content = new String(ch, start, length).trim();
if(this.hasABC){
System.out.println("ABC = " + content);
}
}
}
Я обнаружил, что парсер проанализировал тег два раза Распечатка системы,
ABC = abcdefghi
ABC = jklmno < ============= разделите сообщение
Почему парсер автоматически вызывает символы() два раза????
Является ли XML имеющим некоторые "\n" или "\ r"???