Подтвердить что ты не робот

Серийная сериализация GSON очень медленная

Я пытаюсь сериализовать массив из 7000 POJO с помощью GSON, и время сериализации очень медленное. Он составляет порядка 3-5 секунд для сериализации массива следующего объекта:

public class Case {
    private Long caseId;
    private Key<Organization> orgKey;

    private Key<Workflow> workflowKey;
    private Key<User> creatorKey;

    private Date creationTimestamp;
    private Date lastUpdatedTimestamp;

    private String name;
    private String stage;
    private String notes;
}

Ключевые поля сериализуются с использованием пользовательского сериализатора/десериализатора:

public class GsonKeySerializerDeserializer implements JsonSerializer<Key<?>>, JsonDeserializer<Key<?>>{

@Override
public JsonElement serialize(Key<?> src, Type typeOfSrc, JsonSerializationContext arg2) {
    return new JsonPrimitive(src.getString());
}

@Override
public Key<?> deserialize(JsonElement src, Type typeOfSrc, JsonDeserializationContext arg2) throws JsonParseException {
    if (src.isJsonNull() || src.getAsString().isEmpty()) {
        return null;
    }

    String s = src.getAsString();
    com.google.appengine.api.datastore.Key k = KeyFactory.stringToKey(s);
    return new Key(k);
}
}

Чтобы проверить производительность на ручную запись JSON-сериализатора, я протестировал следующий код и смог сериализовать тот же массив объектов Case примерно в 10 раз быстрее, чем GSON.

List<Case> cases = (List<Case>) retVal;
JSONArray a = new JSONArray();
for (Case c : cases) {
    JSONObject o = new JSONObject();
    o.put("caseId", c.getCaseId());
    o.put("orgKey", c.getOrgKey().getString());
    o.put("workflowKey", c.getWorkflowKey().getString());
    o.put("creatorKey", c.getCreatorKey().getString());
    o.put("creationTimestamp", c.getCreationTimestamp().getTime());
    o.put("lastUpdatedTimestamp", c.getLastUpdatedTimestamp().getTime());
    o.put("name", c.getName());
    o.put("stage", c.getStage());
    o.put("notes", c.getNotes());
    a.put(o);

}
String json = a.toString();

Любые идеи, почему GSON работает так плохо в этом случае?

UPDATE

Здесь код, который фактически запускает сериализацию:

Object retVal = someFunctionThatReturnsAList();
String json = g.toJson(retVal);
resp.getWriter().print(json);

UPDATE2

Здесь очень простой тестовый пример, который иллюстрирует низкую производительность по сравнению с org.json:

List<Foo> list = new ArrayList<Foo>();
for (int i = 0; i < 7001; i++) {
    Foo f = new Foo();
    f.id = new Long(i);
    list.add(f);
}

Gson gs = new Gson();
long start = System.currentTimeMillis();
String s = gs.toJson(list);
System.out.println("Serialization time using Gson: " + ((double) (System.currentTimeMillis() - start) / 1000));


start = System.currentTimeMillis();
JSONArray a = new JSONArray();
for (Foo f : list) {
    JSONObject o = new JSONObject();
    o.put("id", f.id);
    a.put(o);

}
String json = a.toString();
System.out.println("Serialization time using org.json: " + ((double) (System.currentTimeMillis() - start) / 1000));

System.out.println(json.equals(s));

Где Foo:

public class Foo {
public Long id;
}

Выводится:

Serialization time using Gson: 0.233
Serialization time using org.json: 0.028
true

Почти 10-кратная разница в производительности!

4b9b3361

Ответ 1

Я попытался воспроизвести вашу проблему и не смог. Я создал 7000 объектов с нетривиальными данными в них. На моем ThinkPad потребовался Gson ~ 260 мс для сериализации ~ 3 МБ Gson, который является респектабельным ~ 10 Мбит/с.

Большая часть того времени была потрачена на преобразование дат в строки. Преобразование двух полей даты в "длинные", сохраненные около 50 мс.

Мне удалось сохранить еще ~ 10 мс, перенеся из древовидных адаптеров (JsonSerializer/JsonDeserializer) в новый класс адаптера потоковой передачи TypeAdaper. Код, который устанавливает это, выглядит следующим образом:

    private static TypeAdapter<Key<String>> keyAdapter = new TypeAdapter<Key<String>>() {
        @Override public void write(JsonWriter out, Key<String> value) throws IOException {
            out.value(value.value);
        }

        @Override public Key<String> read(JsonReader in) throws IOException {
            if (in.peek() == JsonToken.NULL) {
                in.nextNull();
                return null;
            }
            return new Key<String>(in.nextString());
        }
    };

    ...

    Gson gson = new GsonBuilder()
            .registerTypeAdapter(Key.class, keyAdapter)
            .create();

Основное различие между моим сценарием и вашим заключается в том, что я использую свой собственный фиктивный класс Key. Но если ключ был узким местом, которое должно было возникнуть, когда вы вручную сериализовали каждый случай.

Фиксирование проблемы

Ваш лучший следующий шаг - удалить поля из Case, пока сериализация не улучшится. Возможно, что одно из ваших полей содержит то, что занимает много времени для сериализации: возможно, очень длинная строка, требующая чрезмерного ускорения? Как только вы выделите проблему сообщить об ошибке в проект Gson, и мы с радостью исправим проблему. Помимо включения кода, который воспроизводит проблему, вы также должны включать репрезентативные данные.