Подтвердить что ты не робот

Графические базы данных по сравнению с тремя магазинами

Какой в ​​настоящее время лучший выбор для сохранения графоподобных структур? Графические базы данных (например, Neo4j) или трехмерные хранилища RDF (например, Virtuoso)?

Например, мы имеем следующий прецедент:

  • слабосвязный граф (аналогичный одному из научных работ в коллекции) с почти 10 М узлами;
  • довольно редкие обновления;
  • критические операции: получение определенных подграфов, обновление узлов в данном подграфе, повторное вычисление параметров анализа ссылок (например, HITS или PageRank) после обновления некоторых узлов.

Желательно также предоставлять стандартный API для запроса данных для сторонних приложений (a la Facebook или Twitter).

4b9b3361

Ответ 1

С Virtuoso у вас есть следующие работы для вас:

- SPARQL, SQL, SPASQL (SPARQL внутри SQL) и SQL внутри поддержки SPARQL (например, для работы с N-арными отношениями через предикаты/свойства magic/function.

- работает как компактный движок (например, эксплуатируется через KDE Desktop) или массивную СУБД, как показано через живой 17-битный трипс + LOD Cloud Cache или меньший экземпляр DBpedia.

- включает в себя полнотекстовое индексирование и текстовые шаблоны в SPARQL (через bif: contains), он также включает XPath/Xquery (через xcontains)

- Режим Acid или Non Acid ditto-Last при работе с Property Graph Store

- Через Transformation Middleware он может извлекать данные из 80 источников данных (включая API REST, SOAP-сервисы, ресурсы гиперссылки, ODBC или JDBC доступные реляционные источники данных и т.д.) и преобразовывать в графики переходных или постоянных связанных данных

- Публикация связанных данных выполняется автоматически, то есть после создания записей в СУБД у вас есть встроенные связанные страницы данных, которые в виде представлений в СУБД. Нет. Правила перезаписи URL, 303 перенаправления или что-то в этом роде. Интер-шкалы Super Keys просто работают!

Это на данный момент: -)

Ответ 2

Для горизонтальной шкалы (таким образом, базы данных малого и среднего размера) графические базы данных, такие как neo4j, в настоящее время дают лучшую производительность для обходов графиков. Тем не менее, Triplestores догоняют. Большим преимуществом Triple Store по сравнению с базой данных графа является то, что дампы данных и язык запросов стандартизированы, а это означает, что гораздо проще переходить на другой продукт и предотвращать блокировку поставщика.