Подтвердить что ты не робот

Как я могу получить все статьи о людях из Википедии?

Каким будет самый простой способ получить все статьи о людях из Википедии? Я знаю, что могу загрузить свалку всех страниц, но как я могу их фильтровать и получать только те, что есть у людей? Мне нужно столько, сколько я могу получить (желательно более миллиона), поэтому использование какого-либо API, вероятно, не является вариантом.

4b9b3361

Ответ 2

По состоянию на 2014 год у вас есть еще один вариант: Query WikiData для всех объектов, где свойство instance of (P31) имеет значение human (Q5).

Полный список людей: https://www.wikidata.org/wiki/Special:WhatLinksHere/Q5

Из этого списка отфильтруйте любую вещь, которая не имеет sex or gender (P21), чтобы избавиться от таких страниц, как "ученый"

Таким образом, вам не нужно отслеживать, какие шаблоны используются для людей во всех разных языковых версиях (есть 285) Википедии.