Мне нужно разделить свои данные на тренировочный набор (75%) и набор тестов (25%). В настоящее время я делаю это с помощью кода ниже:
X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo)
Тем не менее, я хотел бы расслоить мой набор учебных материалов. Как мне это сделать? Я изучал метод StratifiedKFold
, но не позволял мне рассчитать 75%/25% и только стратифицировать набор учебных материалов.