Подтвердить что ты не робот

В чем разница между перекрестной проверкой и сеточным поиском?

Проще говоря, в чем разница между перекрестной проверкой и сеточным поиском? Как работает поиск по сетке? Должен ли я сделать сначала перекрестную проверку, а затем поиск по сетке?

4b9b3361

Ответ 1

Перекрестная проверка - это когда вы резервируете часть своих данных для использования при оценке вашей модели. Существуют разные методы перекрестной проверки. Концептуально самое простое - просто взять 70% (просто составив здесь число, оно не обязательно должно быть 70%) ваших данных и использовать их для обучения, а затем использовать оставшиеся 30% данных для оценки модели. спектакль. Причина, по которой вам нужны разные данные для обучения и оценки модели, заключается в защите от переоснащения. Конечно, существуют и другие (немного более сложные) методы перекрестной проверки, такие как перекрестная проверка в k-кратном порядке, которые часто используются на практике.

Поиск по сетке - это метод для оптимизации гиперпараметров, то есть метод для поиска наилучшей комбинации гиперпараметров (примером гиперпараметра является скорость обучения оптимизатора) для данной модели ( например, CNN) и тестовый набор данных. В этом сценарии у вас есть несколько моделей, каждая из которых имеет свою комбинацию гиперпараметров. Можно сказать, что каждая из этих комбинаций параметров, соответствующих одной модели, лежит в точке "сетки". Цель состоит в том, чтобы обучить каждую из этих моделей и оценить их, например, используя перекрестную проверку. Затем вы выбираете тот, который показал лучшие результаты.

Чтобы привести конкретный пример, если вы используете машину опорных векторов, вы можете использовать разные значения для gamma и C Так, например, вы могли бы иметь сетку со следующими значениями для (gamma, C): (1, 1), (0.1, 1), (1, 10), (0.1, 10). Это сетка, потому что она похожа на произведение [1, 0.1] для gamma и [1, 10] для C Grid-поиск в основном обучает SVM для каждой из этих четырех пар (gamma, C) значений, затем оценивает его с помощью перекрестной проверки и выбирает то, которое получилось лучше всего.

Ответ 2

Перекрестная проверка - это метод для надежной оценки производительности набора тестов (обобщения) модели. Grid-поиск - это способ выбрать лучшее из семейства моделей, параметризованное сеткой параметров.

Здесь под "моделью" я не подразумеваю обученный экземпляр, а скорее алгоритмы вместе с параметрами, такими как SVC(C=1, kernel='poly').

Ответ 3

Перекрестная проверка, простое разделение данных испытаний и тренировок и проверка результатов обучения с данными испытаний. Есть два метода перекрестной проверки, которые я знаю.

Во-первых, перекрестная проверка Test/Train. Расщепление данных как тест и тренировка.

Во-вторых, перекрестная проверка в k-кратном порядке разделяет ваши данные на k блоков, использует каждый блок в качестве данных тестирования, а остальные данные - в качестве обучающих данных и проверяет данные тестирования. Повторите процесс k раз. И получить среднюю производительность. K-кратная перекрестная проверка особенно полезна для небольших наборов данных, так как она максимизирует как тестовые, так и тренировочные данные.

Сеточный поиск; систематически прорабатывая множество комбинаций параметров, перекрестно проверяйте каждую и определяйте, какая из них дает наилучшую производительность. Вы можете работать с множеством комбинаций, лишь немного меняя параметры.

Ответ 4

Перекрестная проверка - это метод резервирования определенного подмножества вашего набора данных, для которого вы не обучаете модель. Позже вы протестируете свою модель на этом подмножестве, прежде чем завершите ее.

Основные шаги, которые необходимо выполнить для перекрестной проверки:

  1. Разделить весь набор данных в обучающих и тестовых наборах данных (например, 80% всего набора данных - это обучающий набор данных, а оставшиеся 20% - тестовый набор данных)

  2. Обучите модель, используя набор данных обучения

  3. Проверьте свою модель на тестовом наборе данных. Если ваша модель хорошо работает с тестовым набором данных, продолжайте процесс обучения

Есть и другие методы перекрестной проверки, например

  • Кросс-проверка по принципу "один-один-один" (LOOCV)

  • K-кратная перекрестная проверка

  • Стратифицированная К-кратная перекрестная проверка

  • Стратегии взаимной проверки состязательности (используются, когда наборы данных для обучения и отдыха в значительной степени отличаются друг от друга).

Ответ 5

Проще говоря, рассмотрите создание пасты как построение модели:

  • Перекрестная проверка - выбор количества макарон
  • Сетка поиска - выбор правильной пропорции ингредиентов.