Подтвердить что ты не робот

Значение ширины полосы в ggplot geom_smooth lm

Со следующим кодом:

library(ggplot2)
ggplot(mtcars, aes(x=wt, y=mpg)) +
    geom_point(aes(colour=factor(cyl))) +
    geom_smooth(method="lm")

Я могу получить этот сюжет:

enter image description here

Мой вопрос: как определяется серая зона? Каков смысл этого. И как я могу поиграть с различными параметрами, которые управляют шириной этой полосы?

4b9b3361

Ответ 1

По умолчанию это 95% -ный уровень доверительного интервала для прогнозов линейной модели ( "lm" ). В документации из ?geom_smooth указано, что:

Стат по умолчанию для этой геометрии stat_smooth см. в документации для получения дополнительных параметров для управления базовым статистическим преобразованием.

Копаем на один уровень глубже, doc из ?stat_smooth рассказывает нам о методах, используемых для вычисления более гладкой области.

Для быстрых результатов можно сыграть с одним из аргументов stat_smooth, который level: уровень доверительного интервала для использования (по умолчанию 0.95)

Передавая этот параметр geom_smooth, он передается в свою очередь на stat_smooth, поэтому, если вы хотите иметь более узкую область, вы можете использовать, например,.90 как уровень достоверности:

ggplot(mtcars, aes(x=wt, y=mpg)) +
    geom_point(aes(colour=factor(cyl))) +
    geom_smooth(method="lm", level=0.90)

enter image description here

Ответ 2

Это доверительный интервал. Вы можете использовать se=FALSE, если вы не хотите отображать его. Вы также можете использовать level = 0.99, если вы хотите иметь 99% CI вместо 95% CI. См. ?stat_smooth для всех деталей.