Подтвердить что ты не робот

Удалять данные, превышающие 95-й процентиль, в кадре данных

У меня есть такие данные:

ДФ:

Group   Point
A       6000
B       5000
C       1000
D        100
F        70

Прежде чем я нарисую этот df, мне остается только удалить значения, превышающие 95-й процентиль в моем фрейме данных. Любой орган скажет мне, как это сделать?

4b9b3361

Ответ 1

Используйте функцию quantile

> quantile(d$Point, 0.95)
 95% 
5800 

> d[d$Point < quantile(d$Point, 0.95), ]
  Group Point
2     B  5000
3     C  1000
4     D   100
5     F    70

Ответ 2

Или используя библиотеку dplyr:

> quantile(d$Point, 0.95)
 95% 
5800

> df %>% filter(Point < quantile(df$Point, 0.95))
  Group Point
1     B  5000
2     C  1000
3     D   100
4     F    70