Как вычислить инверсию нормальной кумулятивной функции распределения в python?
Как вычислить обратную функцию кумулятивного распределения (CDF) нормального распределения в Python?
Какую библиотеку я должен использовать? Возможно, скудный?
Ответ 1
NORMSINV (упоминается в комментарии) является обратным к CDF стандартного нормального распределения. Используя scipy, вы можете вычислить это с помощью метода ppf объекта scipy.stats.norm. Аббревиатура ppf означает функция процентных точек, которая является другим именем функция квантильности.
In [20]: from scipy.stats import norm
In [21]: norm.ppf(0.95)
Out[21]: 1.6448536269514722
Убедитесь, что он является обратным для CDF:
In [34]: norm.cdf(norm.ppf(0.95))
Out[34]: 0.94999999999999996
По умолчанию norm.ppf использует среднее value = 0 и stddev = 1, что является стандартным нормальным распределением. Вы можете использовать другое среднее и стандартное отклонение, указав аргументы loc и scale, соответственно.
In [35]: norm.ppf(0.95, loc=10, scale=2)
Out[35]: 13.289707253902945
Если вы посмотрите на исходный код для scipy.stats.norm, вы обнаружите, что метод ppf в конечном итоге вызывает scipy.special.ndtri. Таким образом, чтобы вычислить инверсию CDF стандартного нормального распределения, вы можете использовать эту функцию напрямую:
In [43]: from scipy.special import ndtri
In [44]: ndtri(0.95)
Out[44]: 1.6448536269514722
Ответ 2
# given random variable X (house price) with population muy = 60, sigma = 40
import scipy as sc
import scipy.stats as sct
sc.version.full_version # 0.15.1
#a. Find P(X<50)
sct.norm.cdf(x=50,loc=60,scale=40) # 0.4012936743170763
#b. Find P(X>=50)
sct.norm.sf(x=50,loc=60,scale=40) # 0.5987063256829237
#c. Find P(60<=X<=80)
sct.norm.cdf(x=80,loc=60,scale=40) - sct.norm.cdf(x=60,loc=60,scale=40)
#d. how much top most 5% expensive house cost at least? or find x where P(X>=x) = 0.05
sct.norm.isf(q=0.05,loc=60,scale=40)
#e. how much top most 5% cheapest house cost at least? or find x where P(X<=x) = 0.05
sct.norm.ppf(q=0.05,loc=60,scale=40)