Подтвердить что ты не робот

Как найти корреляцию между двумя целыми массивами в java

Я много ищу, но не могу найти именно то, что мне нужно до сих пор. У меня есть два целочисленных массива int[] x и int[] y. Я хочу найти простую линейную корреляцию между этими двумя целочисленными массивами, и она должна вернуть результат как double. В Java вы знаете какую-либо библиотечную функцию, обеспечивающую этот или любой фрагмент кода?

4b9b3361

Ответ 1

Корреляция довольно легко вычисляется вручную:

http://en.wikipedia.org/wiki/Correlation_and_dependence

  public static double Correlation(int[] xs, int[] ys) {
    //TODO: check here that arrays are not null, of the same length etc

    double sx = 0.0;
    double sy = 0.0;
    double sxx = 0.0;
    double syy = 0.0;
    double sxy = 0.0;

    int n = xs.length;

    for(int i = 0; i < n; ++i) {
      double x = xs[i];
      double y = ys[i];

      sx += x;
      sy += y;
      sxx += x * x;
      syy += y * y;
      sxy += x * y;
    }

    // covariation
    double cov = sxy / n - sx * sy / n / n;
    // standard error of x
    double sigmax = Math.sqrt(sxx / n -  sx * sx / n / n);
    // standard error of y
    double sigmay = Math.sqrt(syy / n -  sy * sy / n / n);

    // correlation is just a normalized covariation
    return cov / sigmax / sigmay;
  }

Ответ 2

В ядре Java нет ничего. Есть библиотеки, которые вы можете использовать. Apache Commons имеет статистический проект, проверьте класс PearsonCorrelation.

Пример кода:

public static void main(String[] args) {
    double[] x = {1, 2, 4, 8};
    double[] y = {2, 4, 8, 16};
    double corr = new PearsonsCorrelation().correlation(y, x);

    System.out.println(corr);
}

выводит 1.0