Подтвердить что ты не робот

Преобразование CSV в ARFF с использованием weka

Я пытался получить этот набор данных http://archive.ics.uci.edu/ml/datasets/Communities+and+Crime+Unnormalized в Weka и вообще не повезло. Я преобразовал его в CSV, а затем загрузил его в Weka, а затем попытался преобразовать его в ARFF, но все же дал мне ошибку "attribute names are not unique".

Кроме того, нужно ли распространять набор учебных материалов из набора данных тестирования или сохранять их вместе?

4b9b3361

Ответ 1

Вы также можете использовать ArffViewer (Tools → ArffViewer или Ctrl + A). Затем откройте файл CSV.

Далее перейдите в Файл → Сохранить как... и выберите файлы данных Arff (следует выбрать по умолчанию).

Обратите внимание, что ваши поля должны быть разделены запятой, а не точкой с запятой.

Ответ 2

В WEKA реализованы некоторые преобразователи. Вот страницы API, относящиеся к этой теме: http://weka.sourceforge.net/doc.stable/weka/core/converters/package-summary.html

Например, вот как конвертировать из CSV в ARFF:

java -cp /path/to/weka.jar weka.core.converters.CSVLoader filename.csv > filename.arff

Ответ 3

Загрузите файл формата .CSV в this. Из вашего формата .CSV будет преобразован формат WEKA.arff. После того, как это сделано, выберите файл .arff в инструмент Weka. Теперь вы можете продолжить анализ данных.

Ответ 4

Вам нужны поля заголовка в csv. Вам нужно добавить attr0, attr1,..., метки в файл csv в первой строке.

Ответ 5

У меня не было проблем. Хорошо, сделайте следующее. На указанной вами веб-странице

  • скопируйте сегмент между "заголовком .arff для weka:" и "Relevant Papers".
  • вставьте его в .txt файл
  • откройте файл данных это местоположение
  • скопируйте экземпляры и добавьте их в ваш .txt файл сразу после раздела @data​​li >
  • сохранить файл .txt в виде файла .arff

Теперь вам хорошо идти.

Мне нужно создать набор учебных данных из набора данных тестирования или оставить их вместе?

Это зависит от вашего метода классификации. Если вы выберете 10-кратное резюме, оставьте их вместе. Если вы хотите использовать метод конвенции, отделите их. Опять же, все зависит от вашей методологии.

Ответ 7

Чтобы преобразовать формат .csv в формат .arff для использования в Weka. Примечание.. CSV файл должен быть правильным, иначе он не будет преобразован в .arff файл. Он не должен содержать нулевого значения в столбцах. Загрузите ящик ядра weka. В Eclipse → Настроить путь сборки, добавьте ядро ​​ядра weka и запишите следующую строку кода и выполните код:

CSVToArff.java

import weka.core.Instances;
import weka.core.converters.ArffSaver;
import weka.core.converters.CSVLoader;

import java.io.File;

public class CSVToArff {

   public static void main(String[] args) throws Exception {


    // load CSV
    CSVLoader loader = new CSVLoader();
    loader.setSource(new File("Provide the input file location (.csv) "));
    Instances data = loader.getDataSet();

    // save ARFF
    ArffSaver saver = new ArffSaver();
    saver.setInstances(data);
    saver.setFile(new File("Provide the output file location (.arff) ");
    saver.writeBatch();
    // .arff file will be created in the output location
  }
}

Ответ 8

Следующая команда не работает в случаях, когда CSV> 100 строк.

java -cp /path/to/weka.jar weka.core.converters.CSVLoader filename.csv > filename.arff

Ответ 9

работает

например: - C:\Users\User\Desktop > java -cp "e:\data\weka-3-6-10\weka.jar;." weka.core.converters.CSVLoader data1.csv → data1.arff 1. перед конверсией проверьте, что csv в excel, поскольку любая из ячеек не должна быть неправильной. 2. проверьте, что атрибуты находятся в правильном

для plain csv - u должен добавить строку заголовка, даже если x, y, z,... согласно потребности