Я делаю проект для класса колледжа, который я принимаю.
Я использую PHP для создания простого веб-приложения, которое классифицирует твиты как "позитивные" (или счастливые) и "негативные" (или печальные) на основе набора словарей. Алгоритм, о котором я сейчас думаю, - это классификатор Наивного Байеса или дерево решений.
Однако я не могу найти какую-либо библиотеку PHP, которая помогла бы мне сделать серьезную обработку языка. Python имеет NLTK (http://www.nltk.org). Есть ли что-то подобное для PHP?
Я планирую использовать WEKA в качестве задней части веб-приложения (вызывая Weka в командной строке из PHP), но это не кажется эффективным.
Есть ли у вас идеи, что я должен использовать для этого проекта? Или я должен просто переключиться на Python?
Спасибо