Table of Contents
Eksploracja Danych: Laboratorium 6
Przy interpretacji wyników zapoznaj się z treścią Wykładu 4: ogólny opis zagadnienia klasyfikacji oraz regresja logistyczna oraz Wykładu 5: naiwny mode Bayesa i drzewa decyzyjne
Prezentacja na YouTube
Zbiory danych
Archiwum ZIP zawierające zbiory danych Każdy ze zbiorów reprezentuje grupę dokumentów złożonych z n (n=10,5,3,1) zdań wybranych z pięciu powieści należących do kanonu polskiej literatury klasycznej.
Weka
- Aby włączyć przetwarzanie plików ARFF formacie UTF-8, w wywołaniu należy użyć opcji:
-Dfile.encoding=utf-8
- Pożądane jest także zwiększenie pamięci VM:
-Xmx3036M
String to Word Vect
Delimiters
.,;:'"()?!…—-*„”