====== Eksploracja Danych: Laboratorium 6 ====== {{ :med:ed-lab06.pdf | Opis zadań (PDF)}} Przy interpretacji wyników zapoznaj się z treścią {{:med:med-w04.pdf|Wykładu 4: ogólny opis zagadnienia klasyfikacji oraz regresja logistyczna}} oraz {{:med:med-w05.pdf|Wykładu 5: naiwny mode Bayesa i drzewa decyzyjne}} :!: Prezentacja na YouTube [[https://youtu.be/yTRGF94T-aM|Przetwarzanie wstępne danych, interpretacja wyników]] ===== Zbiory danych ===== {{:med:lab-4.zip| Archiwum ZIP zawierające zbiory danych}} Każdy ze zbiorów reprezentuje grupę dokumentów złożonych z n (n=10,5,3,1) zdań wybranych z pięciu powieści należących do kanonu polskiej literatury klasycznej. ===== Weka ===== *Aby włączyć przetwarzanie plików ARFF formacie UTF-8, w wywołaniu należy użyć opcji: ''-Dfile.encoding=utf-8'' *Pożądane jest także zwiększenie pamięci VM: ''-Xmx3036M'' ===== String to Word Vect ===== Delimiters .,;:'"()?!…—-*„”