Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
ed:lab_08 [2024/04/09 15:45] pszwed |
ed:lab_08 [2024/04/24 23:20] (current) pszwed [4. LogisticRegressionGrid - tworzenie tabeli ocen] |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== | + | ====== |
Celem jest budowa modelu regresji logistycznej pozwalającej przewidywać, | Celem jest budowa modelu regresji logistycznej pozwalającej przewidywać, | ||
Line 14: | Line 14: | ||
=== Zbiory danych === | === Zbiory danych === | ||
- | * {{ : | + | * {{ : |
* {{ : | * {{ : | ||
Line 88: | Line 88: | ||
</ | </ | ||
- | **2.** Regresja logistyczna wymaga, aby atrybutów wejściowe były typu numerycznego. | + | **2.** Regresja logistyczna wymaga, aby atrybutów wejściowe były typu numerycznego. |
* przekonwertuj datę za pomocą funkcji '' | * przekonwertuj datę za pomocą funkcji '' | ||
* Dodaj kolumnę '' | * Dodaj kolumnę '' | ||
Line 139: | Line 139: | ||
**3.** Zinterpretuj współczynniki równania regresji (napisz kod lub zamieść wykonane obliczenia). Pamiętaj, że timestamp jest wyrażony w sekundach. | **3.** Zinterpretuj współczynniki równania regresji (napisz kod lub zamieść wykonane obliczenia). Pamiętaj, że timestamp jest wyrażony w sekundach. | ||
- | Poniższe wyniki były wygenerowane | + | Poniższe wyniki były wygenerowane |
< | < | ||
Wzrost OcenaC o 1 zwiększa logit o 0.719097, a szanse zdania razy 2.052578 czyli o 105.257821% | Wzrost OcenaC o 1 zwiększa logit o 0.719097, a szanse zdania razy 2.052578 czyli o 105.257821% | ||
Line 242: | Line 242: | ||
===== 3. LogisticRegressionScores - ocena wyników ===== | ===== 3. LogisticRegressionScores - ocena wyników ===== | ||
- | Napisz funkcję | + | Napisz funkcję |
* dokona podziału na zbiór treningowy i testowy | * dokona podziału na zbiór treningowy i testowy | ||
Line 410: | Line 410: | ||
===== 4. LogisticRegressionGrid - tworzenie tabeli ocen ===== | ===== 4. LogisticRegressionGrid - tworzenie tabeli ocen ===== | ||
+ | Celem jest utworzenie tabeli ocen postaci, jak poniżej | ||
+ | |||
+ | < | ||
+ | +--------------+------+----------+--------+--------+ | ||
+ | | ImieNazwisko|OcenaC| | ||
+ | +--------------+------+----------+--------+--------+ | ||
+ | |' | ||
+ | |' | ||
+ | |' | ||
+ | |' | ||
+ | |' | ||
+ | |' | ||
+ | |' | ||
+ | |' | ||
+ | |' | ||
+ | |' | ||
+ | |||
+ | ... | ||
+ | </ | ||
+ | |||
+ | **Uwaga:** wynik może się nieco różnić w zależności od konfiguracji, | ||
+ | |||
+ | **1.** Wytrenuj klasyfikator na zbiorze '' | ||
+ | |||
+ | **2.** Napisz funkcje | ||
+ | |||
+ | <code java> | ||
+ | void addClassificationToGrid(SparkSession spark, LogisticRegressionModel lrModel) | ||
+ | </ | ||
+ | |||
+ | która: | ||
+ | * Wczyta zbiór danych '' | ||
+ | * Przetworzy daty, tak aby stały się wartościami numerycznymi | ||
+ | * Skonfiguruje VectorAssembler | ||
+ | * Wywoła funkcję predykcji zmiennej '' | ||
+ | * Usunie nadmiarowe kolumny | ||
+ | * Za pomocą funkcji '' | ||
+ | * Wyświetli wynik | ||
+ | * Zapisze w pliku '' |