Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
ed:lab_01 [2024/03/06 17:06] pszwed [Join UsersTags] |
ed:lab_01 [2024/03/14 12:43] (current) pszwed [4.6 Join MoviesRatings] |
||
---|---|---|---|
Line 9: | Line 9: | ||
- | ===== Oprogramowanie ===== | + | ===== 1. Oprogramowanie ===== |
* JDK 17 (Spark jest kompatybilny z JDK 8, 11 i 17) | * JDK 17 (Spark jest kompatybilny z JDK 8, 11 i 17) | ||
Line 18: | Line 18: | ||
* Przyda się w przyszłości: | * Przyda się w przyszłości: | ||
- | ===== Projekt ===== | + | ===== 2. Projekt ===== |
Tworzymy projekt oparty na Mavenie, a następnie modyfikujemy '' | Tworzymy projekt oparty na Mavenie, a następnie modyfikujemy '' | ||
Line 155: | Line 155: | ||
</ | </ | ||
- | ===== Główna klasa i konfiguracja ===== | + | ===== 3. Główna klasa i konfiguracja ===== |
Napiszemy minimalistyczną klasę '' | Napiszemy minimalistyczną klasę '' | ||
Line 242: | Line 242: | ||
- | ===== Ładowanie i konwersja danych ===== | + | ===== 4. Ładowanie i konwersja danych ===== |
- | ==== Pliki ==== | + | ==== 4.1 Pliki ==== |
Wykorzystamy następujące pliki: | Wykorzystamy następujące pliki: | ||
Line 254: | Line 254: | ||
Ich opis zamieszczony jest na tej stronie: [[https:// | Ich opis zamieszczony jest na tej stronie: [[https:// | ||
- | ==== Users ==== | + | ==== 4.2 Users ==== |
<code java> | <code java> | ||
Line 333: | Line 333: | ||
ale tracimy np. kotrole nad opcją '' | ale tracimy np. kotrole nad opcją '' | ||
- | ==== Movies ==== | + | [[https:// |
+ | |||
+ | ==== 4.3 Movies ==== | ||
Dane o filmach zawierają niestrukturalne elementy: | Dane o filmach zawierają niestrukturalne elementy: | ||
Line 495: | Line 497: | ||
- | ==== Ratings ==== | + | ==== 4.4 Ratings ==== |
Załaduj dane z pliku '' | Załaduj dane z pliku '' | ||
Line 612: | Line 614: | ||
* as(Encoders.DOUBLE()) zamienia wiersze zbioru danych na obiekt wskazanego typu | * as(Encoders.DOUBLE()) zamienia wiersze zbioru danych na obiekt wskazanego typu | ||
- | ==== Tags ==== | + | ==== 4.5 Tags ==== |
**1.** Załaduj plik '' | **1.** Załaduj plik '' | ||
Line 684: | Line 686: | ||
- | ==== Join MoviesRatings ==== | + | ==== 4.6 Join MoviesRatings ==== |
**1.** Załaduj plik '' | **1.** Załaduj plik '' | ||
Line 774: | Line 776: | ||
+-------+--------------------+--------------------+----+------+-------+------+-------------------+----------------------+ | +-------+--------------------+--------------------+----+------+-------+------+-------------------+----------------------+ | ||
</ | </ | ||
+ | |||
+ | :!: **Powtarzające się nazwy kolumn?** Po poperacji join: | ||
+ | <code java> | ||
+ | df_mr = df_mr.drop(df_ratings.col(" | ||
+ | </ | ||
+ | |||
+ | |||
**2.** Pobierz listę wartości i wyświetl histogram.\\ | **2.** Pobierz listę wartości i wyświetl histogram.\\ | ||
Line 864: | Line 873: | ||
- | ==== Join MoviesRatingsGenres ==== | + | ==== 4.7 Join MoviesRatingsGenres ==== |
Jesteśmy zainteresowani informacjami o ocenach dla gatunków filmów. | Jesteśmy zainteresowani informacjami o ocenach dla gatunków filmów. | ||
Line 981: | Line 990: | ||
- | ==== Join UsersTags ==== | + | ==== 4.8 Join UsersTags ==== |
**1.** Wczytaj dane użytkowników do zbioru '' | **1.** Wczytaj dane użytkowników do zbioru '' | ||
Line 1032: | Line 1041: | ||
- | ==== Join UsersRatings ==== | + | ==== 4.9 Join UsersRatings ==== |
**1.** Wczytaj dane użytkowników do zbioru '' | **1.** Wczytaj dane użytkowników do zbioru '' | ||
Line 1059: | Line 1068: | ||
* współrzędna y odpowiada kolumnie | * współrzędna y odpowiada kolumnie | ||
- | Jako alternatywa - możesz wyświetlić histogram | + | |
{{ : | {{ : | ||
+ | Jako alternatywę - możesz wyświetlić histogram | ||
- | ===== Sprawozdania ===== | + | ===== 5. Sprawozdania ===== |
* Tworzymy dokument ze zrzutami ekranu i fragmentami wyjścia, konwertujemy go do PDF | * Tworzymy dokument ze zrzutami ekranu i fragmentami wyjścia, konwertujemy go do PDF | ||
+ | * W dokumencie dodajemy tytuły sekcji z numeracją, czyli np. **4.9 Join UserRatings** | ||
* Przesyłamy skompresowany kod projektu | * Przesyłamy skompresowany kod projektu | ||