Tematy Projektów ZTB 2015
Technologie
Na każdym stanowisku należy zainstalować i skonfigurować następujące technologie.
System operacyjny:
Bazy danych:
Hadoop,
Riak,
CouchDB,
MongoDB,
Postgres-XC.
Każde stanowisko składa się z 2 komputerów pracujących w klastrze na poziomie technologii bazodanowych.
Rodzaj klasteryzacji zależy od konkretnej technologii.
Każde stanowisko winno być połączone w klaster z dokładnie jednym, innym stanowiskiem.
Podział na grupy
10 grup, każda grupa 1 stanowisko tj. 2 komputery.
Dokumentacja
Dokumentacja wstępna przy rozpoczęciu projektu.
Lista studentów z podziałem na grupy.
Lista adresów MAC z informacją o grupie i nazwiskiem osoby odpowiedzialnej za konfiguracje stanowiska.
Dokumentacja finalna.
Dla każdej z grup.
Opis sprzętu (CPU, dysk, RAM, sieć).
-
Opis instalacji BD.
Opis konfiguracji BD, wraz z uzasadnieniem wyboru konkretnej metody klasteryzacji dla każdej z baz danych.
Opis, projekt i implementacja generatora ruchu dla eksperymentów.
Opis procesu przeprowadzania eksperymentów.
Interpretacja wyników eksperymentów.
Podział pracy pomiędzy członków grupy.
Wymagania dotyczące eksperymentów
Dane testowe weryfikujące wydajność rozwiązań muszą charakteryzować się co następuje.
Wyniki:
ilość rekordów na sekundę
średni czas transmisji rekordu
mediana czasu transmisji rekordu
najkrótszy czas transmisji rekordu
najdłuższy czas transmisji rekordu
obciążenie I/O
obciążenie CPU
zajętość systemu plików w stanie stabilnym (po wykonaniu eksperymentu)
Eksperyment 1 (wo)
Zapis testowego strumienia danych do pustej bazy.
Zapis testowego strumienia danych do wypełnionej bazy (wolumen w bazie = wolumen testowy).
Należy przeprowadzić dla 1,2,4,8,16,32,64 współbieżnych połączeń.
Wolumen danych pozostaje stały tj. w bazie danych po zakończeniu eksperymentu ma być dokładnie tyle rekordów ile zostało zdefiniowanych jako wymagania dla eksperymentów (dla testów na pustej bazie), albo *2 dla testów na bazie wypełnionej.
Eksperyment musi wykorzystywać zalety związane z rozproszeniem bazy danych celem uzyskania maksymalnej wydajności (ilości rekordów na sekundę).
Eksperyment 2 (ro)
Odczyt liniowy testowych danych z bazy (cały wolumen).
Odczyt losowy z wykorzystaniem date/timestamp (cały wolumen).
Należy przeprowadzić dla 1,2,4,8,16,32,64 współbieżnych połączeń.
Dane w bazie pochodzą z eksperymentu 1.
Eksperyment 3 (rw)
Zapis testowego strumienia danych do wypełnionej bazy, wraz z współbieżnym odczytem.
Należy przeprowadzić dla 1,2,4,8,16,32,64 współbieżnych połączeń zapisujących i odczytujących (iloczyn kartezjański, razem: 49 eksperymentów)
Wolumen danych pozostaje stały tj. w bazie danych po zakończeniu eksperymentu ma być dokładnie tyle rekordów ile zostało zdefiniowanych jako wymagania dla eksperymentów *2.
Eksperyment musi wykorzystywać zalety związane z rozproszeniem bazy danych celem uzyskania maksymalnej wydajności (ilości rekordów na sekundę).