Tematy Projektów ZTB 2015

Technologie

Na każdym stanowisku należy zainstalować i skonfigurować następujące technologie.

System operacyjny:

Ubuntu 15.10.

Bazy danych:

Hadoop,
Riak,
CouchDB,
MongoDB,
Postgres-XC.

Każde stanowisko składa się z 2 komputerów pracujących w klastrze na poziomie technologii bazodanowych. Rodzaj klasteryzacji zależy od konkretnej technologii.

Każde stanowisko winno być połączone w klaster z dokładnie jednym, innym stanowiskiem.

Podział na grupy

10 grup, każda grupa 1 stanowisko tj. 2 komputery.

Dokumentacja

Dokumentacja wstępna przy rozpoczęciu projektu.

Lista studentów z podziałem na grupy.
Lista adresów MAC z informacją o grupie i nazwiskiem osoby odpowiedzialnej za konfiguracje stanowiska.

Dokumentacja finalna. Dla każdej z grup.

Opis sprzętu (CPU, dysk, RAM, sieć).
Opis konfiguracji OS.
Opis instalacji BD.
Opis konfiguracji BD, wraz z uzasadnieniem wyboru konkretnej metody klasteryzacji dla każdej z baz danych.
Opis, projekt i implementacja generatora ruchu dla eksperymentów.
Opis procesu przeprowadzania eksperymentów.
Interpretacja wyników eksperymentów.
Podział pracy pomiędzy członków grupy.

Wymagania dotyczące eksperymentów

Dane testowe weryfikujące wydajność rozwiązań muszą charakteryzować się co następuje.

Wolumen: przynajmniej 40 000 rekordów.
Pojedynczy rekord testujący zawiera następujące dane:
- date/timestamp, z dokładnością do 1ms,
- URI, wielkość 2kB,
- 4 wielkości całkowitoliczbowe, 64b każda,
- 4 wielkości zmiennoprzecinkowe, 64b każda,
- tekst, 32kB.

Wyniki:

ilość rekordów na sekundę
średni czas transmisji rekordu
mediana czasu transmisji rekordu
najkrótszy czas transmisji rekordu
najdłuższy czas transmisji rekordu
obciążenie I/O
obciążenie CPU
zajętość systemu plików w stanie stabilnym (po wykonaniu eksperymentu)

Eksperyment 1 (wo)

Zapis testowego strumienia danych do pustej bazy.
Zapis testowego strumienia danych do wypełnionej bazy (wolumen w bazie = wolumen testowy).
Należy przeprowadzić dla 1,2,4,8,16,32,64 współbieżnych połączeń.
Wolumen danych pozostaje stały tj. w bazie danych po zakończeniu eksperymentu ma być dokładnie tyle rekordów ile zostało zdefiniowanych jako wymagania dla eksperymentów (dla testów na pustej bazie), albo *2 dla testów na bazie wypełnionej.
Eksperyment musi wykorzystywać zalety związane z rozproszeniem bazy danych celem uzyskania maksymalnej wydajności (ilości rekordów na sekundę).

Eksperyment 2 (ro)

Odczyt liniowy testowych danych z bazy (cały wolumen).
Odczyt losowy z wykorzystaniem date/timestamp (cały wolumen).
Należy przeprowadzić dla 1,2,4,8,16,32,64 współbieżnych połączeń.
Dane w bazie pochodzą z eksperymentu 1.

Eksperyment 3 (rw)

Zapis testowego strumienia danych do wypełnionej bazy, wraz z współbieżnym odczytem.
Należy przeprowadzić dla 1,2,4,8,16,32,64 współbieżnych połączeń zapisujących i odczytujących (iloczyn kartezjański, razem: 49 eksperymentów)
Wolumen danych pozostaje stały tj. w bazie danych po zakończeniu eksperymentu ma być dokładnie tyle rekordów ile zostało zdefiniowanych jako wymagania dla eksperymentów *2.
Eksperyment musi wykorzystywać zalety związane z rozproszeniem bazy danych celem uzyskania maksymalnej wydajności (ilości rekordów na sekundę).

Igor Wojnicki's WIKI

Narzędzia użytkownika

Narzędzia witryny

Spis treści