Spis treści

Tematy Projektów ZTB 2016

Celem projektu jest zbadanie rozwiązań typu big data, służących do przechowywania i przetwarzania danych w postaci szeregów czasowych. Dane takie powszechnie występują we wszelkich systemach sensorycznych, w tym w rozwiązaniach typu Internet of Things oraz aplikacjach Smart City.

Do obowiązków każdej z grup należeć będzie:

Harmonogram

FIXME TBD

Organizacja

Wymagania techniczne

OS

Bazowa konfiguracja powinna zostać uzgodniona pomiędzy wszystkimi grupami:

Technologie

Szczegóły zadań

Pobieranie danych

Do bazy danych należy ładować rzeczywiste dane o natężeniu ruchu z pętli indukcyjnych rozmieszczonych na ulicach Krakowa. Są one dostępne z sieci AGH pod adresem: http://borg.kis.agh.edu.pl/~wojnicki/traffic.php.

Dane zwracane są w formacie CSV, każda linijka zawiera:

Dane agregowane są co 90 sekund, przy czym nie ma gwarancji, że pętle działają synchronicznie.

CAUTC11FD318_D11_D1_1,11:59:31,0
CAUTC11FD318_D13_D2_11,11:59:31,14
CAUTC11FD318_D14_D2_21,11:59:31,8
CAUTC11FD318_D15_D3_1,11:59:31,0
CAUTC11FD318_D16_D4_11,11:59:31,9
CAUTC11FD318_D17_D4_21,11:59:31,5
CAUTC11FD318_D4_D22_11,11:59:31,7
CAUTC11FD318_D5_D22_21,11:59:31,14
CAUTC11FD318_D6_D44_11,11:59:31,11
CAUTC11FD318_D7_D44_21,11:59:31,3
K318_K1,11:59:31,0
K318_K2,11:59:31,22
K318_K3,11:59:31,0
K318_K4,11:59:31,18

Analityka

Należy zaimplementować następujące funkcje analityczne:

  1. wartość współczynnika korelacji pomiędzy dowolnie wybranymi dwoma detektorami,
  2. wykrywanie anomalii: problemy z działaniem sensora (przerwa w danych, dane nieprawdopodobne, inne).

Funkcje powinny umożliwić przeprowadzenie analizy dla zadanego jako parametr przedziału dat i godzin.

Fazy realizacji zadań „analitycznych”

  1. Zaprojektowanie algorytmu, zdefiniowanie pojęć, określenie wartości brzegowych.
  2. Dobór techniki implementacji przy uwzględnieniu przydzielonej grupie technologii.
  3. Implementacja i uruchomienie.
  4. Testy walidacyjne.
  5. Testy wydajnościowe.

Pomiary

Zmierzyć należy następujące wartości:

  1. Fizyczna zajętość miejsca.
  2. Czas realizacji procesów analitycznych.

W raporcie powinny się znaleźć wyniki dla danych obejmujących okres 1 miesiąca.

Raport końcowy

Każda z grup przedstawia raport końcowy, zawierający następujące elementy:

  1. Podział kompetencji pomiędzy członkami grupy.
  2. Krótka i zwięzła charakterystyka technologii, opis modelu danych, wymagań, dostępnych interfejsów.
  3. Opis wszystkich kroków niezbędnych do ponownego zbudowania klastra wraz ze wszystkimi modułami software'owymi.
  4. Opis modułu pobierającego dane i zasilającego bazę.
  5. Opis procedur analitycznych z uwzględnieniem wszystkich faz ich realizacji.
  6. Opis metodyki oraz wyników pomiarów.

Raporty winny być przygotowane w sposób przejrzysty i z uwzględnieniem struktury sekcji w jednym z formatów: LaTeX, Markdown, DokuWiki. Raporty przygotowane przy pomocy innych narzędzi nie będą przyjmowane.

Wyniki realizacji projektu będą prezentowane w terminie ostatniego wykładu (15 minut/grupa).