Tematy prac magisterskich

2025

Tematy (2) i (5) w wersji rozszerzonej ze strony https://home.agh.edu.pl/~pszwed/wiki/doku.php?id=tematy_prac_inzynierskich
Predykcja nateżenia ruchu dla danych ruchu dla danych PEMS (California). z wykorzystaniem sieci neuronowych (Transformers/Informers/Grafowe)
Zbiór https://www.nyc.gov/site/tlc/about/tlc-trip-record-data.page Symulacja wynajmu taksówek (czas i przestrzeń) oraz algorytm optymalizacji miejsca oczekiwania. Typowo, reinforcment learning. Algorytm podejmuje decyzje, w którą stronę powinna przemieszczać się wolna taksówka. Do rozważenia wersja indywidualna (maksymalizacja liczby przewozów taksówkarza) albo zbiorowa (maksymalizacja zysku firmy zatrudniającej wielu taksówkarzy)
Zbiór https://www.nyc.gov/site/tlc/about/tlc-trip-record-data.page uzupełniony danymi geograficznymi POI. Algorytm dobierający optymalną lokalizację stacji parkowania (i ładowania) dla Car sharing.

2024

Zastosowanie algorytmu genetycznego do selekcji modelu sieci neuronowej . Populacja składa się z pewnej liczby modeli sieci neuronowych. Projekt operacji mutacji (zazwyczaj zmiana parametrów warstwy) i krzyżowania (zmienia się układ warstw). Ze względu na konieczność wykonania większej liczby iteracji - proponowana jest platforma rozproszona Ray. [Zarezerwowane M.K.]
Wykrywanie anomalii w danych o przelotach [Zarezerwowane M.S.]
Algorytm do rozwiązywania problemu QAP na Cuda [Zarezerwowane Ł.S]
CarShraing [Zarezerwowane D.K.]
Traffic Prediction Using Neural Networks [Zarezerwowane T.T.]

2023

Na razie szkic

[Zarezerwowane A.P] Budowa i uczenie ChatBota https://chatterbot.readthedocs.io/en/stable/index.html. Uczenie na podstawie plików z napisami do filmów. Web scraping plików z napisami. Prosta aplikacja, np. Dash demonstrująca jego działanie
[Zarezerwowane B.B.] Uczenie zespołowe z wykorzystaniem platformy ray.io. Np. dla zagadnienia klasyfikacji. Budujemy zbiór równolegle uczonych klasyfikatorów C, a następnie podczas predykcji agregujemy wyniki (głosowanie). W pracy należy przetworzyć kilka zbiorów danych. Należy porównać działanie dla wybranych podzbiorów zbioru C. Dany klasyfikator “widzi” tylko części zbioru. Przetestujemy różne podziały - zachowujące częstości wystąpienia klas i ukierunkowane na wybieranie części klas. Testujemy także podział: klasa A i inne. Sklasyfikowane jako “inne” trafiają do kolejnego klasyfikatora. Kontynuujemy tworząc łańcuch…
Zastosowanie algorytmu XYZ [PSO-roju cząstek lub ACO - mrówkowy lub ABC - pszczeli] w procesie wyboru cech opartym na metodzie zbiorów przybliżonych. Praca powinna zawierać przegląd zagadnień związanych ze zbiorami przybliżonymi (rough sets) i ich zastosowaniem do wyboru cech. RS dzielą przestrzeń na 3 podzbiory - elementów które należą do zbioru, te które nie należą i podzbiór brzegowy - elementów co do których nie ma pewności. W procesie wyboru cech usuwane są te atrybuty, które nie modyfikują tego podziału. Zazwyczaj potrzebny jest algorytm optymalizacyjny, które sprawdzi różne kombinacje. A więc z XYZ należy podstawić jakiś znany algorytm (metaheurystykę) dla zagadnień dyskretnych. Klasycznym rozwiązaniem jest alg. genetyczny. Dodatkową modyfikacją ma być zmiana w relacji nierozróżnialności. Zamiast równości atrybutu, spełnienie predykatu.
[Zarezerwowane M.M.] Ustalanie autorstwa/stylu obrazów. W pracy należy zgromadzić przykłady obrazów różnych artystów reprezentujących różne style. Stosujemy dwie etykiety - autor i styl. Następnie generujemy wycinki obrazów i trenujemy klasyfikator z funkcją straty agregującą autora i styl. Klasyfikator jest uczony na wycinkach obrazów (mniej więcej w stylu laboratorium dotyczącego augmentacji danych z Comp Intelligence). Zastosujemy transfer learning (z douczaniem i bez).
[Zarezerwowane P.W.] Autorstwo utworów muzycznych. Przygotowujemy kilka zestawów danych wewnątrz gatunków, np. muzyka klasyczna, pop, rock, klubowa, disco-polo, k-pop, itp. W ramach tch gatunków należy rozpoznać autora (zespół). Ponieważ współczesne utwory muzyczne są produktem poddanym mocnej obróbce dźwiękowej, można przypuszczać, że nowsze gatunki będą słabiej rozróżnialne. Do ekstrakcji cech wykorzystywana jest librosa. Na ten temat było laboratorium z Eksploracji danych dla specjalności IO.
Zastosowanie rozmytych map kognitywnych do klasyfikacji szeregów czasowych. Rozmyte mapy kognitywne są porównywalne z rekurencyjnymi sieciami neuronowymi https://en.wikipedia.org/wiki/Fuzzy_cognitive_map. Użyjemy mapy kognitywnej wyższego stopnia, która będzie pamiętała k poprzednich wartości. Liczba węzłów wyjściowych odpowiada liczbie klas. Mapa ma przetwarzać ciągi róznej długości (bez wyrównania). Należy przetestować kilkanąscie jedno i wielowymiarowych zbiorów danych dla różnych stopni mapy. Platforma TensorFlow i zastosowanie gradientowego algorytmu uczenia mapy.

2022

1. Detekcja anomalii na nagraniach z rejestratorów lotniczych (MP ?)

2. Klasyfikacja szeregów czasowych (MW ?)

3. Zastosowanie rozmytych map kognitywnych do predykcji natężenia ruchu drogowego

Zarezerwowane MO

Rozmyte mapy kognitywne (ang. Fuzzy Cognitive Maps - FCM) są bliskie rekurencyjnym sieciom neuronowym. Celem pracy jest opracowanie i przebadanie algorytmu, który będzie automatycznie budował model dla wielowymiarowych danych z pomiarami natężenia ruchu drogowego w sieci autostrad. Źródłem danych będzie system PEMS.

4. Estymacja gęstości prawdopodobieństwa dla danych komunikacyjnych

Zarezerwowane K.P.

Standardowe metody estymacji prawdopodobieństwa (ang. Kernel Density Estimation) opisane są w Wikipedii. Implementowane są przez wiele pakietów do wizualizacji map, np.. https://geopandas.org/en/stable/gallery/plotting_with_geoplot.html Są to na ogół estymacje na podstawie odległości euklidesowej od punktów w przestrzeni R2. Celem pracy będzie opracowanie oprogramowania, który będzie estymowało gęstość w sieci drogowej - z uwzględnieniem rzeczywistej odległości pomiędzy odcinkami dróg. Źródłem danych mapy ma być OSM. Do ewentualnego wykorzystania moduł pgRouting lub własna implementacja algorytmu typu A*.

5. Grupowanie i predykcja dla danych komunikacyjnych z systemu Car Sharing

Zarezerwowane KR

Podstawowe dane systemu to miejsca parkowania samochodów, interakcje użytkowników z systemem oraz przejazdy. Dane te są rejestrowane w pewnym obszarze (np.. granice miasta Krakowa). Celem pracy jest dobór lub opracowanie algorytmu grupowania hierarchicznego, który zapewni podział wyjściowego obszaru na podobszary odpowiadające grupom blisko położonych danych. Kryterium walidacyjnym ma być maksymalizacji efektywności predykcji wartości wyjściowych (podział jest lepszy, jeżeli uśrednione współczynniki predykcji są lepsze).

Predykcja działa zupełnie nieźle dla dzielnic, ale duże dzielnice są dość niejednorodne.

6. Optymalizacja miejsc parkowania pojazdów w systemie Car Sharing

Celem pracy jest opracowanie i przebadanie algorytmu, który będzie podpowiadał decyzje o relokacji zaparkowanych pojazdów w celu lepszego zaspokojenia zapotrzebowania na pojazdy.

7. Hybrydowe metoda optymalizacji ciągłej

Zarezerwowane MS

Celem pracy jest opracowanie i przebadanie hybrydowego populacyjnego algorytmu optymalizacji. Jego ideą jest podział procesu optymalizacji na epoki, podczas których nieprzerwanie wykonywana jest określona liczba iteracji algorytmu o pewnej konfiguracji. Po zakończeniu epoki jej populacja przechodzi do następnej epoki, w której następuje wybór innego algorytmu/konfiguracji. Wybór następuje z pewnym prawdopodobieństwem, które zmienia się w zależności od oceny algorytmu/konfiguracji w poprzedniej epoce.

8. Agentowa/inspirowane biologicznie metoda poprawy efektywności optymalizacji (lokalnej)

Rezerwacja A.Z.

Celem pracy jest opracowanie metody optymalizacji lokalnej (np. dla algorytmu pszczelego) zainspirowanej zachowaniem organizmów. Atrybutem agenta jest rozwiązanie. Agenci przeszukują swoją przestrzeń lokalną wykonując kilkanaście zakodowanych podstawowych operacji. Na przykład dla optymalizacji ciągłej może być to losowy skok na pewną odległość, ruch naprzód, cofnięcie się, itp. Wybór operacji dokonywany jest losowo i zależy od genotypu. Blisko położone osobniki mogą się rozmnażać - tworzony jest nowy i następuje losowe krzyżowanie genów.

9. Algorytm rekomendacji filmów (?)

Zarezerwowane PT

Na podstawie danych z MovieLens rozszerzonych o dane zawarte w TMDB: plakat, opis fabuły, informacje o obsadzie, itp. Wykorzystanie sieci konwolucyjnych do przetwarzania posteru oraz LSTM (lub podobnych) do opisu fabuły. Do rozważenia warstwy embedding.

10. Klasteryzacja danych z TMDB

Zarezerwowane BK

Należy je pobrać - sortując według popularności. Liczba filmów do ustalenia Wykorzystać dane tekstowe, plakat, informacje o obsadzie, gatunkach. Zdefiniować (stratny) autoenkoder, który pozwoli zredukować wymiar wektora cech. Plakatu oczywiście nie odtwarzamy. Przeprowadzić grupowanie w zredukowanej przestrzeni (k-means lub inne algorytmy, do rozważenia fuzzy c-means ) Zweryfikować jakość grupowania, stosując metrykę typu Vmeasure z użyciem informacji o gatunkach.

11. Przewidywanie cen nieruchomości (?)

Zarezerwowane KŻ

Web scraping danych z serwisu (gratka/otodom?).
Próba odrzucenia duplikatów
Próba ustalenia przybliżonej lokalizacji (np. na podstawie pojawiających się w opisach nazw ulic - mapa OSM)
budowa cech (dane strukturalne i niestrukturalne na podstawie opisu)
sieć konwolucyjna dla zdjęć

12. Ostatni slot

Przewidywanie sposobu wykorzystania terenu (ang. landuse) na podstawie zdjęć satelitarnych i danych OSM. Pobieranie zdjęć satelitarnych (Google?). Etykietowanie za pomocą danych OSM. Nanoszenie na obraz maski (obszarów ze znanymi etykietami). Zastosowanie algorytmów segmentacji opartych na sieciach neuronowych.
Przygotowanie zbioru danych do rozpoznawania twarzy (na podstawie sekwencji wideo). Następnie użycie / dotrenowanie sieci typu OpenFace. Rozpoznawanie na klatkach wideo z wieloma twarzami.
Symulacja deepfake. Celem jest zamiana twarzy na sekwencji wideo. (1) Rozpoznawanie punktów charakterystycznych - landmarków na dwóch zdjeciach A - oryginalnym i B - fałszywym (2) transformacja zdjęcia B zgodnie ze przesunięciami na A (3) Wygładzanie B - filtry i sieć GAN (4) Nałozenie B na oryginalne zdjęcie w miejsce A
Ekstrakcja relacji z tekstów. Relacje pomiędzy zidentyfikowanymi terminami (ang. Named entity).

2021

Generacja widoków ontologii Ontologie przechowują informacje o klasach relacjach pomiędzy klasami, atrybutach oraz instancjach klas. Można w dużym uproszczeniu traktować je jako połączenie diagramu klas i obiektów UML.

Widok ontologii jest jej podzbiorem zachowującym relacje (oryginalne lub wywiedzione - ang. inferred). Czyli, jeżeli np. mamy dziedziczenie A←B←C, a z widoku usuwamy B, to powinniśmy otrzymać A←C. Podobne zależności dotyczą asocjacji.

System rekomendacji

Przetwarzanie zbioru danych MovieLens, w którym rekomendacje użytkownika mają pieczątki czasowe
Rekomendacje są traktowane jak sekwencje - analogiczne do sekwencji słów w tekście
Zastosowanie opublikowanych/dostępnych w postaci kodu algorytmów generacji tekstu wykorzystujących sieci neuronowe typu LSTM lub Transformer
Ocena trafności przewidywań

Federacyjne uczenie maszynowe Teoretycznie wygląda takhttps://ai.googleblog.com/2017/04/federated-learning-collaborative.html lub https://en.wikipedia.org/wiki/Federated_learning ale raczej chodzi tu o przeprowadzenie eksperymentów symulujących FL

Wybieramy obszerny zbiór danych, np. ImageNet z obrazkami psów, kotów, fok i niedźwiedzi polarnych
Dzielimy na grupy użytkowników/agentów - jedni widzą psy i koty, drudzy foki i niedźwiedzie polarne
Dla każdego użytkownika losujemy część danych i uczymy - np. sieć neuronową
Użytkownicy “przesyłają” modele na serwer - tak naprawdę oznacza to etap agregacji
- Agregujemy modele w jeden
Odsyłamy do użytkowników
Oni uczą się dalej na nowych przykładach
I w zasadzie nie powinniśmy przerywać….

Interesujące są następujące kwestie:

Czy jest szansa na agregację (psów,kotów) oraz (fok,niedźwiedzi), czy może potrzebne są także modele (kot,foka)?
Czy taki model z czasem poprawia się, wchodzi w overfitting?
Czy jest potrzebny kompromis pomiędzy wielkością modelu (wielkość danych przesyłanych w systemie) a dokładnością
Jak często należy modele agregować? Co ile epok/iteracji/itd.

Predykcja szeregów czasowych na przykładzie danych ruchu drogowego PEMS

Metryki podobieństwa symulacji

2020

1. Generacja widoków ontologii Ontologie przechowują informacje o klasach relacjach pomiędzy klasami, atrybutach oraz instancjach klas. Można w dużym uproszczeniu traktować je jako połączenie diagramu klas i obiektów UML.

Widok ontologii jest jej podzbiorem zachowującym relacje (oryginalne lub wywiedzione - ang. inferred). Czyli, jeżeli np. mamy dziedziczenie A←B←C, a z widoku usuwamy B, to powinniśmy otrzymać A←C. Podobne zależności dotyczą asocjacji.

2. Ustalanie autorstwa tekstów Zarezerwowane J.R. Celem pracy jest zastosowanie sieci neuronowych do ustalania autorstwa tekstów. Problem należy traktować jako zagadnienie klasyfikacji. Mamy próbki tekstu różnych autorów i budujemy klasyfikator potrafiący odróżnić je od siebie.

Przewiduje się ekstrakcję klasycznych cech stosowanych przy określaniu autorstwa:

częstych słów
statystyk znaków
tagowania części mowy
n-gramów znakowych
ale także bezpośrednie wyodrębnianie cech przez zastosowanie sieci konwolucyjnych.

https://www.researchgate.net/publication/317617809_Stylometric_Features_for_Authorship_Attribution_of_Polish_Texts

3. Analiza danych geograficznych - grupowanie Zarezerwowane A.D. Celem pracy jest przeprowadzenie grupowania obszarów geograficznych na podstawie takich cech, jak gęstość dróg, obecność obiektów określonego typu (budynki, instytucje, infrastruktura, zakłady pracy, rzeki, jeziora, itp).

źródło danych: mapa OSM dla Polski zaimportowana do PostgreSQL
ekstrakcja cech (raczej za pomocą procedur składowanych wykorzystujących PostGIS)
przygotowanie plików CSV
zastosowanie bibliotecznych algorytmów grupowania (platforma Python/scikit-learn)

https://www.researchgate.net/publication/333406466_Speed_Limits_Can_Be_Determined_from_Geospatial_Data_with_Machine_Learning_Methods

4. Analiza obrazów zastosowana do map zarezerwowane

Do rozwinięcia:

Użycie konwolucyjnych sieci neuronwuych (TensorFlow i keras)
Analiza map (obrazów) z serwera OSM lub wygenerowanych lokalnie o wybranej skali
Próba oszacowania ograniczeń prędkości (klasyfikacja)

https://www.researchgate.net/publication/333406466_Speed_Limits_Can_Be_Determined_from_Geospatial_Data_with_Machine_Learning_Methods

W odrożnieniu od poprzedniego tematu przetwarzana jest grafika.

5. Analiza danych z web scrapingu zarezerwowane P.B.

Do rozwinięcia. Np. web scraping ofert sprzedaży mieszkań i zastosowanie regresji do porównywania cen w danej miejscowości. Zastosowanie kilku metod regeresji z biblioteki scikit-learn oraz sieci neuronowych. Także analiza zdjęć towarzyszących ofercie.

6. System rekomendacji

Przetwarzanie zbioru danych MovieLens, w którym rekomendacje użytkownika mają pieczątki czasowe
Rekomendacje są traktowane jak sekwencje - analogiczne do sekwencji słów w tekście
Zastosowanie opublikowanych/dostępnych w postaci kodu algorytmów generacji tekstu wykorzystujących sieci neuronowe typu LSTM lub Transformer
Ocena trafności przewidywań

2019

Ze względu na możliwość przekroczenia limitów godzin dydaktycznych do ustalenia zajęć około 25 września tematy nie będą proponowane (poza osobami, które już je uzgodniły).

Tematy do realizacji 2018/2019

Brak wolnych miejsc w roku 2018/2019

Optymalizacja (kilka tematów prac do uzgodnienia)

Algorytmy optymalizacji ciągłej: mrówkowe, pszczele, PSO (wraz z modyfikacjami). Funkcje celu CEC. Implementacje na różnych platformach: CUDA, TensorFlow (python), OpenCL, Nd4j
Zastosowanie automatów komórkowych do optymalizacji (ciągłej?/dyskretnej?). W praktyce byłoby to wykorzystanie rozwiązań z algorytmu populacyjnego, ale interesujące będzie przebadanie różnych topologii sąsiedztwa i reguł uaktualniania stanów

Uczenie maszynowe

Odkrywanie reguł decyzyjnych za pomocą algorytmów optymalizacyjnych - optymalizacja przesłanek i kolejności reguł
Przetwarzanie danych (klasyfikacja) wprowadzonych przez grupę (crowdsourcing) https://data.world/datasets/crowdsourced
Rozpoznawanie klawiszy na podstawie zarejestrowanych dźwięków (klawiatura leżąca na stole)
Rozpoznawanie klawiszy na podstawie wskazań czujników w komórce (np. akcelerometr)

Tematy do realizacji 2017/2018

Szkic

Pobieranie danych ze stron internetowych metodą rozpoznawania obrazów data scraping (np. należy pobrać informacje o cenach i towarach na stronie: zapisz obraz strony, wykryj układ, zastosuj OCR do poszczgólnych regionów)
Ro(botyzacja). Zastąpienie działania użytkownika systemu botem posługującym się interfejsem użytkownika (pobierz dane z pola aplikacji, wykonaj na nich operację, zapisz wartości w innym okienku/polu aplikacji).
Algorytm rzutowania ścieżek GPS na mapę (map matching). Implementacja w języku plpgSQL (Postgres + PostGIS)
Rekomendacja treści z wykorzystaniem charakterystyk czasowych (na przykładzie zbiorów danych MovieLens, Netflix, itp)
Algorytm mrówkowy, zastosowanie do optymalizacji ciągłej, testy na funkcjach CEC 2015/2017, implementacja z użyciem nd4j lub na GPU
Agentowy (“rozproszony”) system klasyfikacji. Melanż Akka (system agentowy) + Weka (biblioteka uczenia maszynowego).

Tematy do realizacji w roku 2016/2017

Uwaga w roku 2016/2017 brak wolnych tematów

Temat	1. Implementacja systemu umożliwiającego generację widoków ontologii Zajęty
Cel	Dla uproszczenia: ograniczymy się do ontologii odpowiadających diagramom klas. Często ontologie zawierają setki lub tysiące klas. W wielu zastosowaniach, np.: wnioskowania, taka reprezentacja jest nadmiarowa i prowadzi do znacznego zwiększenia czasu przetwarzania. W rzeczywistości używa się kilkunastu klas i relacji. Widok ontologi to jej podzbiór obejmujący wybrane klasy, atrybuty (datatype property) i relacje. Celem pracy jest 1) opracowanie prostego języka specyfikacji widoków 2) realizacja systemu (biblioteki), który będzie takie widoki budował (3) przeprowadzenie testów
Platforma implementacji	Java + biblioteka Jena lub OWL API
Kwalifikacje dyplomanta	Znajomość języka Java. Pożądana znajomość zagadnień Semantic Web

Temat	2. Analiza strumieni danych pomiarowych z wykorzystaniem platformy MOA Zajęte
Cel	MOA http://moa.cms.waikato.ac.nz/getting-started/ jest platformą oferującą różne funkcje data mining dla strumieni danych (klasyfikacja, klasteryzacja, uczenie). Celem pracy jest przeprowadzenie predykcji zapotrzebowania na energię na podstawie symulowanych danych pomiarowych. W ramach pracy należy też część danych wygenerować.
Platforma implementacji	Java + MOA + Weka
Kwalifikacje dyplomanta	TBD

Temat	3. Analiza strumienia wiadomości tekstowych z wykorzystaniem platformy MOA Zarezerwowany
Cel	MOA http://moa.cms.waikato.ac.nz/getting-started/ jest platformą oferującą różne funkcje data mining dla strumieni danych (klasyfikacja, klasteryzacja, uczenie). Celem pracy jest przeprowadzenie klasyfikacji strumienia krótkich wiadomości tekstowych. Źródło - do ustalenia
Platforma implementacji	Java + MOA + Weka
Kwalifikacje dyplomanta	TBD

Temat	4. Wyznaczanie i wnioskowanie o rozmytych relacjach na mapie Zajęty
Cel	Celem pracy jest realizacja platformy pozwalającej na wyznaczanie, przechowywanie w formie zmaterializowanej rozmytych relacji opisujących obiekty mapy. Relacje rozmyte mają wartości z przedziału [0,1] (0=false, 1=true) Przykładem relacji jest blisko, np. `blisko(Kraków, Zakopane)`. Wartość tej relacji zależy od kontekstu (blisko w skali kraju, ale raczej daleko w skali województwa). Jest to kontynuacja wcześniejszej pracy magisterskiej.
Platforma implementacji	OSM - żródło mapy, PostgreSQL+PostGIS, Java
Kwalifikacje dyplomanta	TBD

Temat	5. Rekomendacja ograniczeń prędkości na podstawie danych geograficznych Zajęty
Cel	Celem pracy jest realizacja oprogramowania, które na podstawie danych mapy zbuduje model w postaci zbioru odcinków dróg wraz z relacjami do obiektów mających potencjalny wpływ na ustalanie dopuszczalnej prędkości. W dalszej części pracy należy zastosować gotowe algorytmy uczenia maszynowego (regresji, klasyfikacji, detekcji anomalii, rekomendacji) w celu wyznaczenia zalecanej prędkości. Końcowym efektem pracy powinny być: (1) wybór cech [wspomnianych relacji] (2) przeprowadzone testy algorytmów dla różnych kombinacji parametrów oraz ocena ich skuteczności działania Ze względu na możliwośc zastosowania różnych algorytmów podobne tematy mogą być realizowane przez kilka osób. Wtedy nastąpi uściślenie dotyczące klasy zastosowanego algorytmu.
Platforma implementacji	OSM - żródło mapy, Java, algorytmy uczenia maszynowego: Weka, SciPy (Python), Matlab/Octave (do wyboru)
Kwalifikacje dyplomanta	TBD

Temat	7. Agentowa implementacja algorytmu PSO Zarezerwowany
Cel	Celem pracy jest prototypowego oprogramowania, implementującego algorytm PSO (Particle Swarm Optimization) w rozproszonym środowsiku agentowym. Do komunikacji pomiędzy agentami należy użyć protokołu wzorowanego na newcast (dostosowanego jednak do typu zagadnienia). Ze względu na potencjalnie dużą liczbę agentów należy zaimplementować kilka wybranych wariantów różniących się topologią roju. Działanie należy przetestować na co najmniej dwóch przykładach - optymalizacji ciągłej oraz dyskretnej.
Platforma implementacji	biblioteka Akka, Java
Kwalifikacje dyplomanta	TBD

Opisy protokołu Newcast http://www.cs.unibo.it/bison/publications/ap2pc03.pdf https://www.researchgate.net/publication/225850594_ORIGINAL_PAPER_EvAg_a_scalable_peer-to-peer_evolutionary_algorithm

Temat	8. Agentowa implementacja algorytmu pszczelego (Bees algorithm) Zarezerwowany
Cel	Podobnie, jak 7. Wybór algorytmu narzuca jednak inną strukturę grafu komunikacji.
Platforma implementacji	biblioteka Akka, Java
Kwalifikacje dyplomanta	TBD

Temat	9. Agentowa implementacja algorytmu mrówkowego Zarezerwowany
Cel	Podobnie, jak 7. Wybór algorytmu narzuca jednak inną strukturę grafu komunikacji.
Platforma implementacji	biblioteka Akka, Java
Kwalifikacje dyplomanta	TBD

Temat	10. Przetwarzanie danych na platformie Apache Spark (tytuł roboczy)
Cel	Celem pracy jest uruchomienie wybranych algorytmów klasyfikacji, klasteryzacji na platformie SPark https://spark.apache.org/ dla zbiorów danych różnej wielkości i postaci. Należy przeprowadzić zarówno testy jakościowe (np. jakość klasyfikacji) oraz wydajnościowe.
Platforma implementacji	platforma Apache Spark, Java
Kwalifikacje dyplomanta	TBD

Temat	11. Przetwarzanie danych tekstowcyh na platformie Apache Spark Zarezerwowane
Cel	Cel: TBD (klasyfikacja lub analiza sentymentu), np. dla danych z twittera
Platforma implementacji	platforma Apache Spark, Java
Kwalifikacje dyplomanta	TBD

Tematy do realizacji w roku 2015/2016

Możliwa jest realizacja tematów podobnych do studio_projektowe.
Muszą być to jednak tematy jednoosobowe. Do ustalenia podczas konsultacji lub przez e-mail
W szczególności polecam:
semantyczne_repozytorium_wideo
agentowy_system_sterowania_oswietleniem_drogowym
sieci_petriego_xqpn
uczenie_map_kognitywnych_--_predykcja_ruchu_drogowego
symulator_systemu_zbierania_informacji_taktycznych_wykorzystujacy_reprezentacje_grafowa
system_rekomendacji_ograniczen_ruchu_na_podstawie_danych_geograficznych
aplikacja_do_edycji_opisow_struktur_dancyh
i3_symulacja_komunikujacych_sie_pojazdow

—

Temat	1. Implementacja algorytmu typu Pregel na platformie OpenCL Zajęte
Cel	Algorytm Pregel pozwala na wykonywanie równoległych operacji na grafach w środowisku rozproszonym. Węzły wysyłają komunikaty do sąsiadów, ci z kolei uaktualniają swój stan i przesyłają komunikaty dalej. Pregel jest używany np. do obliczania indeksu PageRank. Celem pracy jest zaimplementowanie pewnej uproszczonej wersji algorytmu przeznaczonej do wykonania na GPU oraz przetestowanie działania dla wybranych zagadnień
Platforma implementacji	Java + aparapi lub C/C++
Kwalifikacje dyplomanta	TBD
Temat	2. System do analizy i rekomendacji treści w kanałach RSS / System for content analyzis and recommendation in RSS channels Zajęty
Cel	Celem pracy jest projekt i implementacja systemu pozwalającego na dobór informacji z kanałów RSS na podstawie preferencji i zainteresowań użytkownika. Elementami do zrealizowania są moduły pobierania dokumentów z kanałów RSS, interfejs webowy pozwalający na prezentację treści oraz zbieranie danych o akcjach użytkownika, a także moduł rekomendacji wykorzystujący techniki uczenia maszynowego..
Platforma implementacji	Weka?
Kwalifikacje dyplomanta	TBD

Temat	3. Symulacja i analiza systemu komunikujacych się pojazdów pojazdów w sieci typu VANET / Simulation and analysis of communication between vehicles in VANET networks Zajęte
Cel	Celem pracy jest opracowanie systemu pozwalającego na realistyczną symulację systemu komunikujących się pojazdów w sieciach VANET (Vehicle ad hoc Networks). Proponowane jest podejście agentowe, w którym każdy pojazd animowany przez agenta porusza się, uczestniczy w komunikacji oraz buduje wewnętrzny model otoczenia obejmujący stan sąsiadujących pojazdów oraz ich połączeń. Zaimplementowana platforma powinna pozwalać na elastyczne zarządzanie symulacją oraz wybór zbieranych danych,możliwość zapisu do bazy danych lub formatu wynikowego XML.
Platforma implementacji	OSM - żródło mapy, PostgreSQL+PostGIS, Java
Kwalifikacje dyplomanta	TBD

Temat	4. Zastosowanie technik uczenia maszynowego do rekomendacji wymagań dla projektów informatycznych / Application of machine learning techniques for recommendation of IT project requirements Zajęte
Cel	Celem pracy jest przeprowadzenie eksperymentówmających na celu rekomendację niejawnych (niewyspecyfikowanych) wymagań dla projektów informatycznych. W pracy należy skoncentrować się na opisach w języku polskim obejmujących kategorie projektów, aktorów, skróconych specyfikacjach przypadków użycia i obiektów dziedziny. Przewiduje się wykorzystanie narzedzi wspomagających przetwarzanie tekstów w języku polskim (jak Morfologik lub Wordnet/slowosiec). Praca powinna zawierać przegląd metod rekomendacji, opis przeprowadzonych eksperymentów oraz opis wykonanego systemu rekomendacji.
Platforma implementacji	Język Java, biblioteki Weka, Morfologik
Kwalifikacje dyplomanta	TBD

Temat	5. Symulacja zużycia prądu w gospodarstwach domowych z wykorzystaniem środowiska agentowego / Simulation of energy consumption in households on a multiagent platform Zajęte
Cel	Celem pracy jest opracowanie oraz implementacja symulacyjnego modelu zużycia prądu w gospodarstwach domowych. Model powinien obejmować dane takie jak struktura gospodarstwa domowego, profile domowników i urządzeń oraz czynniki zewnętrzne (np. czas i pogoda). Użytkownik powinien mieć możliwość zdefiniowania lub wygenerowania symulowanego świata, a także zdefiniowania sposobu agregacji rezultatów. System powinien pozwalać na śledzenie przebiegu symulacji, a jej rezultaty powinny zostać umieszczone w specjalnie do tego zaprojektowanej bazie danych.
Platforma implementacji	Język Java, biblioteka Akka
Kwalifikacje dyplomanta	TBD

Temat	6. Implementacja algorytmów uczenia rozmytych map kognitywnych na platformie OpenCL / OpenCL implementation of Fuzzy Cognitive Map learning algorithms Zajęte
Cel	Celem pracy jest opracowanie oraz implementacja algorytmów uczenia rozmytych kognitywnych. Wybraną platformą implementacji jest GPGPU (ze szczególnym wskazaniem na OpenCL). Przewidywanym zastosowaniem jest predykcja szeregów czasowych. W ramach pracy należy zrealizować i przetestować kilka wariantów algorytmu różniących się normami wykorzystywanymi do oceny błędów predykcji oraz porównać zagadnienia wyznaczania dyskretnych i ciągłych wag wpływów.
Platforma implementacji	Język Java, biblioteka aparapi
Kwalifikacje dyplomanta	TBD

Temat	7. Mobilny system monitorowania aktywności fizycznej / Mobile system for monitoring physical activities Zajęte
Cel	Celem pracy jest opracowanie oraz implementacja systemu obejmującego aplikację mobilną oraz serwer pozwalającego na zbieranie informacji o aktywności fizycznej użytkownika, przesyłanie ich na serwer, przechowywanie oraz sporządzanie raportów i statystyk. Ważnym elementem ma być możliwość rozpoznawania akcji wykonywanych przez użytkownika: chodzenie, bieganie, wchodzenie po schodach, jazda rowerem, itp. W tym celu mają zostać wykorzystane odczyty z czujników typu akcelerometr, żyroskop oraz zastosowane algorytmy uczenia maszynowego do klasyfikacji akcji na podstawie pomiarów. Należy przewidzieć tryb konfiguracji aplikacji mobilnej obejmujący analizę dostępnych czujników, dobór algorytmu klasyfikacji oraz kalibrację pozwalającą dostosować do indywidualnych cech użytkownika.
Platforma implementacji	Język Java, Android, biblioteka Weka
Kwalifikacje dyplomanta	TBD

Temat	9. Zagadnienie optymalnego planowania projektów MRCPSP/max. Implementacja na platformie OpenCL
Cel	Implementacja wybranego algorytmu: PSO, Bees, Ant Colony lub GA
Platforma implementacji	Java + aparapi lub C/C++
Kwalifikacje dyplomanta	TBD

Temat	13. Biometryczna autentykacja użytkownika wykorzystująca własności interakcji z urządzeniem mobilnym / Biometric user authentication based on interaction with a mobile device Zajęte
Cel	Celem pracy jest opracowanie komponentu dla systemu Android pozwalającego na autentykację użytkownika na podstawie charakterystyk czasowych interakcji z urządzeniem mobilnym. W ramach pracy należy (1) zaprojektować i zaimplementować kilka interfejsów użytkownika (wprowadzanie haseł, tekstów, przesuwanie), następnie (2) zebrać dane opisujące interakcje z użytkownikami, (3) zaproponować zbiór cech i dobrać algorytmy klasyfikacji cechujące się najlepszą dokładnością i precyzją. Ostatnim (4) etapem pracy jest implementacja i testy komponentu wykorzystującego wybrane interfejsy, zestawy cech i dobrane algorytmy klasyfikacji.
Platforma implementacji	Język Java, Android, biblioteka Weka
Kwalifikacje dyplomanta	TBD

Tematy do realizacji w 2013+

Temat	1. Narzędzie pracy grupowej wspierające dokumentowanie i ocenę architektury oprogramowania Zajęte
Cel	Celem pracy jest projekt i implementacja oprogramowania mającego na celu zapewnienie wsparcia dla metody oceny architektury ATAM poprzez: (1) definiowanie wymagań (scenariuszy) (2) możliwość wprowadzania danych uściślających opis architektury (3) możliwość głosowania przez grupę ekspertów (4) możliwość wprowadzania ocen
Platforma implementacji	Java, JSP lub odpowiednik, usługi sieciowe jako opakowanie dostępu do BD
Kwalifikacje dyplomanta	Znajomość języka Java. Pożądana (chociaż niekonieczna) znajomość zagadnień Semantic Web. Mile widziana kreatywność w zakresie projektowania interfejsu.

Temat	2. Agentowy System interpolacji parametrów ruchu wykorzystujący model FCM Zrealizowane
Cel	Motywacja: w wybranych punktach sieci drogowej zainstalowane są czujniki mierzące parametry ruchu drogowego. Jednakże pokrycie jest rzadkie, znamy np: parametry ruchu na Alejach, ale nie na ulicy Reymonta… Celem pracy jest (1) przeprowadzenie symulacji z wykorzystaniem pakietu SUMO i zebranie danych o dynamice ruchu. (2) Projekt i implementacja systemu mającego na celu interpolację parametrów ruchu dla rzadkich pomiarów. Zakład się, że sieć drogowa zostanie podzielona na obszary odpowiadające mniej więcej otoczeniu punktów pomiaru. Każdym z obszarów będzie zarządzał samodzielny proces (agent). Agenty będą interpretowali pomiary i okresowo wymieniali się informacjami o ruchu na odcinkach granicznych. Źródło mapy: OSM
Platforma implementacji	Java, C++ lub Python dla wstawek do SUMO
Kwalifikacje dyplomanta	Znajomość języka Java i C++.

Temat	3. Agentowy symulator zużycia energii wykorzystujący wizualny język modelowania zachowań Zajęte
Cel	TBD
Platforma implementacji	Java / JADE
Kwalifikacje dyplomanta	Znajomość języka Java.

Temat	4. Implementacja systemu umożliwiającego generację widoków ontologii
Cel	Dla uproszczenia: ograniczymy się do ontologii odpowiadających diagramom klas. Często ontologie zawierają setki lub tysiące klas. W wielu zastosowaniach, np.: wnioskowania, taka reprezentacja jest nadmiarowa i prowadzi do znacznego zwiększenia czasu przetwarzania. W rzeczywistości używa się kilkunastu klas i relacji. Widok ontologi to jej podzbiór obejmujący wybrane klasy, atrybuty (datatype property) i relacje. Celem pracy jest 1) opracowanie prostego języka specyfikacji widoków 2) realizacja systemu (biblioteki), który będzie takie widoki budował (3) przeprowadzenie testów
Platforma implementacji	Java + biblioteka Jena lub OWL API
Kwalifikacje dyplomanta	Znajomość języka Java. Pożądana znajomość zagadnień Semantic Web

Temat	5. Identyfikacja procesów na podstawie logów zdarzeń (Process mining) Zrealizowane
Cel	Praca ma obejmować: (1) analizę literatury związaną z zagdadnieniem, analizę postaci opublikowanych zbiorów danych (2) projekt i implementację szkieletu aplikacji, do którego będzie można włączyć (a) formalizmy opisu procesów (b) algorytmy generacji opisu procesowego © narzędzie sprawdzania, czy ścieżka zdarzeń reprezentuje proces (d) możliwość przechowywania populacji procesów (e) funkcję oceny. Ostatnim elementem jest pokazanie, że zaprojektowaną strukturę można dostosować do potrzeb konkretnego algorytmu i przeprowadzenie testów na standardowych zestawach danych.
Platforma implementacji	Java
Kwalifikacje dyplomanta	Znajomość języka Java.

Temat	6. System śledzenia pojazdów Zrealizowane
Cel	Celem pracy jest projekt i implementacja systemu umożliwiającego śledzenie i wizualizację ruchu pojazdów. Jego podstawowe komponenty to aplikacja mobilna zainstalowana na terminalu wyposażonym w czujnik GPS, serwer, na którym następuje filtracja przesłanych danych oraz rzutowania na mapę, baza danych przechowująca rozpoznane trajektorie oraz interfejs pozwalający na wybór (dokonywanie zapytań) i wizualizację ścieżek. Model danych powinien uwzględniać profile użytkownika, typ czujnika GPS oraz kontekst (punkty POI oraz zdarzenia, np.: zjawiska pogodowe, zgłoszone imprezy masowe). Istotne atrybuty jakości, które należy uwzględnić przy projektowaniu to: wydajność oraz skalowalność
Platforma implementacji	Java
Kwalifikacje dyplomanta	Znajomość języka Java.

Temat	7. System zgłaszania i semantycznej klasyfikacji zdarzeń w ruchu drogowym Zrealizowane
Cel	Na podstawie ALERT24 TBD
Platforma implementacji	Java
Kwalifikacje dyplomanta	Znajomość języka Java.

Tematy do realizacji w 2012+

Temat	1. Wyszukiwanie relacji pomiędzy obiektami na mapie ZAJĘTE
Cel	Celem pracy jest opracowanie koncepcji i zaimplementowanie oprogramowania pozwalającego na wykonywanie zapytań dotyczących relacji pomiędzy obiektami na mapie. Np.: miejscowości położone przy linii kolejowej w odlegości 15 km na zachód od Krakowa.
Platforma implementacji	Żródło danych Open Street Map (OSM). Biblioteka Jena. Przewidziana wizualizacja za pomocą standardowych narzędzi GIS.
Kwalifikacje dyplomanta	Znajomość języka Java. Programowanie systemów bazodanowych. Mile widziana znajomość zagadnień związanych z Semantic Web

Temat	2. Wyznaczanie parametrów charakteryzujących ruch drogowy na podstawie danych dostarczonych przez ruchome pojazdy ZREALIZOWANE
Cel	Pojazd wyposażony w odbiorniki GPS okresowo przesyła dane o swoim położeniu. Na tej podstawie wyznaczane są parametry ruchu - średnia prędkość, czy oczekiwania, itd. Dane muszą być skorelowane z mapą (na podstawie Open Street Map OSM). Przewidywane jest grupa pojazdów. Praca może dotyczyć wyłącznie strony serwera (symulowane pojazdy przesyłające dane).
Platforma implementacji	Platforma Java lub .NET., interfejs usług sieciowych.
Kwalifikacje dyplomanta	Znajomość języka Java/C#. Znajomość zagadnień związanych z programowaniem usług siecioweych web service

Temat	3. Translator BPMN→Java (lub C++)
Cel	Celem pracy jest zaprojektowanie, zaimplementowanie, przetestowanie kompilatora, który na podstawie specyfikacji BPMN zbuduje kod wielowątkowego oprogramowania w języku Java komunikującego się z usługami sieciowymi. Etapy: (1) Wybór narzędzia do rysowania BPMN (analiza formatów) – .Intalio lub wtyczki do Eclipse (2) Zaproponowanie odwzorowań konstrukcji BPMN w kod (zwłaszcza komunikacja, zdarzenia) (3) Implementacja i testy translatora
Platforma implementacji	Platforma Java, usługi sieciowe (JBoss/Glassfish)
Kwalifikacje dyplomanta	Znajomość języka Java. Znajomość zagadnień związanych z programowaniem usług siecioweych web service

Temat	4. Symulator procesów biznesowych
Cel	Celem pracy jest projekt i implementacja symulatora wykonania procesów biznesowych. Język opisu procesów to podzbiór BPMN lub EPC lub ArchiMate (do uzgodnienia). Opis procesów z założenia jest prosty: zdarzenia początkowe i końcowe, możliwość generacji zdarzeń przez czynność, sekwencje, rozgałęzienia. W zależności od wyboru języka, praca może obejmować implementację prostego edytora, chociaż preferowana jest integracja z istniejącymi narzędziami.
Platforma implementacji	Java
Kwalifikacje dyplomanta	Znajomość języka Java. Mile widziana znajomość platformy Eclipse

Temat	6. Projekt i implementacja semantycznego repozytorium zdarzeń drogowych ZAJĘTE
Cel	Celem pracy jest projekt, implementacja i testy repozytorium przechowującego informacje o zdarzniach drogowych (korkach, wypadkach, niebezpiecznych sytuacjach, zjawiskach atmosferycznych, itd.) Przewidywane elementy pracy: (1) zdefiniowanie i zaimplementowanie interfejsów (usługi sieciowe) umożliwiających dostęp (zgłaszanie zdarzeń, definiowanie nowych typów zdarzeń, zapytanie) (2) zaimplementowanie mechanizmów semantycznych - wyszukiwanie zdarzeń należących do klas (podklas) spełniających określone relacje, (3) wizualizacja zdarzeń na mapie (4) implementacja klienta służącego do zgłaszania zdarzeń lub (5) automatyczne zgłaszanie zdarzeń na podstawie interpretacji parametrów ruchu.
Platforma implementacji	Technologie: BD - PostgreSQL, język programowania Java lub C#, do manipulacji informacjami semantycznymi - raczej biblioteka Jena (Java);
Kwalifikacje dyplomanta	Znajomość języka Java i C#. Pożądana znajomość zagadnień Semantic Web.

Temat	7. Integracja semantyczna algorytmów planowanie trasy z dynamicznym repozytorium parametrów ruchu drogowego ZAJĘTE
Cel	Celem pracy jest przeprowadzenie integracji dwóch komponentów (1) dynamicznego repozytorium ruchu oraz (2) różnych algorytmów planowania trasy. Do realizacji celów pracy wystarczy integracja 2 algorytmów, np.: Dijkstra i A*. Ważne jednak, aby zapewnić możliwość wymiany na inne. Praca obejmuje realizację: adaptera struktury - tworzy model grafu na podstawie mapy i typu użytkownika, adaptera wag - na podstawie zmierzonych parametrów opisujących ruch wprowadza dynamicznie wagi łuków. Pokrycie mierzonych parametrów jest niewielkie, więc adapter wag powinien dokonywać prostej estymacji dla odcinków dróg nieobjętych pomiarem.
Platforma implementacji	Java lub C#; usługi sieciowe.
Kwalifikacje dyplomanta	Znajomość języka Java lub C#. Pożądana znajomość zagadnień Semantic Web.

Inne tematy są na razie tu: http://pszwed.ia.agh.edu.pl/prace-magisterskie/index.html

Table of Contents