Laboratorium 13
Przetwarzamy duży zbiór danych zawierający ponad 23000 obrazów. Te obrazy to zdjęcia psów i kotów i celem będzie ich klasyfikacja. Przetestowane będą:
- Klasyczne klasyfikatory (niezbyt wydajne)
- Konwolucyjne sieci neuronowe
Dodatkowym problemem jest organizacja przetwarzania danych:
- Obrazy dostarczone na wejście klasyfikatora muszą mieć takie same rozmiary
- Wszystkie dane nie mieszczą się w pamięci (z trudem mieszczą się po przeskalowaniu)
- Możliwe jest przetwarzanie polegające na wczytaniu grupy obrazów (np. 128) do pamięci i stopniowym uczeniu klasyfikatora. Ładowanie z dysku i skalowanie jednak zajmuje sporo czasu
Jeżeli nie ładuje się - alternatywna lokalizacja
setattr(tfds.image_classification.cats_vs_dogs, '_URL',"https://download.microsoft.com/download/3/E/1/3E1C3F21-ECDB-4869-8368-6DEBA77B919F/kagglecatsanddogs_5340.zip") ds = tfds.load('cats_vs_dogs', split='train', batch_size=None,as_supervised=True)
Opis zadań i kod w notatniku Colab