The Influence of Training Data Availability Time on Effectiveness of ANN Adaptation Process
Autorzy/Authors: Ewa Dudek-Dyduch, Adrian Horzyk
Wydawnictwo/Publisher: Proc. of ICAISC 2008, LNAI 5097, Springer-Verlag, Berlin Heidelberg 2008, pp. 28-39
Redaktorzy/Editors: L. Rutkowski, R. Tadeusiewicz, L.A. Zadeh, J.M. Żurada
Streszczenie:
Artykuł zwraca uwagę na to, iż jednym z ważnych wyznaczników, który może zadecydować o efektywności działania algorytmów adaptacyjnych, jest to, czy dane uczące znane są w całości przed rozpoczęciem procesu adaptacji lub uczenia, czy też dane są dostarczane stopniowo w trakcie tego procesu. W artykule pokazano, uzasadniono i zilustrowano, iż proces adaptacji (np. sieci neuronowych) może być nieporównywanie efektywniejszy, jeśli dane są w całości znane przed rozpoczęciem procesu uczenia, gdyż umożliwiają globalną analizę danych, która przyspiesza proces adaptacji, a nawet umożliwia zbudowanie konstrukcyjnych metod nie wymagających procesu uczenia. Z drugiej strony, gdy dane nie są kompletne i są dostarczane sieci w trakcie procesu adaptacji, proces uczenia jest bardzo dobrym rozwiązaniem – z którego korzysta natura.
Abstract:
In the paper the new approach to create artificial neural networks (ANNs) is proposed. ANN's are inspired by natural neural networks (NNNs) that receive data in time still tuning themselves. In opposite to them ANNs usually work on the training data (TD) acquired in the past and are totally available at the beginning of the adaptation process. Because of this the adaptation methods of the ANNs can be sometimes more effective than the natural training process observed in the NNNs. This paper presents the ability of ANNs to adapt more effectively than NNNs do if only all TD are known before the beginning of the adaptation process. The design and adaptation process of the proposed ANNs is divided into two stages. First, analyze or examining the set of TD. Second, the construction of neural network topology and weights computation. In the paper, two kinds of ANNs which use the proposed construction strategy are presented. The first kind of network is used for classification tasks and the second kind for feature extraction.