Automatic Discriminative Lossy Binary Conversion of Redundant Real Training Data Inputs for Simplifying Input Data Space and Data Representation
Autor/Author: Adrian Horzyk
Wydawnictwo/Publisher: Proc. of ICANNGA 2009, Springer-Verlag, LNCS 5495, 2009, pp. 1-10
Redaktorzy/Editors: M. Kolehmainen et al.
Streszczenie:
Wielokrotnie spotykamy się z potrzebą uproszczenia lub redukcji przestrzeni danych wejściowych w celu otrzymania lepszego modelu lub większej efektywności rozwiązań z zakresu sztucznej inteligencji. Dobrze znane algorytmy PCA, ICA i zbiory przybliżone potrafią uprościć lub zredukować przestrzeń danych wejściowych ale nie potrafią przetransformać danych rzeczywistych na dane binarne. Binarne wektory danych uczących zwykle upraszczają proces uczenia się (lub adaptacji) sieci neuronowych i pozwalają skonstruować bardziej kompaktowe topologie i rozwiązania. W tym artykule przedstawiono nowy algorytm automatycznej redukcji przestrzeni danych wejściowych z równoczesną konwersją danych rzeczywistych na dane binarne tak, żeby takie uproszczenie/transformacja nie spowodowała utratę możliwości dyskryminacji danych należących do różnych klas. Opisana stratna konwersja binarna umożliwia otrzymanie lepszych wyników generalizacji dla różnych algorytmów miękkich obliczeń (soft-computing), które są narażone na problem "przekleństwa wymiaru danych". W tym artykule przedstawiono algorytm automatycznej stratnej binarnej konwersji dyskryminującej ADLBCA, który rozwiązuje wyżej wymienione problemy. W ogólności, nie istnieje na razie żadna inna metoda, która byłaby w stanie rozwiązać równocześnie wszystkie w/w zadania tak szybko.
Abstract:
Many times we come across the need to simplify or reduce an input data space in order to achieve a better model or better performance of an artificial intelligence solution. The well known PCA, ICA and rough sets can simplify and reduce input data space but they cannot transform real input data vectors into binary ones. Binary training vectors can simplify a training process of neural networks and let them to construct more compact topologies. This paper introduces a new algorithm that reduces input data space and simultaneously automatically lossy transforms real input training data vectors into binary vectors so that they do not lose their discrimination properties. The problem is how to effectively transform real input training data vectors into binary vectors so that an input data space could be simplified and the transformed binary vectors would be enough representative to be able to discriminate all training samples of all classes correctly? The described lossy conversion makes possible to achieve better generalization results for various soft-computing algorithms, can be widely used and avoids the curse of dimensionality problem. This paper introduces a new Automatic Discriminative Lossy Binary Conversion Algorithm (ADLBCA) that is able to solve all these tasks. Generally, no other method can simultaneously and so fast do all these tasks.