Automatyczna kontekstowa korekta tekstów z wykorzystaniem grafu LHG
Autorzy/Authors: Marcin Gadamer, Adrian Horzyk
Wydawnictwo/Publisher: Computer Science AGH, Vol. 10, Kraków, 2010, pp. 39-57
Redaktorzy/Editor: M. Gajęcki
Streszczenie:
Automatyczna korekta tekstów stanowi wazny problem z punktu widzenia dzisiejszych procesorów i edytorów tekstów. W tym artykule został przedstawiony innowacyjny algorytm słuzacy do automatyzacji kontekstowej korekty tekstów z wykorzystaniem Grafu Przyzwyczajen Lingwistycznych (LHG), który równiez opisano w tym artykule. W tym celu zbudowano specjalistycznego pajaka internetowego przeszukujacego strony internetowe celem skonstruowania Grafu Przyzwyczajen Lingwistycznych (LHG) na podstawie analizy korpusów tekstów uzyskanych z polskojezycznych stron internetowych. Otrzymane wyniki korekty tekstu z wykorzystaniem tego algorytmu, bazujacego na grafie LHG, zostały porównane z komercyjnymi programami do korekty tekstu takimi jak Microsoft Word 2007, Open Office Writer 3.0 oraz z wyszukiwarka Google. Otrzymane wyniki korekty tekstów okazały sie byc znacznie lepsze niz w wyzej wymienionych komercyjnych narzedziach.
Abstract:
Automatic text correction is an essential problem of today text processors and editors. This paper introduces a novel algorithm for automation of contextual text correction using a Linguistic Habit Graph (LHG) also introduced in this paper. A specialist internet crawler has been constructed for searching through web sites in order to build a Linguistic Habit Graph after text corpuses gathered in polish web sites. The achieved correction results on a basis of this algorithm using this LHG were compared with commercial programs which also enable to make text correction: Microsoft Word 2007, Open Office Writer 3.0 and search engine Google. The achieved results of text correction were much better than correction made by these commercial tools.