Automatyczna kontekstowa korekta tekstów z wykorzystaniem grafu LHG

Autorzy/Authors: Marcin Gadamer, Adrian Horzyk

Wydawnictwo/Publisher: Computer Science AGH, Vol. 10, Kraków, 2010, pp. 39-57

Redaktorzy/Editor: M. Gajęcki

Streszczenie:

Automatyczna korekta tekstów stanowi wazny problem z punktu widzenia dzisiejszych procesorów i edytorów tekstów. W tym artykule został przedstawiony innowacyjny algorytm słuzacy do automatyzacji kontekstowej korekty tekstów z wykorzystaniem Grafu Przyzwyczajen Lingwistycznych (LHG), który równiez opisano w tym artykule. W tym celu zbudowano specjalistycznego pajaka internetowego przeszukujacego strony internetowe celem skonstruowania Grafu Przyzwyczajen Lingwistycznych (LHG) na podstawie analizy korpusów tekstów uzyskanych z polskojezycznych stron internetowych. Otrzymane wyniki korekty tekstu z wykorzystaniem tego algorytmu, bazujacego na grafie LHG, zostały porównane z komercyjnymi programami do korekty tekstu takimi jak Microsoft Word 2007, Open Office Writer 3.0 oraz z wyszukiwarka Google. Otrzymane wyniki korekty tekstów okazały sie byc znacznie lepsze niz w wyzej wymienionych komercyjnych narzedziach.

Abstract:

Automatic text correction is an essential problem of today text processors and editors. This paper introduces a novel algorithm for automation of contextual text correction using a Linguistic Habit Graph (LHG) also introduced in this paper. A specialist internet crawler has been constructed for searching through web sites in order to build a Linguistic Habit Graph after text corpuses gathered in polish web sites. The achieved correction results on a basis of this algorithm using this LHG were compared with commercial programs which also enable to make text correction: Microsoft Word 2007, Open Office Writer 3.0 and search engine Google. The achieved results of text correction were much better than correction made by these commercial tools.

Prezentacja: