Analiza i korekta tekstu z wykorzystaniem specjalistycznego grafu przyzwyczajeń lingwistycznych LHG

Text Analysis and Correction Using Specialized Linguistic Habit Graphs LHG.

Autorzy/Authors: Marcin Gadamer, Adrian Horzyk

Wydawnictwo/Publisher: Automatyka, 2012

Streszczenie:

W artykule opisano innowacyjne grafy przyzwyczajeń lingwistycznych LHG dla celów automatyzacji kontekstowej korekty tekstów. Uzyskane wyniki wykorzystują skonstruowany algorytm przeszukiwania i agregowania dziesiątków milionów trójek słownych ze stron internetowych dostarczają prosty kontekst wyrażeń dla danego języka, który pozwala na przewidywanie ciągów słownych i dokonanie korekty często lepiej niż obecnie stosowane rozwiązania. Ponadto graf LHG w trakcie zbierania trójek słownych wzrasta w ograniczony i malejący sposób, więc można poprawiać cały czas ich działanie poprzez czytanie kolejnych tekstów, co w istotny sposób poprawia wyniki działania algorytmu automatycznej korekty tekstów.

Słowa kluczowe:

automatyczna korekta tekstów, analiza tekstów, grafy przyzwyczajeń lingwistycznych LHG, sztuczna inteligencja.

Abstract:

This paper introduces a novel linguistic habit graph LHG for automation of contextual text correction. The result of our current researches is a constructed mechanism for searching and aggregating tens of millions word-triples from websites that create a simple context statement for a given language that makes us able to predict word sequences and proceed corrections better than currently used solutions. Moreover, the LHG graph during colleting word-triples grow is limited and slows down so LHG graphs can be continuously supplemented by reading next texts to improve the correction results.

Keywords:

automatic text correction, text analysis, linguistic habit graph LHG, artificial intelligence.