Методи розпізнавання тексту

Методи розпізнавання тексту-символів різних зображень забезпечує вирішення ряду наукових та прикладних задач при ідентифікації об'єктів різної природи. Сучасні методи розпізнавання символів використовуються для вирішення як типових задач, наприклад розпізнавання тексту, так і спеціалізованих задач, орієнтованих на розпізнавання символьної інформації, нанесеної на поверхню різних об'єктів. Існує достатньо велика кількість програм, призначених для розпізнавання тексту (наприклад, FineReader, Readiris, ScanSoft OmniPage та ін.). Кожна з цих програм пропонує свою реалізацію вирішення задачі обробки та розпізнавання зображень. Ці програми є комерційними, тому методи, закладені для вирішення задач, відомі лише розробникам.На даний час такі технології реалізуються трьома методами – структурним, ознаковим і шаблонним. Кожен з методів орієнтований на свої умови застосування, для яких він є ефективним. Кожен метод має вади. Найбільш суттєві з них – висока чутливість до афінних і проективних спотворень.

Шаблонний метод edit

При шаблонному методі проводиться порівняння зображення, що треба розпiзнати, з еталонними зразками з бази даних системи. При порівнянні обирається той еталон, який буде мінімально відрізнятися від аналізованого зображення. Перевага методу – висока точність розпізнавання дефектних символів. Недолік методу – неможливість розпізнати шрифт, який хоч трохи відрізняється від закладеного в систему.

Структурний метод edit

Структурні методи розпізнавання зберігають інформацію не про поточкове написання символу, а про його топологію. Еталон містить інформацію про взаємне розташування окремих складових частин символу. Перевага методу – стійкість до зсуву і повороту символу на невеликий кут, до різних стильових варіацій шрифтів. Однак, при повороті на кут, більший десяти градусів, даний метод не може бути використаний для розпізнавання символів. При застосування цього методу неважливими стають такі ознаки як розмір букви, що розпізнається і навіть шрифт, яким вона напечатана. Проте, основною проблемою цього методу є ідентифікація знаків, які містять певні дефекти (наприклад, розрив ліній або з'єднання сусідніх ліній).

Ознаковий метод edit

Ознаковi методи базуються на тому, що зображенню ставиться у відповідність N-мірний вектор ознак. Розпізнавання полягає в порівнянні вектора ознак з набором еталонних векторів тієї ж розмірності. Переваги методу – простота реалізації, хороша узагальнююча здатність, висока швидкiсть розпiзнавання. Недолік методу – висока чутливість до дефектів зображення. Крім того, ознакові методи мають інший недолік - на етапі вилучення ознак відбувається незворотня втрата частини інформації про символ. Вилучення ознак проходить незалежно, тому інформація про взаємне розташування елементів символів втрачається.

Література edit

  • Афонасенко, А. В. Обзор методов распознавания структурированных символов / А.В. Афонасенко, А.И. Елизаров // Доклады Томского государственного университета систем управления и радиоэлектроники. —2008. -Вып. 2(18). -Ч.1.-Сƒ-88.
  • В.О. Козел. Методи та етапи автоматичного розпізнавання тексту // Вісник Черкаського університету (науковий журнал) Випуск 172. Серія прикладна математика. Інформатика Сu-86