Растровая графика в Photoshop CS8

         

Сканирование для системы распознавания символов



Системы оптического распознавания символов (Optical Character Recognition, ли OCR-системы) предназначены для автоматического ввода документов в память компьютера. За ничтожный по историческим меркам отрезок времени эти системы вышли из стадии экспериментальных испытаний и превратились в один из самых спешных в коммерческом отношении класс программных продуктов. Сейчас OCR-системы успешно справляются с обработкой печатных документов. Задача распознавания рукописных символов решается только в нескольких частных случаях.
Распознавание символов - это сложная проблема, которая требует для своего решения привлечения новейших методов дискретной математики и искусственного интеллекта. Она не решается простыми переборными алгоритмами. Сложность реализации не стала непреодолимой преградой для разработчиков; на рынке программных продуктов предлагается несколько систем автоматического распознавания примерно равного класса, обладающих похожими функциональными возможностями. За рубежом получили наибольшее распространение программы OmniPage, Presto!, OCR Pro. Неплохой функциональностью обладают системы Textbridge и CuneiForm. В нашей стране самой популярной является программа FineReader, разработанная фирмой ABBYY.
FineReader - это программа-полиглот, разработчики ввели в ее состав средства распознавания текстов, написанных на самых распространенных языках мира. Она почти не знает шрифтовых ограничений, в среде программы могут быть успешно обработаны тексты, набранные самыми разнообразными шрифтовыми гарнитурами.
Процедура обработки документов в любой OCR-системе состоит из следующих этапов:

  • Сканирование. На этом этапе сканер формирует изображение, которое является основой для последующего распознавания. Цифровая версия документа представляет собой изображение, которое не может быть отредактировано как текст ни одним программным средством.

Интенсивность проявления полиграфического муара зависит от рисунка. Он особенно заметен в областях с однородной заливкой. И наоборот, изобилие мелких деталей способно полностью маскировать этот дефект от глаз наблюдателя. Так, на рис. 1.18 муар почти незаметен на изображении гор и снега, которые содержат множество произвольно расположенных фрагментов маленького размера.
Большинство современных компьютерных мониторов использует в своей работе электронно-лучевые трубки и матрицы жидких кристаллов. Это регулярные структуры, которые при «благоприятных» обстоятельствах могут стать причиной появления муара на экране.



Содержание раздела