Системы оптического распознавания символов (Optical Character Recognition, ли OCR-системы) предназначены для автоматического ввода документов в память компьютера. За ничтожный по историческим меркам отрезок времени эти системы вышли из стадии экспериментальных испытаний и превратились в один из самых спешных в коммерческом отношении класс программных продуктов. Сейчас OCR-системы успешно справляются с обработкой печатных документов. Задача распознавания рукописных символов решается только в нескольких частных случаях.
Распознавание символов - это сложная проблема, которая требует для своего решения привлечения новейших методов дискретной математики и искусственного интеллекта. Она не решается простыми переборными алгоритмами. Сложность реализации не стала непреодолимой преградой для разработчиков; на рынке программных продуктов предлагается несколько систем автоматического распознавания примерно равного класса, обладающих похожими функциональными возможностями. За рубежом получили наибольшее распространение программы OmniPage, Presto!, OCR Pro. Неплохой функциональностью обладают системы Textbridge и CuneiForm. В нашей стране самой популярной является программа FineReader, разработанная фирмой ABBYY.
FineReader - это программа-полиглот, разработчики ввели в ее состав средства распознавания текстов, написанных на самых распространенных языках мира. Она почти не знает шрифтовых ограничений, в среде программы могут быть успешно обработаны тексты, набранные самыми разнообразными шрифтовыми гарнитурами.
Процедура обработки документов в любой OCR-системе состоит из следующих этапов:
Интенсивность проявления полиграфического муара зависит от рисунка. Он особенно заметен в областях с однородной заливкой. И наоборот, изобилие мелких деталей способно полностью маскировать этот дефект от глаз наблюдателя. Так, на рис. 1.18 муар почти незаметен на изображении гор и снега, которые содержат множество произвольно расположенных фрагментов маленького размера.
Большинство современных компьютерных мониторов использует в своей работе электронно-лучевые трубки и матрицы жидких кристаллов. Это регулярные структуры, которые при «благоприятных» обстоятельствах могут стать причиной появления муара на экране.