КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Завдання. Вивчення основ роботи з програмою FineReader
Вивчення основ роботи з програмою FineReader ЛАБОРАТОРНА РОБОТА № 10 Додатки. Дистрибутив програмного продукту WinZip v8.0 M.Т. Стринадко. Інформатика. Методичні вказівки до лабораторного практикуму. Частина 2. Чернівці. 2010. 12 с.
Мета: Вивчити процеси розпізнавання, перевірки і збереження результатів розпізнавання при введенні документів в комп’ютер за допомогою програмного продукту FineReader.
Вивчити методику роботи з пакетом Fine Reader 7.0. Виконати розпізнавання, перевірку та збереження наступних документів: простий лист; багатомовний документ; книжна розгортка; документ – факс; складна журнальна сторінка; газетна сторінка; PDF документ; проста таблиця; таблиця з неповною кількістю чорних розділювачів; складна таблиця; візитні картки; робота з презинтаціями Power Point; програмна роздруківка; документ з декоративним шрифтом; документ з артикулами; фотографія документа. Оформити звіт.
Матеріали та обладнання: Персональний комп’ютер, прикладна програма FineReader, файли відсканованих документів, методичні рекомендації щодо виконання роботи. Вказівки до роботи: Процес введення документів в комп'ютер складається з чотирьох етапів: сканування, розпізнавання, перевірки і збереження результатів розпізнавання. Процес сканування виконується за допомогою спеціальних пристроїв – сканерів. В роботі пропонується використати попередньо підготовлені скановані документи. Теоретичні відомості. Системи оптичного розпізнавання символів (Optical Character Recognition - OCR) призначені для автоматичного введення друкарських документів в комп'ютер. ABBYY FineReader — система оптичного розпізнавання текстів. Це означає, що вона дозволяє розпізнавати тексти, набрані практично будь-якими шрифтами, без попереднього навчання. Особливістю програми ABBYY FineReader є висока точність розпізнавання і мала чутливість до дефектів друку, що досягається завдяки застосуванню технології "цілісного цілеспрямованого адаптивного розпізнавання".
Процес введення документа в комп'ютер включає такі два важливі етапи, як: сканування та розпізнавання. На першому етапі «Сканування», сканер грає роль "ока" Вашого комп'ютера: "проглядає" зображення і передає його комп'ютеру. При цьому отримане зображення є не чим іншим, як набором чорних, білих або кольорових точок, картинкою, яку неможливо відредагувати ні в одному текстовому редакторові. Розпізнавання, або обробка зображення OCR-системою, включає аналіз графічного зображення, переданого сканером, і розпізнавання кожного символу. Процеси аналізу макету сторінки (визначення областей розпізнавання, таблиць, картинок, виділення в тексті рядків і окремих символів) і розпізнавання зображення тісно зв'язані між собою: алгоритм пошуку блоків використовує інформацію про розпізнаний текст для точнішого аналізу сторінки. Як уже згадувалося, розпізнавання зображення здійснюється на основі технології "цілісного цілеспрямованого адаптивного розпізнавання". Цілісність - об'єкт описується як ціле за допомогою значущих елементів і зв’язків між ними. Цілеспрямованість - розпізнавання будується як процес висунення і цілеспрямованої перевірки гіпотез. Адаптивність - здібність OCR-системи до самонавчання. Відповідно до цих трьох принципів система спочатку висуває гіпотезу про об'єкт розпізнавання (символ, частину символу або декількох склеєних символів), а потім підтверджує або спростовує її, намагаючись послідовно виявити всі структурні елементи і зв’язки. У кожному структурному елементі виділяються частини, значущі для людського сприйняття: відрізки, дуги, кільця і точки. Слідуючи принципу адаптивності, програма самостійно "настроюється", використовуючи позитивний досвід, отриманий на перших упевнено розпізнаних символах. Цілеспрямований пошук і облік контексту дозволяють розпізнавати розірвані і спотворені зображення, роблячи систему стійкою до можливих дефектів листа.
В результаті роботи у вікні ABBYY FineReader з'явиться розпізнаний текст, який Ви можете відредагувати і зберегти в найбільш зручному для Вас форматі.
Інтерфейс програми ABBYY FineReader
Дата добавления: 2015-05-24; Просмотров: 470; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |