<<
>>

3.6.2. Сканирование текста

При подготовке научной работы автору приходится работать и с уже опубликованными материалами, в частности со статьями, книгами. И чаг/то возникает потребность включить в свою книгу цитату, таблицу или другой материал опубликованного источника.
Если объем включения невелик, допустим строчек, текст несложно набрать вручную. Однако для больших объемов текста удобнее прибегнуть к помощи сканера и программы распознавания символов.

Сканер, работая по принципу фотоаппарата, передает в компьютер точный ^имок-кйргн.чку страницы с текстом. Однако работать с таким текстом невозможно: во-первых, Б графическом формате страница занимает слишком много места, а во-вторых, сканированный текст можно только читать, но нельзя редактировать и нельзя вставлять его фрагменты в создаваемый автором документ. Сканер нераспозвае г буквы: они для него - некие пятна

Однако разработаны программы, способные перевести сканированный текст из графического в текстовый формат - программы распознавания (OCR). Современная OCR умеет многое: распознавать таблицы, тексты, набранные не только определенными шрифтами так работали программы

первого поколения), но самыми экзотическими, вплоть до

242

рукописных; корректно с

слова на языках, и

не только четкие но и далеко идеальные, например с

пожелтевшей потной вырезки или третьей машинописной копии. Но распознать важно обеспе

чить возможность сохранения результата в файле популярного текстового (или табличного) формата - формата Microsoft Word или Excel.

Трон «короля» OCR в России делят две программы - CuneiForm и FineReader. Обе программы можно приобрести или получить бесплатно при покупке сканера. В компания Hewlett Packard, на долю которой приходится добрых три четверти рынка сканеров в России, поставляет со своей продукцией упрощенную версию CuneiForm.

FineReader традиционно славится высочайшим качеством распознавания. Так.

например, при "'^ОТО':"'?'; распознавании книжного с помощью FineReader можно

обнаружить не более 5 ошибок на странице распознанного текста. При работе с Сіте/Рот- -.га 7-8 ошибок. Что же касается бледных и смазанных документов, то тут FineReader вне конкуренции. Эта система безукоризненно справляется с многоколонными и многостраничными ??егсгакїі, а также стаатипллпт корректно экспортируя их в программы Microsoft Office. Наконец, как и CuneiForm, FineReader способен работать с многоязычными документами - программа около 40 4jbiK03. в том числе языки республик бывшего СССР.

Едва ли не главное достоинство FineReader - простой и удобный интерфейс (визуальная оболочка про! рам^ы. с которой и общается при что редко для профессиональных Для распознавания достаточно положить документ в сканер и нажать единственную кнопку на панели инструментов программы. При распознавании мпсі (V-mxiніічньі.ч документов пользователю нужно только менять страницы и дава гъ команду для продолжения скнпи- рования. По окончании распознавания FineReader самостоятельно все распознанные страницы в один файл, который потом можно передать в Word или Excel.

Еще большими возможностями обладает профессиональная версия - Она

243 ет читать позволяет добавлять

базу данных новые языки. Кроме того, эта версия великолепно работает с формами типовых документов (модификация FineReader Forms), И уж поистине гсгав секпм интеллектом обладает третья модификация программы - FineReader Рукопись, которая способна корректно распознать даже нечеткий рукописный шрифт.

<< | >>
Источник: Кузнецов И.Н.. Курсовые и дипломные работы: От выбора темы до защиты: Справочное пособие. 2003

Еще по теме 3.6.2. Сканирование текста:

  1. Тексты источников:
  2. 3. 4. Текст о славянах из сочинения Шараф аз-Замана Тахира ал-Марвази
  3. 1. 4. Текст из сочинения Константина Багрянородного «Об управлении государством» Глава 9-я. О Руссах, приезжающих из России на однодеревках в Константинополь
  4. 3. 7. Текст из сочинения ал-Истархи «Китаб Ал масалик ва-л-мамалик» («Книга путей государств»)
  5. 2. 9. Текст из сочинения ал-Идриси «Нузхат ал-муштак
  6. ФИГУРЫ ДОБАВЛЕНИЯ В ГАЗЕТНОМ ТЕКСТЕ (НА МАТЕРИАЛЕ ЖАНРОВ РЕКЛАМНОЙ ЗАМЕТКИ И ОБЪЯВЛЕНИЯ) Г.В. Бобровская Волгоградский государственный педагогический университет
  7. СРЕДСТВА ВЫРАЖЕНИЯ НЕГАТИВНОЙ ОЦЕНКИ В СОВРЕМЕННЫХ ГАЗЕТНЫХ ТЕКСТАХ С.А. Свистельникова Старооскольский филиал ВГУ
  8. СЕМАНТИКО-СТИЛИСТИЧЕСКИЕ ОСОБЕННОСТИ ЦВЕТООБО- ЗНАЧЕНИЙ В МАССМЕДИЙНЫХ ТЕКСТАХ А. С. Выродова Белгородский государственный университет
  9. VIII. НАЦИОНАЛЬНО-КУЛЬТУРНЫЕ ОСОБЕННОСТИ РУССКОГО ТЕКСТА И ДИСКУРСА
  10. НАЦИОНАЛЬНО-КУЛЬТУРНЫЕ ТРАДИЦИИ ГРАФИЧЕСКОЙ РЕПРЕЗЕНТАЦИИ ВНЕШНЕЙ ФОРМЫ ТЕКСТА А.И. Заикина Белгородский государственный университет
  11. ФУНКЦИИ ЗНАКОВ КОСВЕННО-ПРОИЗВОДНОЙ НОМИНАЦИИ В ПУБЛИЦИСТИЧЕСКОМ ТЕКСТЕ К.И. Декатова Волгоградский государственный педагогический университет
  12. 3.4, РАБОТА С ТЕКСТОМ
  13. 3.4.2. Текст документа
  14. Чтение текста