Acrobat не может выполнить OCR из-за воспроизводимого текста на странице

Оптическое распознавание символов (OCR) — это процесс, в ходе которого Acrobat анализирует изображение текста, основанное на пикселях. Он распознает каждый символ, и преобразует его в редактируемый текст. В процессе распознавания Acrobat сравнивает эти изображения по фигуре и толщине линий со шрифтам, установленными в операционной системе. Воспроизводимый текст представляет собой редактируемый текст, который присутствует в файле PDF. Acrobat не может выполнить оптическое распознавание символов в документе, который содержит воспроизводимый текст.

Проблема. Acrobat не может выполнить оптическое распознавание символов, поскольку страница содержит воспроизводимый текст

При открытии файла PDF и выборе параметра «Распознать текст» в инструменте «Сканирование и оптическое распознавание символов» Acrobat выдает следующую ошибку: Программе Acrobat не удалось выполнить оптическое распознавание символов, поскольку эта страница содержит воспроизводимый текст.

Решение 1. Выполните оптическое распознавание символов в документе, который не содержит воспроизводимый текст

Это сообщение отображается в том случае, если документ PDF уже содержит редактируемый текст. Получите версию документа, которая не содержит редактируемый текст, после чего выполните оптическое распознавание символов.

Решение 2. Преобразуйте файлы PDF в формат TIFF и обратно.

  1. Откройте файл PDF в Acrobat и войдите в меню-гамбургер   (Windows) или в меню Файл (macOS) > Сохранить как.

  2. В диалоговом окне «Сохранить как PDF» выберите пункт «TIFF (*.tif, *.tiff)» из раскрывающегося списка Преобразовать в. Выберите путь и нажмите на «Сохранить». Acrobat сохраняет каждую страницу документа PDF как отдельный файл TIFF с последовательной нумерацией.

  3. Откройте каждый файл TIFF в Acrobat и нажмите Распознать текст в инструменте Сканирование и оптическое распознавание символов.

Связанные материалы

 Adobe

Получайте помощь быстрее и проще

Новый пользователь?