Перед началом работы
Мы добавили новый и более интуитивно понятный интерфейс. Если показанный здесь экран не соответствует вашему интерфейсу, перейдите к справке по текущему интерфейсу.
Сканируйте бумажные документы в формат PDF, а затем с помощью Acrobat преобразовывайте их в интеллектуальные файлы PDF с возможностью поиска и выбора текста.
Перед началом работы
Мы добавили новый и более интуитивно понятный интерфейс. Если показанный здесь экран не соответствует вашему интерфейсу, перейдите к справке по текущему интерфейсу.
Можно создать файл PDF непосредственно из бумажного документа с помощью сканера и программы Acrobat. В ОС Windows программа Acrobat поддерживает драйверы сканера TWAIN и драйверы Windows Image Acquisition (WIA). На платформе Mac OS программа Acrobat поддерживает TWAIN и функцию записи изображений (ICA).
В ОС Windows можно либо использовать функцию «Автоопределение цветовой модели» и позволить Acrobat определить тип содержимого бумажного документа, либо использовать другие предустановки по вашему решению («Черно-белый документ», «Документ в градациях серого», «Цветное изображение» и «Цветной документ»). Можно настроить предустановки сканирования или использовать параметр Заказное сканирование для сканирования документов, применяя параметры по выбору.
Предустановки сканирования доступны только для драйверов сканеров, поддерживающих режим Скрыть интерфейс сканера. Предустановки сканирования не предусмотрены в Mac OS.
В ОС Windows, если на сканере установлен драйвер WIA, для создания файла PDF можно использовать кнопку Сканировать. Нажмите кнопку Сканировать. Затем в Windows выберите Adobe Acrobat в списке зарегистрированных приложений. Выберите сканер и стиль документа или Настраиваемое сканирование в окне интерфейса Acrobat.
Чтобы отсканировать бумажный документ в формат PDF с помощью Acrobat, выберите Все инструменты > Создать PDF. Откроется окно Создать файл PDF из любого формата . Выберите Сканер для просмотра доступных параметров.
Windows:
Mac:
Выберите Все инструменты > Создать PDF > Сканер > Автоопределение цветового режима.
Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
Для сканирования нескольких файлов в PDF нажмите значок «Настройки» . Откроется окно «Заказное сканирование». Выберите Предлагать сканировать другой документ.
Нажмите Сканировать.
При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите ОК.
Выберите Инструменты > Создать PDF > Сканер > [предустановки документа].
Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
Для сканирования нескольких файлов в PDF нажмите значок «Настройки» . Откроется окно «Заказное сканирование». Выберите Предлагать сканировать другой документ.
Нажмите Сканировать.
При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите ОК.
Выберите Посмотреть все инструменты > Создать PDF > Сканер > Настройки по умолчанию или Мои пользовательские настройки .
Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
Для изменения настроек нажмите значок «Настройки» . Откроется окно «Заказное сканирование». Выберите необходимые параметры сканирования.
Для сканирования нескольких файлов в PDF выберите Предлагать сканировать другой документ.
Если выбрать параметр Показать пользовательский интерфейс сканера вместо интерфейса Acrobat, то отобразятся другие диалоговые окна. Сведения о доступных параметрах см. в документации по сканеру. В Mac OS всегда отображается пользовательский интерфейс сканера.
Нажмите Сканировать.
При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите ОК.
Выберите Все инструменты > Сканирование и распознавание > Улучшить отсканированный файл.
Выберите параметры на дополнительной панели инструментов — нажмите значок «Настройки» и соответствующие параметры в диалоговом окне Улучшить отсканированный документ PDF, затем нажмите OK.
Дополнительные сведения об опциях, отображаемых в этом диалоговом окне, приведены в разделе Диалоговое окно «Улучшить отсканированный документ PDF».
Выберите Все инструменты > Создать PDF > Сканер.
Выберите предварительно установленные настройки сканирования: Автоопределение цветового режима, Черно-белый документ, Цветной документ, Документ в градациях серого или Цветная фотография.
Нажмите значок «Настройки» рядом с стилем. В зависимости от выбранного параметра отображается окно Заказное сканирование или Изменить предварительно установленные настройки для.
Для сканирования нескольких файлов в PDF выберите Предлагать сканировать другой документ.
Нажмите Сохранить настройки для сохранения стиля.
После выбора сканера можно по своему усмотрению выбрать или настроить различные параметры сканирования.
Сканер
Выберите установленный сканер. На компьютере должно быть установлено программное обеспечение от производителя сканера. Только в Windows: нажмите кнопку Параметры для указания параметров сканера.
Показать пользовательский интерфейс сканера
Выберите этот параметр, только если необходимо отобразить настройки в диалоговых окнах программы, предоставленной производителем сканера. Если этот параметр не выбран, сканирование начнется с использованием параметров, указанных в окне Заказное сканирование или Изменить предварительно установленные настройки.
Страницы
Укажите одностороннее или двухстороннее сканирование. Если выбрано значение С обеих сторон, но в собственных параметрах сканера указано сканирование страниц только с одной стороны, то параметры сканера заменят параметры Acrobat.
Двухстороннее сканирование можно выполнять, даже если сам сканер не поддерживает двухстороннее сканирование. При выборе параметра С обеих сторон после сканирования первых сторон появится диалоговое окно. Можно сложить в лоток сканируемые страницы документа в обратном порядке и выбрать параметр Сканировать обратную сторону (Обратный порядок страниц) в диалоговом окне. При этом создается документ PDF со всеми страницами в правильной последовательности.
Цветовая модель (только Windows)
Выберите одну из стандартных цветовых моделей (автоопределение, цветное, черно-белое или градации серого), поддерживаемых сканером. Данный параметр включен, если в параметрах сканера указано использование диалогового окна «Acrobat Scan» вместо приложения сканера.
Разрешение (только Windows)
Выберите разрешение, поддерживаемое сканером. Данный параметр включен, если в параметрах сканера указано использование диалогового окна «Acrobat Scan» вместо приложения сканера.
Если выбрать Цветовой режим или Разрешение, не поддерживаемые используемым сканером, то появится сообщение и откроется окно приложения сканера. Выберите другие параметры в окне приложения сканера.
Размер бумаги (только Windows)
Выберите размер бумаги или укажите собственные значения ширины и высоты.
Предлагать сканировать другой документ
Если такой режим выбран, диалоговое окно, запрашивающее сканирование дополнительных страниц, будет отображаться после каждого сеанса сканирования.
Качество > Оптимизация изображения
Выберите этот параметр для запуска процесса оптимизации документа PDF. Этот параметр используется для сжатия и фильтрации изображений отсканированного PDF. Нажмите значок Настройки, чтобы настроить оптимизацию с помощью параметров сжатия файла и фильтрации.
Качество > Оптимизация изображения > Малый размер/высокое качество
Перетащите ползунок для настройки баланса между размером файла и качеством.
Вывод > Добавить к существующему файлу
Добавление преобразованного отсканированного изображения к существующему файлу PDF. Выберите открытый файл из раскрывающегося списка или найдите и выберите нужный файл PDF.
Вывод > Создать новый PDF-файл
Создание документа PDF.
Вывод > Сохранить файлы
Создание нескольких файлов из нескольких бумажных документов. Нажмите значок Настройки и укажите требующиеся параметры: создание портфолио PDF из файлов, количество страниц в каждом файле и префикс имени файла.
Распознавание текста (OCR)
Выберите этот параметр для преобразования изображений с текстом, содержащихся в файле PDF, в текст с возможностью поиска и выбора. Данный параметр выполняет оптическое распознавание символов (OCR), а также распознавание шрифтов и макета страницы для изображения с текстом. Нажмите значок Настройки , чтобы указать необходимые параметры в диалоговом окне Распознавание текста – Настройки. См. Распознавание текста в отсканированных документах.
Добавить метаданные
Если этот параметр выбран, то после сканирования появляется диалоговое окно Свойства документа. В диалоговом окне Свойства документа можно добавлять метаданные или сведения об отсканированном документе в файл PDF. При создании нескольких файлов можно ввести общие метаданные для всех файлов.
Соответствие стандарту PDF/A
Выберите данный параметр, чтобы обеспечить соответствие создаваемого документа PDF стандартам ISO для PDF/A-1b.
В диалоговом окне Улучшить отсканированный документ PDF представлены элементы управления параметрами сжатия и фильтрации отсканированного изображения для документа PDF. Параметры по умолчанию подходят для широкого диапазона страниц документов, но при необходимости их можно изменить для повышения качества изображений, уменьшения размера файла или для настройки сканирования.
Применить адаптивное сжатие
Разделяет каждую страницу на черно-белые, цветные и области в градациях серого и выбирает режим, в котором сохраняется внешний вид при высокой степени сжатия каждого типа содержимого. Рекомендуемое разрешение сканирования — 300 точек на дюйм (dpi) для RGB-изображений и изображений в градациях серого; 600 dpi для черно-белого изображения.
Цветное сканирование/Сканирование в градациях серого
При сканировании цветных страниц или страниц в градациях серого выберите один из следующих параметров:
JPEG2000
Применяет сжатие JPEG2000 к цветному содержимому изображения (использование этой настройки не рекомендуется при создании файлов PDF/A; вместо этого используйте формат JPEG).
ZIP
Применяет сжатие ZIP к цветному содержимому изображения.
JPEG
Применяет сжатие JPEG к цветному содержимому изображения.
Сканер использует выбранный параметр Цветное/Градации серого либо параметр Монохромное. Выбор зависит от параметров, указанных в диалоговом окне Сканирование Acrobat или в интерфейсе сканера TWAIN, который открывается при нажатии кнопки Сканировать в диалоговом окне Сканирование Acrobat. (по умолчанию диалоговое окно приложения сканера не открывается).
Монохромное сканирование
При сканировании черно-белых или однотонных страниц выберите один из следующих параметров.
JBIG2 (без потери качества) и JBIG2 (с потерями качества)
Применяет способ сжатия JBIG2 для входных черно-белых страниц. При значениях параметров высокого уровня качества используется сжатие без потерь; при низких значениях текст сжимается сильнее. Текстовые страницы обычно на 60% меньше, чем сжатые по алгоритму CCITT Group 4 страницы, но процесс сжатия занимает больше времени. Совместимый с Acrobat 5.0 (PDF 1.4) и более поздними версиями.
Для совместимости с Acrobat версии 4.0 используйте метод сжатия, отличный от JBIG2.
CCITT Group 4
Применяет сжатие по алгоритму CCITT Group 4 для черно-белых входных изображений страниц. Этот быстрый способ сжатия без потерь совместим с Acrobat 3.0 (PDF 1.2) и более поздними версиями.
Небольшой объем/Высокое качество
Настройка баланса между размером файла и качеством.
Выровнять страницу
Поворачивает любую страницу, стороны которой не перпендикулярны сторонам области сканирования, для вертикального выравнивания страницы PDF. Выберите Вкл или Выкл.
Удаление фона
Окрашивает в белый цвет близкие к белому области при цветном входном изображении или изображении в градациях серого (но не для черно-белых изображений).
Для наилучших результатов настройте параметры контрастности и яркости сканера, чтобы на отсканированной обычной черно-белой странице текст был темно-серого или черного цвета, а фон был белым. Тогда при выбранных параметрах Выкл или Низкое результаты будут лучше. При сканировании белого документа с желтым оттенком или газетной бумаги выберите параметры Среднее или Высокое для очистки страницы.
Удаление растра
Удаляет структуру полутоновых точек, которая может снизить степень сжатия JPEG, вызвать муар и сделать текст трудным для распознавания. Подходит для сканирования с разрешением 200–400 dpi RGB-изображений и изображений в градациях серого, для параметра Адаптивное сжатие и при сканировании с разрешением от 400 до 600 dpi черно-белых изображений. При выборе параметра Вкл (рекомендуется) применяется фильтр для сканирования с разрешением 300 dpi (или выше) RGB-изображений и изображений в градациях серого. Выберите Выкл при сканировании страницы без иллюстраций или заполненных областей или при сканировании с разрешением выше, чем в рабочем диапазоне.
Четкость текста
Делает текст отсканированного файла PDF более четким. Значение по умолчанию (низкое качество) подходит для большинства документов. Увеличьте его, если качество печатаемого документа низкое, а текст неясен.
Язык документа
По умолчанию язык текста для распознавания выбирается из региональных настроек, заданных по умолчанию. Чтобы изменить язык, нажмите «Редактирование» и выберите другой язык.
Вывод
«Изображение с поиском» или «Редактируемый текст и изображения».
Сканирование из Acrobat принимает изображения с разрешением в диапазоне 10–3000 dpi. При выборе параметра Изображение с возможностью поиска или ClearScan в разделе Стиль вывода PDF требуется разрешение выводимого изображения не ниже 72 точек на дюйм. Кроме того, разрешение выводимого изображения, превышающее 600 dpi, будет уменьшено до 600 dpi или менее.
Сжатие изображения без потери качества может выполняться только с монохромными изображениями. Для сжатия отсканированного изображения без потери качества выберите в разделе «Параметры оптимизации» диалогового окна «Оптимизация отсканированного PDF» один из следующих параметров: «CCITT Group 4» или «JBIG2 (без потери качества)» для монохромных изображений. Если это изображение добавлено к документу PDF, можно сохранить файл с помощью параметра Сохранить; отсканированное изображение остается без сжатия. Отсканированное изображение может быть сжато при сохранении файла PDF с помощью команды «Сохранить как».
Для большинства страниц сканирование в черно-белом режиме при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность оптического распознавания символов несколько снижается и количество ошибок распознавания шрифта возрастает; при разрешении 400 dpi и выше обработка замедляется, а размер файлов со сжатыми страницами увеличивается. Если на странице содержится много нераспознанных слов или текст небольшого размера (9 пунктов и меньше), попытайтесь выполнить сканирование в более высоком разрешении. Когда это возможно, сканируйте в черно-белом режиме.
Если функция Оптическое распознавание символов выключена, можно использовать разрешение в диапазоне 10–3000 точек на дюйм, рекомендованное разрешение — не менее 72 точек на дюйм. Для параметра адаптивного сжатия рекомендуемые разрешения при сканировании: 300 точек на дюйм для изображений в градациях серого и RGB и 600 точек на дюйм для черно-белых изображений.
Страницы, отсканированные в режиме 24-разрядных цветов, 300 dpi, размером 8,5 х 11 дюймов (21,59 х 27,94 см) до сжатия представляют собой изображения большого размера (25 МБ). Системе может потребоваться 50 МБ виртуальной памяти и более для сканирования изображения. При разрешении 600 точек на дюйм процесс сканирования и обработки обычно происходит в четыре раза медленнее, чем при разрешении 300 точек на дюйм.
Избегайте настройки параметров полутонов и диффузионного смешения сканера. Это может улучшить внешний вид, но станет сложно распознавать текст.
Для текстов, распечатанных на цветной бумаге, рекомендуется увеличить яркость и контрастность примерно на 10%. Если сканер обеспечивает световую фильтрацию, следует подавить цвет фона при помощи специального фильтра или лампы. Или, если текст не подавляется, попробуйте настроить контрастность и яркость сканера, чтобы очистить отсканированный документ.
Если у сканера есть ручное управление яркостью, настройте его так, чтобы символы были четкими и имели правильную форму. Если символы соединены между собой, используйте более высокие параметры (более яркого цвета). Если символы разделены, используйте более низкие параметры (более темного цвета).
Для исправления ошибок и решения проблем, связанных со сканером, обратитесь к следующей документации по устранению неполадок:
Вы можете использовать Acrobat для распознавания текста в ранее отсканированных документах, которые уже были преобразованы в PDF. Функция распознавания текста позволяет искать, исправлять и копировать текст в отсканированном файле PDF. Для применения оптического распознавания символов к файлу PDF исходное разрешение сканера должно быть 72 точки на дюйм или выше.
Сканирование при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность OCR снижается.
Выберите Все инструменты > Сканирование и распознавание > В этом файле.
На дополнительной панели инструментов отображаются параметры распознавания текста.
На дополнительной панели инструментов выберите диапазон страниц и язык для распознавания текста.
Если нужно, нажмите Настройки, чтобы открыть диалоговое окно «Распознавание текста», и укажите необходимые настройки.
Выберите Распознать текст. Acrobat создает текстовый слой в PDF, по которому можно выполнять поиск, и который можно копировать и вставлять в новый документ.
Выберите Все инструменты > Сканирование и распознавание > В нескольких файлах.
В диалоговом окне Распознавание текста выберите Добавить файлы, затем команду Добавить файлы, Добавить папки или Добавить открытые файлы. Затем выберите файлы или папки. Появляется диалоговое окно Параметры вывода.
В диалоговом окне Параметры вывода укажите папку и установки для имен файлов. Нажмите ОК.
В диалоговом окне Общие параметры распознавания текста выберите необходимые настройки и нажмите ОК.
Acrobat создает текстовый слой в PDF, по которому можно выполнять поиск, и который можно копировать и вставлять в новый документ.
Язык документа
Задает язык для системы оптического распознавания символов с целью идентификации символов.
Вывод (стиль выходного файла PDF)
Определяет тип создаваемого документа PDF. Для всех параметров требуется, чтобы разрешение сканирования было не меньше 72 dpi или выше (рекомендуется). Во всех форматах оптическое распознавание символов и распознавание шрифтов и макета страницы применяется к текстовым изображениям, после чего они преобразуются в обычный текст.
Изображение с поиском
Устанавливает, что текст доступен для поиска и выделения. Данный параметр сохраняет исходное изображение, при необходимости выравнивает страницу и размещает над ним невидимый слой текста. Выбор параметра Понизить разрешение изображений в этом же диалоговом окне определяет, будет ли понижено разрешение изображения и до какой степени.
Изображение с поиском (точно)
Устанавливает, что текст доступен для поиска и выделения. Данный параметр сохраняет исходное изображение и размещает над ним невидимый слой текста. Рекомендуется в случаях, где необходима максимальная степень соответствия исходному изображению.
Редактируемый текст и изображения
Синтезирует новый пользовательский шрифт, максимально похожий на исходный, и сохраняет фон страницы, используя копию с низким разрешением.
Даунсамплинг
Понижает количество пикселей в цветных изображениях, изображениях в градациях серого и монохромных изображениях после завершения распознавания текста. Выберите степень понижения разрешения, которую нужно применить. Большее значение задает более высокий порог, с которого начинается обработка, и в итоге в документах PDF разрешение будет не ниже заданного в этом поле.
При выполнении оптического распознавания символов на отсканированном документе Acrobat анализирует растровые изображения текста и заменяет растровые области словами или символами. Если идеальная замена не ясна, Acrobat отмечает слово как сомнительное. Сомнительные элементы отображаются в PDF как исходное растровое изображение слова, но текст содержится на невидимом слое за растровым изображением слова. Этот метод делает слово доступным для поиска даже в том случае, если отображается его растровое изображение.
Примечание. Если попытаться выделить текст в отсканированном файле PDF без применения оптического распознавания символов или выполнить действие Чтение вслух с файлом изображения, Acrobat отобразит запрос о запуске оптического распознавания символов. Если нажать «ОК», откроется диалоговое окно Распознавание текста, в котором можно выбрать параметры, подробно описанные в предыдущем разделе.
Выберите Все инструменты > Сканирование и распознавание > Правильно распознанный текст.
Acrobat определяет возможные ошибки в тексте и отображает изображение и текст рядом друг с другом на дополнительной панели инструментов Все сомнительные слова на странице заключены в рамки.
Выберите выделенный объект или поле в документе, а затем исправьте его в поле Определяется как на дополнительной панели инструментов. Нажмите Принять.
Будет выделен следующий сомнительный элемент. Исправьте ошибки, если требуется. Нажмите Принять для каждого исправления.
После завершения этой задачи нажмите Закрыть на дополнительной панели инструментов.