Как исправить иероглифы в пдф
Сменить кодировку текста pdf
Нашёл решение для моих случаев:
После этого у output.pdf невероятным образом появляется верная кодировка.
В Windows исполняемый файл должен называться gsw32c, gswin32c, или тоже gs.
Дмитрий Власов:
У меня при выполнении данных действий Ghostscript выдаёт ошибку:
Error: /undefined in C:\
Operand stack:
Не подскажете, как решить проблему? Win7 32
R80: попробуйте слеш в пути к файлу другую сторону развернуть, проверьте, что взяли пути в кавычки, или просто указывайте относительные пути вместо полных. Судя по «Last OS error: No such file or directory», не получилось распознать путь, который вы задали.
Чтобы не мучаться с путями, добавьте в PATH путь к бинарнику gs, тогда будет удобно и коротко, как в моем изначальном решении
Впрочем, через полтора месяца после вопроса это уже может быть и неважно 🙂
Leonid Fedotov, Безусловно уже слегка поздновато, но вдруг пригодится еще кому-нибудь.
Для преобразование текста(без должно форматирования, к сожалению) можно сделать так:
Открыть notepad++, создать новый файл с кодировкой в которой у вас текст(выбрать кодировку в настройках их которой нужно конвертировать), сохранить, скопировать кракозабры(текст из pdf файла cp1252), заменить кодировку на cp1251 в меню.
После этого текст будет читаем и им можно будет воспользоваться.
(понимаю, что некропостинг, но т.к. нормального рабочего ответа по восстановлению без исходников в сети не нашел, то может быть этот вариант будет еще кому-то полезен)
Исправляем иероглифы при печати pdf файла
Всем привет! При печати pdf файла на принтере печатаются иероглифы или как говорили мои бухгалтера на старой работе «Николай, подойди у нас при печати pdf абракадабра распечатывается». Сегодня на работе возникла такая же ситуация и т. к. я стараюсь в своем блоге описывать по максимуму решения таких проблем и решил выложить инструкцию по исправлению иероглифов в pdf файлах. Так вот эту проблему можно решить как минимум тремя способами (может есть и еще но я опишу те, использовал ).
Решение:
1 Способ.
Это самый надежный и проверенный временем способ!!
Перейти в HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\FontSubstitutes.
Удалить параметры: «Courier,0»=»Courier New,204″ «Arial,0»=»Arial,204″.
2 Способ.
Возможно проблемы со шрифтами на принтере. Попробуйте распечатать документ как изображение. При отправке на принтер, когда откроется окно Print (Печать) с изображением страницы, нажмите внизу кнопку Advanced (Дополнительно). Далее в настройках поставьте флажок «print as image» (печатать как изображение).
3 Способ.
Этот способ самый действенный и кардинальный, так как решение данной проблемы будет осуществлен на уровне реестра Windows:
Создаем reg файл и вносим в него следующие строки:
Сохраняем, запускаем, соглашаемся со всем что он скажет и перезагружаем компьютер.
Вот и все. Таким образом мы научились исправлять иероглифы при печати pdf документа. Всем спасибо за внимание.
Кракозябры (иероглифы) при копировании с PDF документа
Я не уверен, что следующие советы помогут для всех решить проблему, но частичное решение ее все же возможно.
Давайте сразу отбросим отсканированые и нераспознанные PDF документы, из которых просто невозможно скопировать текст. Это равносильно попытке копирования текста из обычной фотографии, сделанной на ваш смартфон. В таком случае текст нужно распознать специальной программой, вроде ABBYY FineReader.
Наша книга (тестовая) полностью поддерживает копирование текста и изображений. Но при попытке перенести такой текст в Microsoft Office Word, можно видеть такие нечитабельные символы как на скриншоте сверху статьи.
Способ 1 (длинный).
Чтобы узнать какие именно нужно инсталлировать на компьютер шрифты, нужно открыть наш PDF документ поддерживаемой программой (на примере PDF-XChange Viewer ). Далее идем в «Файл» → «Свойства документа» (можно нажать сочетание клавиш Ctrl + D).
Далее копируем и вставляем текст из PDF документа, выделяем его в Microsoft Office Word (или в другом офисном редакторе, который у вас установлен) и выбираем из списка недавно установленный шрифт. Все должно быть нормально. Снизу на скриншоте видно, что я намеренно применил нужный шрифт только на одно предложение, другую часть текста прочитать невозможно.
Способ 2 (быстро и удобно).
Способ 3 (онлайн).
Кто не хочет использовать программу Shtirlitz или она не работает, может использовать следующие онлайн сервисы для перекодирования (отдельные сервисы имеют ограничения по объему текста).
Обратите внимание, что кодирование нашей тестовой книги windows-1252. Для нас нужна кодировка windows-1251. Поэтому переходим на сервис online-decoder.com.
Там можно видеть окно, где написано «Скопируйте сюда текст». Вставляем наш непонятный текст и нажимаем на кнопку «Подбор». Такой способ будет правильно использовать если вам неизвестна система кодирования. Декодер попытается подобрать ее автоматически. Если вы знаете исходное кодирование своей кракозябры, то можете смело нажимать кнопку «Точно», указав перед этим кодирование, напротив текста «Я знаю нужные кодировки».
Второй сервис «artlebedev.ru». Есть два способа для декодирования: «Просто» и «Сложно». Первый вариант работает на автомате. Второй – дает возможность, при необходимости, указать исходное и конечное кодирование.
Третий онлайн сервис для декодирования текста «2cyr.com» имеет отличие от предыдущих в том, что позволяет выбирать язык. Кроме русского, доступен также и украинский язык интерфейса (и надеюсь, что кодирования также, просто не было возможности проверить).
Все три сервиса отлично работали на моей тестовой книге в формате PDF с кракозябрами.
Способ 4 (с помощью макросов для Microsoft Office Word ).
Еще один вариант для программы Microsoft Office Word. Никаких шрифтов ставить не нужно. Создаем макрос со следующим кодом:
Код 1: «Перекодирование 1252 в 1251»
Sub Corr1252_1251()
Dim s$, i&, j&
s = Selection
For i = 1 To Len(s)
j = AscW(Mid$(s, i, 1))
If j
Код 2: «Перекодирование 1252 в 1251 (с учетом русской буквы Ё)»
‘ Замена Ё и ё
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ChrW(168)
.Replacement.Text = «Ё»
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ChrW(184)
.Replacement.Text = «ё»
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
End Sub
Выделяем вставленный текст с иероглифами. Тогда запускаем макрос на выполнение и получаем нормальный текст, который можно спокойно редактировать, изменять шрифты и т.д.
Для добавления готового макроса в Word делаем следующее:
Открываем редактор и переходим в «Вид».
Там находим кнопку «Макросы» и нажимаем на нее.
Даем для макроса имя (любое, оно будет автоматически изменено при полном копировании кода выше).
Откроется окно в котором можно заметить название нашего макроса. При желании можете оставить свое имя. Но лучше, чтобы не было ошибок, полностью заменить весь код на готовый (код смотрите сверху).
Как видно, макрос начинается так:
Sub названиемакроса()
дальше идет код макроса
End Sub
Название макроса может любым, но не цифры и не должно быть пробелов. Может быть так: декодирование_кракозябр_с_ё. Но не может быть так: декодирование кракозябр с ё.
То есть, для нас нужно заменить для нашего созданного пустого макроса весь текст с кодом, который показан выше.
После того как заменили, нужно закрыть окно редактирования макросов (можно нажать на иконку сохранения, хотя изменения сохраняются автоматически). Далее выделяем наш иероглифический текст, открываем макросы, выбираем из списка (если их у вас несколько) нужный и нажимаем на кнопку «Выполнить».
Ваш текст должен стать читабельным.
Источник макросов для Microsoft Office Word: http://wordexpert.ru
Как ни крути, но это не полное решение ситуации. Поиск после данных действий в самом PDF документе работать не будет. Проблема остается. Кто может подсказать ее решение, просьба писать в комментариях.
Закорючки, иероглифы кракозябры при копировании из pdf
ПОСТ СДЕЛАН ДЛЯ ОБЛЕГЧЕНИЯ ПОИСКА ПОДОБНОЙ ИНФОРМАЦИИ В ИНТЕРНЕТЕ
Я не могу скопировать текст из PDF файла
Пробовал разные сайты по конвертации из PDF в WORD ничего не помогало
Адекватного решения на просторах интернета я не нашел.
Пост для таких же как и я.
Решение оказалось простым это программа Adobe Acrobat.
Инструкция: 1) Открываем приложение Adobe Acrobat
3) Выбираем нужный нам файл ( у меня он был на рабочем столе)
4) В правом столбике (правой части экрана) ищем иконку в виде листика со стрелочкой в кружке, при наведение будет написано «Экспорт PDF» нажимаем
5) Далее нажимаем «Экспорт» и выбираем папку куда сохранить файл.
Студенческое общество
801 пост 3.4K подписчиков
@moderator, а можно добавить возможность менять сообщество также, как редактируем теги? Народ частенько промахивается, а сделать ничего нельзя каждый раз.
Автору: совет дельный, конечно, но PDF формат был разработан Adobe, которая, собственно, и делает Acrobat специально для работы с этим форматом, поэтому совсем неудивительно, что без Акробата у вас были проблемы с копированием из файла, особенно если файл был специально так сделан, например.
Да ты просто гений!
Спасибо, полезная информация, хоть и немного не своевременно, но может кому-то еще это реально поможет.
Где ты был 5 лет назад, но спасибо
А Сергей знает толк в пожертвованиях
Бедные куры
Еще можно защищать цветы от пчел.
Ответ на пост «В Чечне наградили 22-летнюю дочь Рамзана Кадырова Айшат медалью «За защиту прав человека»»
Есть на эту тему анекдот, так и не вспомнил, долго гуглил, но нашёл только сокращённую версию
«для папы»
Бразильские развлечения
Следите за речью, молодой человек
Погода
Немного хороших новостей
Девочке-вундеркинду Алисе Тепляковой из МГУ рекомендовано приостановить обучение в высшей школе, заявил РИА Новости член СПЧ Александр Асмолов.
По его словам, присутствует вероятность того, что эксперимент с обучением может повлечь за собой нарушения психического развития девочки.
Пудинг
В детстве, когда я читал книгу «Мэри Поппинс», мне безумно хотелось попробовать блюдо, которое там называлось «пудинг».
Совершенно нигде нельзя было узнать, что это такое, и я попросил приготовить «пудинг» маму.
Так я узнал, что дети в Англии фанатеют от рисовой каши с вареньем на завтрак.
Именно
Новый телескоп запустили сегодня
я понимаю, что «боже мой да всем насрать»,
но вчера с тропического космодрома Гвианы таки запустили новый космический телескоп, который должен дать гораздо больше информации, чем старичок Хаббл. Строили этот телескоп 25(!!) лет, еще месяц он будет добираться до своей орбиты, постепенно раскладываясь в рабочую конфигурацию. Это видимо самый сложный космический проект человечества, будем надеяться что он доберется до своей стоянки и передаст нам новые картины красоты вселенной. Картинка уже была, но она впечатляет сложностью всех этапов разворачивания телескопа в рабочее положение.
Ответ на пост «О лампах в подъезде»
Действительно странно, но скорее всего дело в какой нибудь полоумной бабке соседке, которая считает, что эти ваши домофоны много липиздричества жрут, а вы буржуи еще и свет тратите.
Была у нас такая бабуля (царствие ей небесное), которая вела неравный бой с рептилойдом Чубайсом, и его пособниками в лице половины жителей подъезда.
На собрании жильцов, бабуля, заручившись поддержкой старшей по дому и еще нескольких пенсионеров, зачитала целую лекцию о перерасходе электроэнергии. Т.к. из всех молодых жителей подъезда был только я один, то практически единогласно «пенсионный фонд» принял решение, вкрутить самые слабые лампочки и подъезд погрузился во тьму.
Ну а дальше ситуация с бабулей разрешилась сама собой, наступил ковид, бабуля заболела и отъехала в мир иной. Ну а в подъезде стало чуточку светлее.
Как изменить кодировку в pdf
Ответы
Если проблема действительно в том, что вы описываете, Notepad ++ должен делать то, что вы хотите, это бесплатно. Создайте новый документ в Notepad ++, убедитесь, что в меню «Кодирование» выбран «Кодировать в ANSI», вставьте туда текст, затем выберите «Преобразовать в UTF-8 без спецификации» в меню «Кодирование».
Я не уверен, что следующие советы помогут для всех решить проблему, но частичное решение ее все же возможно.
Давайте сразу отбросим отсканированые и нераспознанные PDF документы, из которых просто невозможно скопировать текст. Это равносильно попытке копирования текста из обычной фотографии, сделанной на ваш смартфон. В таком случае текст нужно распознать специальной программой, вроде ABBYY FineReader.
Наша книга (тестовая) полностью поддерживает копирование текста и изображений. Но при попытке перенести такой текст в Microsoft Office Word, можно видеть такие нечитабельные символы как на скриншоте сверху статьи.
Способ 1 (длинный).
Чтобы узнать какие именно нужно инсталлировать на компьютер шрифты, нужно открыть наш PDF документ поддерживаемой программой (на примере PDF-XChange Viewer ). Далее идем в «Файл» → «Свойства документа» (можно нажать сочетание клавиш Ctrl + D).
Далее копируем и вставляем текст из PDF документа, выделяем его в Microsoft Office Word (или в другом офисном редакторе, который у вас установлен) и выбираем из списка недавно установленный шрифт. Все должно быть нормально. Снизу на скриншоте видно, что я намеренно применил нужный шрифт только на одно предложение, другую часть текста прочитать невозможно.
Способ 2 (быстро и удобно).
Другой, более правильный и простой вариант – это использование программы (или плагина к редактору Notepad ++ ), которая называется Shtirlitz. Программа старая, давно не обновлялась, однако работает отлично. Прямо на лету выполняется вставка нормального текста. Никаких шрифтов не требуется. После копирования текста с данной программы и дальнейшей вставкой его в редактор Microsoft Office Word, все буквы и символы будут читаться и с использованием любого шрифта. Первый вариант не позволяет изменить шрифт. То есть, всегда, и на каждом компьютере нужно будет инсталлировать нужные шрифты для чтения только определенного документа. А если таких документов несколько сотен? Поэтому желательно воспользоваться этой программой для декодирования.
Способ 3 (онлайн).
Кто не хочет использовать программу Shtirlitz или она не работает, может использовать следующие онлайн сервисы для перекодирования (отдельные сервисы имеют ограничения по объему текста).
Обратите внимание, что кодирование нашей тестовой книги windows-1252. Для нас нужна кодировка windows-1251. Поэтому переходим на сервис online-decoder.com.
Там можно видеть окно, где написано «Скопируйте сюда текст». Вставляем наш непонятный текст и нажимаем на кнопку «Подбор». Такой способ будет правильно использовать если вам неизвестна система кодирования. Декодер попытается подобрать ее автоматически. Если вы знаете исходное кодирование своей кракозябры, то можете смело нажимать кнопку «Точно», указав перед этим кодирование, напротив текста «Я знаю нужные кодировки».
Второй сервис «artlebedev.ru». Есть два способа для декодирования: «Просто» и «Сложно». Первый вариант работает на автомате. Второй – дает возможность, при необходимости, указать исходное и конечное кодирование.
Третий онлайн сервис для декодирования текста «2cyr.com» имеет отличие от предыдущих в том, что позволяет выбирать язык. Кроме русского, доступен также и украинский язык интерфейса (и надеюсь, что кодирования также, просто не было возможности проверить).
Все три сервиса отлично работали на моей тестовой книге в формате PDF с кракозябрами.
Способ 4 (с помощью макросов для Microsoft Office Word ).
Еще один вариант для программы Microsoft Office Word. Никаких шрифтов ставить не нужно. Создаем макрос со следующим кодом:
Код 1: «Перекодирование 1252 в 1251»
Sub Corr1252_1251()
Dim s$, i&, j&
s = Selection
For i = 1 To Len(s)
j = AscW(Mid$(s, i, 1))
If j ‘ Debug.Print i & vbTab & Mid$(s, i, 1) & vbTab & j & vbTab & Chr(j)
End If
Next
Selection.Text = s
End Sub
Код 2: «Перекодирование 1252 в 1251 (с учетом русской буквы Ё)»
‘ Замена Ё и ё
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ChrW(168)
.Replacement.Text = «Ё»
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
.Text = ChrW(184)
.Replacement.Text = «ё»
.Forward = True
.Wrap = wdFindContinue
End With
Selection.Find.Execute Replace:=wdReplaceAll
End Sub
Выделяем вставленный текст с иероглифами. Тогда запускаем макрос на выполнение и получаем нормальный текст, который можно спокойно редактировать, изменять шрифты и т.д.
Для добавления готового макроса в Word делаем следующее:
Открываем редактор и переходим в «Вид».
Там находим кнопку «Макросы» и нажимаем на нее.
Даем для макроса имя (любое, оно будет автоматически изменено при полном копировании кода выше).
Откроется окно в котором можно заметить название нашего макроса. При желании можете оставить свое имя. Но лучше, чтобы не было ошибок, полностью заменить весь код на готовый (код смотрите сверху).
Как видно, макрос начинается так:
Sub названиемакроса()
дальше идет код макроса
End Sub
Название макроса может любым, но не цифры и не должно быть пробелов. Может быть так: декодирование_кракозябр_с_ё. Но не может быть так: декодирование кракозябр с ё.
То есть, для нас нужно заменить для нашего созданного пустого макроса весь текст с кодом, который показан выше.
После того как заменили, нужно закрыть окно редактирования макросов (можно нажать на иконку сохранения, хотя изменения сохраняются автоматически). Далее выделяем наш иероглифический текст, открываем макросы, выбираем из списка (если их у вас несколько) нужный и нажимаем на кнопку «Выполнить».
Ваш текст должен стать читабельным.
Источник макросов для Microsoft Office Word: http://wordexpert.ru
Как ни крути, но это не полное решение ситуации. Поиск после данных действий в самом PDF документе работать не будет. Проблема остается. Кто может подсказать ее решение, просьба писать в комментариях.
При экспорте PDF в файлы других форматов с помощью инструмента «Экспортировать PDF» для каждого из форматов существуют собственные уникальные параметры преобразования.
В этом документе приведены инструкции по работе с Acrobat DC. Инструкции по работе с Acrobat Reader DC см. в статье Возможности Adobe Reader. При использовании Acrobat XI см. Справка Acrobat XI.
Параметры Adobe PDF (Acrobat Pro DC)
С помощью диалогового окна «Оптимизация PDF» файлы PDF можно заново сохранить как оптимизированные. В окне «Оптимизация PDF» можно менять параметры совместимости файлов PDF так, чтобы просматривать их в старых версиях программ Acrobat DC или Reader DC. Если изменить параметры совместимости, более новые функции будут недоступны в файлах PDF. Сведения о каждом параметре совместимости см. в разделе Уровни совместимости PDF.
Если каждый раз при преобразовании документов PDF в конкретный формат нужно применять одни и те же настройки, укажите их в диалоговом окне «Установки». На панели Преобразование из PDF выберите файловый формат из списка и щелкните Изменить параметры (установки по умолчанию можно в любое время восстановить, нажав кнопку «Восстановить значения по умолчанию»).
Параметры преобразования изображений
Параметры JPEG и JPEG2000
Если в документе PDF содержится набор изображений, их можно экспортировать по отдельности как файлы JPEG, PNG или TIFF, выбрав меню «Инструменты» > «Экспортировать PDF» > «Изображение» > «Экспорт всех изображений».
Обратите внимание, что доступность параметров зависит от выбранного формата преобразования документа (JPEG или JPEG2000).
В градациях серого/Цветные
Задает сжатие, уравновешивающее размер файла и качество изображения. Чем меньше файл, тем хуже качество изображения.
Разделение сжимаемого изображения на сегменты заданного размера (если высота или ширина изображения не кратна размеру сегмента, по краям используются частичные сегменты). Данные изображения для каждого сегмента сжимаются отдельно, восстановление их также можно выполнять по отдельности. Рекомендуется использовать значение по умолчанию, равное 256. Этот параметр доступен только для формата JPEG2000.
Определяет способ отображения файла. Доступно только для формата JPEG.
Отображает изображение после его полной загрузки. Данный формат JPEG распознается почти всеми веб-браузерами.
Оптимизирует качество цветного изображения и создает файлы меньших размеров. Не поддерживается некоторыми веб-браузерами.
Прогрессивный (3 прохода – 5 проходов)
Начальная загрузка изображения – с низким разрешением, затем по мере загрузки качество изображения улучшается.
RGB/CMYK/В градациях серого
Задает тип управления цветом, применяемый к выходному файлу, и встраивает ICC-профиль.
Если команда «Экспорт в» или «Экспорт всех изображений» используется для PDF-файла, содержащего изображения JPEG и JPEG 2000, и содержимое экспортируется в формате JPEG или JPEG 2000, полученное изображение при открытии в Acrobat DC может выглядеть иначе. Это может произойти в том случае, если в изображения встроены цветовые профили на уровне страницы, а не внутри данных изображения. В таком случае Acrobat DC не может использовать цветовой профиль на уровне страницы для сохраняемого изображения.
Задает цветовое пространство и разрешение выходного файла. Acrobat может определить эти параметры автоматически. Для преобразования цветных изображений в файл в градациях серого выберите «В градациях серого».
Более высокое разрешение, например 2400 ppi, подходит только для страниц маленького размера (до 173,38 мм).
Параметры PNG
Формат PNG используется для изображений в Интернете.
Определение чересстрочного изображения. Изображение отображается в веб-браузере только после полной загрузки. Adam7 создает изображение, которое отображается в веб-браузере с низким разрешением, пока загружается полный файл изображения. Adam7 позволяет сократить время загрузки и информирует средства просмотра о процессе загрузки, но при этом увеличивается размер файла.
Выбор алгоритма фильтрации.
Сжатие изображения без фильтра. Рекомендуется для индексированных и битовых изображений.
Оптимизация сжатия изображений с четными горизонтальными узорами или переходами.
Оптимизация сжатия изображений с четными вертикальными узорами.
Оптимизация сжатия шумов низкого уровня с помощью усреднения цветовых значений соседних пикселов.
Оптимизация сжатия шумов низкого уровня с помощью перераспределения соседних цветовых значений.
Применение алгоритма фильтрации, наиболее подходящего для изображения – «Под», «Над», «Усредненный» или «Контур». Выберите «Адаптивный», если неизвестно, какой фильтр использовать.
RGB/В градациях серого
Задание типа управления цветом для выходного файла и встраивания ICC-профиля.
Задает цветовое пространство и разрешение выходного файла. Acrobat может определить эти параметры автоматически. Для преобразования цветных изображений в файл в градациях серого выберите «В градациях серого».
Более высокое разрешение, например 2400 ppi, подходит только для страниц маленького размера (до 173,38 мм).
Параметры TIFF
TIFF представляет собой гибкий формат растрового изображения, поддерживаемый практически всеми приложениями рисования, обработки изображений и верстки. Разрешение определяется автоматически.
Задание формата сжатия. Значение по умолчанию CCITTG4 обычно обеспечивает наименьший размер файла. Сжатие ZIP также позволяет получить файлы малых размеров.
В некоторых приложениях невозможно открыть файлы TIFF, сохраненные со сжатием JPEG или ZIP. В таких случаях рекомендуется использовать сжатие LZW.
RGB/CMYK/В градациях серого/Другое
Задание типа управления цветом выводного файла.
Задает цветовое пространство и разрешение выходного файла. Acrobat может определить эти параметры автоматически. Для преобразования цветных изображений в файл в градациях серого выберите «В градациях серого».
Более высокое разрешение, например 2400 ppi, подходит только для страниц маленького размера (до 173,38 мм).
Параметры файлов Microsoft Word и RTF
Файл PDF можно экспортировать в формат Word (DOCX или DOC) или расширенный текстовый формат (RTF). Доступны следующие параметры.
Сохранить обтекание текстом
Указывает на то, что обтекание текстом должно быть сохранено.
Сохранить макет страницы
Указывает на то, что макет страницы должен быть сохранен.
Включить комментарии
Комментарии экспортируются в выходной файл.
Включить изображения
Изображения экспортируются в выходной файл.
Распознать текст при необходимости
Распознает текст, если файл PDF содержит изображения с текстом.
Выбрать язык
Указывает язык для оптического распознавания символов.
Параметры веб-страницы HTML
Одна страница HTML
Указывает, что при экспорте в формат HTML создается один файл HTML. Чтобы добавить панель навигации, включите следующие параметры:
Добавить кадр навигации на базе заголовков
Добавить кадр навигации на базе закладок
Несколько страниц HTML
Указывает, что при экспорте в формат HTML создается несколько файлов HTML. Чтобы разделить документ на несколько файлов HTML, выберите один из критериев.
Разделить по заголовкам документа
Разделить по закладкам документа
Указывает, экспортировать ли изображения при экспорте файла PDF в HTML.
Найти и удалить верхний и нижний колонтитулы
Указывает, необходимо ли удалить содержимое верхнего и нижнего колонтитулов в документе PDF из файлов HTML.
Распознать текст при необходимости
Распознает текст, если файл PDF содержит изображения с текстом.
Указывает язык для оптического распознавания символов.
Параметры электронной таблицы
Настройки книги Excel
Указывает, будет ли создан рабочий лист для каждой таблицы, страницы или всего документа.
Настройки формата чисел
Указывает десятичный разделитель и разделитель разрядов для числовых данных. Выберите один из следующих вариантов.
Определить десятичный разделитель и разделитель разрядов исходя из региональных настроек
Рассматривать следующие символы как десятичный разделитель и разделитель разрядов. Введите или выберите разделители в соответствующих полях.
Распознать текст при необходимости
Распознает текст, если файл PDF содержит изображения с текстом.
Указывает язык для оптического распознавания символов.
Параметры PostScript и Encapsulated PostScript (EPS)
Возможен экспорт файлов PDF в PostScript® для использования в приложениях печати и допечатной подготовки. Файл PostScript включает все комментарии DSC ( Document Structuring Conventions ) и другую дополнительную информацию, сохраняемую программой Adobe Acrobat Distiller ®. Из любого файла PDF можно также создать файл EPS, который можно будет использовать вместо файла PDF или открывать в других приложениях. Набор доступных параметров зависит от того, преобразуется ли документ в PostScript или EPS.
При создании файлов EPS для цветоделения в программе Acrobat Pro DC все изображения должны находиться в цветовом пространстве CMYK.
Файл описания принтера
Файл описания принтера (PPD) предоставляет сведения, необходимые для правильного форматирования файла PostScript при выводе на определенное выводное устройство. Аппаратно-независимый – создает только совмещенные (не цветоделенные) файлы PostScript или EPS. Acrobat по умолчанию – предоставляет исходную точку и ссылку для создания всех типов файлов PostScript и восстанавливает для преобразования все параметры по умолчанию. Формат Adobe PDF 7.0 совместим с большинством устройств. Этот параметр доступен только для формата PostScript.
ASCII или двоичный
Определяет выходной формат данных изображений. Двоичный формат обеспечивает меньший размер файлов, но его можно использовать не во всех рабочих процессах.
Определяет уровень совместимости с языком PostScript. Следует использовать Level 3 только в том случае, если устройство вывода обеспечивает его поддержку. Level 2 подходит для файлов EPS, предназначенных для размещения в других документах, цветоделение которых выполняется в составе этого документа. Используйте Level 2 для файлов EPS, импортируемых в приложения Майкрософт.
Определяет шрифты, которые будут включены в PostScript. Встроенные шрифты берутся из PDF, все прочие — из системы используемого компьютера.
Сохраняет оформление комментариев в конечном файле PostScript.
Преобразовать шрифты TrueType в Type 1
Преобразует шрифты TrueType в Type 1 в конечном файле PostScript.
Определяет создание файла просмотра TIFF для конечного файла EPS. Этот параметр недоступен в случае сохранения файла в формате PostScript.
Задает страницы для экспорта. При экспорте страниц в EPS каждая страница в диапазоне сохраняется в отдельном файле EPS.
Текст и параметры XML
Двоичные значения на основе международных стандартов, используемых для представления текстовых символов. UTF-8 – кодировка Юникода, в которой на каждый символ приходится один или несколько байтов по 8 бит, а в кодировке UTF-16 используются байты по 16 бит. ISO-Latin-1 – 8-битовое представление символов, являющееся расширением набора ASCII. UCS-4 – универсальный набор символов с кодировкой в 4 октетах. HTML/ASCII – 7-битовое представление символов, разработанное Американским национальным институтом стандартизации.
В таблице преобразования по умолчанию используется кодировка по умолчанию, определенная в таблицах преобразования, расположенных в папке Plug-ins/SaveAsXML/MappingTables. Такие таблицы соответствия определяют различные характеристики вывода данных, включая следующие стандартные кодировки: UTF-8 (сохранение в виде XML или HTML 4.0.1) и HTML/ASCII (сохранение в виде HTML 3.2).
Создает закладки для перехода по содержимому документов HTML или XML. Закладки размещаются в начале создаваемого документа HTML или XML.
Создать теги в файлах, в которых они отсутствуют
Создает теги для файлов, в которых они отсутствуют (например, для файлов PDF, созданных с помощью Acrobat 4.0 или более ранних версий). Если этот параметр не установлен, неразмеченные файлы не преобразуются.
Теги создаются только в процессе преобразования, затем они удаляются. С помощью этого метода нельзя создавать файлы PDF с тегами из устаревших файлов
Контролирует преобразование изображений. Ссылки на преобразованные файлы изображений находятся в документах XML и HTML.
Использовать вложенную папку
Задает папку, в которую сохраняются созданные изображения. По умолчанию используется папка Images.
Задает префикс, добавляемый к именам файлов изображений (на тот случай, если будет создано нескольких версий одного файла изображения). Изображениям присваиваются имена в формате имяфайла_img_#.
Задает выходной формат изображений. Формат по умолчанию – JPG.
Понижает разрешение графических файлов до заданного разрешения. Если эта опция не используется, файлы изображений сохраняются с разрешением исходных файлов. Увеличение разрешения файлов не используется никогда.
Справки по другим продуктам
На посты, размещаемые в Twitter™ и Facebook, условия Creative Commons не распространяются.
Вопросы сообществу
Получайте помощь от экспертов по интересующим вас вопросам.