Как выглядит пдф файл: Что такое PDF и как его сделать?

Содержание

Что такое PDF и как его сделать?

 
Что такое Adobe PDF
Как сделать PDF для печати

 

  

 

Формат переносимых документов (PDF) представляет собой универсальный файловый формат, который позволяет сохранить шрифты, изображения и сам макет исходного документа независимо от того, на какой из множества платформ и в каком из множества приложений такой документ создавался. Формат Adobe PDF считается признанным общемировым стандартом в области тиражирования и обмена надежно защищенными электронными документами и бланками. Файлы Adobe PDF имеют небольшой размер, и они самодостаточны; они допускают совместную работу, просмотр и печать с помощью бесплатной программы Adobe Reader®.

Отлично себя оправдывает использование формата Adobe PDF в издательском и печатном деле. Благодаря способности Adobe PDF сохранить совмещенный (композитный) макет, можно создавать компактные и надежные файлы, которые сотрудники типографии могут просматривать, редактировать, сортировать и получать с них пробные оттиски. Также в предусмотренный техпроцессом момент в типографии могут как непосредственно отправить файл на фотонаборное устройство, так и продолжить его завершающую обработку: осуществить предпечатные проверки, провести треппинг, спустить полосы или выполнить цветоделение.

Сохраняя документ в формате PDF, можно создать файл, соответствующий стандарту PDF/X. Формат PDF/X (формат обмена переносимыми документами) является разновидностью Adobe PDF, которая не допускает использования многих вариантов и сочетаний данных о цветности, шрифтов и треппинга, которые могут вызвать осложнения при печати. Документ PDF/X следует создавать в случае, когда PDF-файлы используются как цифровые оригиналы при допечатной подготовке изданий — как на этапе создания макета, так и для целей фотовывода (если программное обеспечение и выводящие устройства способны работать с форматом PDF/X).

О стандартах PDF/X. Стандарты PDF/X утверждены Международной организацией по стандартизации (ISO). Они применяются к обмену графическими данными. При преобразовании PDF-файл проверяется на соответствие заданному стандарту. Если PDF-документ не соответствует выбранному стандарту ISO, отображается сообщение, позволяющее выбрать между отменой преобразования и продолжением преобразования, при котором будет создан несоответствующий стандартам файл. Самое широкое распространение в издательском и печатном деле получили несколько разновидностей PDF/X: PDF/X-1a, PDF/X-3 и PDF/X-4.

 

Формат PDF/X-1a (2001 и 2003)

PDF/X−1a — это стандартный формат файлов, специально предназначенный для обмена готовыми к печати документами в виде электронных данных, при котором отправителю и получателю не требуется дополнительной договоренности для обработки информации и получения требуемых результатов в тираже. Фактически он является цифровым эквивалентом цветоделенных фотоформ.

Формат PDF/X-1a гарантирует, что:

  • все шрифты встроены
  • изображения встроены
  • определены параметры MediaBox и TrimBox или ArtBox
  • цвета представлены в формате CMYK, в формате смесевых цветов или в обоих форматах сразу
  • назначение вывода задано посредством описания условий печати или указания ICC профиля.

Примечание: назначение вывода определяет тип печатного процесса, к которому готовится файл, например, тип печатной машины, используемые краски и бумага.

PDF-файлы, соответствующие стандарту PDF/X-1a, могут быть открыты в Acrobat 4.0 и Acrobat Reader 4.0, а также в их более поздних версиях.

Набор PDF/X-1a предусматривает использование формата PDF 1.3, снижение разрешения цветных изображений и изображений в градациях серого до 300 ppi, а монохромных — до 1200 ppi, встраивание всех шрифтов в виде подмножеств символов, отсутствие встроенных цветовых профилей, а также сводит прозрачные области в соответствии с параметром «Высокое разрешение».

При использовании PDF/X−1a совместимых файлов вам больше не придется волноваться, что вас могут попросить предоставить недостающие шрифты или изображения. Вам больше никогда не придется сталкиваться с преобразованием изображения из RGB в CMYK без предварительного просмотра результатов. Решения о том, должен ли при печати файлов использоваться треппинг, будут приниматься на основании надежной информации. И, наконец, в типографии будут знать, что файл правильно подготовлен для печатной машины, на которой он будет печататься.

Размеры (page boxes) в PDF

MediaBox, CropBox, BleedBox, TrimBox и ArtBox — что это такое? Тот кто хотя бы раз сталкивался с форматом PDF более плотно, наверняка сталкивался с этими определениями. В то же время, как показал опыт, мало кто знает что это и зачем это нужно.

 

Формат PDF удобен тем что точно передаёт в одном файле содержание и внешний вид документа, будь то просто текст или сложная комбинированная (векторная и растровая) графика. Среди прочих параметров, в нём хранится и размер документа (страницы). Однако этот размер не так однозначен, как может показаться на первый взгляд, поскольку существует до 5!!! различных вариантов описания этого размера. Эти варианты описания называются page boxes. Переводом «page box» на русский, с максимальным сохранением смысла в контексте допечатной подготовки, будет что-то вроде граница страницы, область документа, граница документа и т.п. 

MediaBox — используется для определения ширины и высоты страницы. Media box определяет размер материала (например, бумаги) на котором производится печать, media box это самый большой бокс документа, остальные боксы могут быть такими же или меньше, но ни в коем случае не могут быть больше чем media box.

CropBox — видимая область страницы в Acrobat’е, которая содержит в себе какую-либо информацию. Crop box — прямоугольник минимального размера в который поместились бы все видимые объекты (текст, картинки, линии, номера страниц, колонтитулы и т.п.) документа. Размер crop box может быть таким же или меньше чем media box. Acrobat использует этот размер для отображения и печати документов. Иными словами, когда Вы открываете файл в Acrobat’е, то все, что вы видите в данный момент отображается в виде Crop box.

BleedBox — определяет размер документа вместе с вылетами. Вылеты — часть изображения которая обрезается после печати, нужна для того чтобы компенсировать погрешность процесса порезки. На рисунке до подрезки bleed box — 76х106 мм, а после подрезки в обрезной размер (TrimBox) — 70х100 мм.

TrimBox — определяет размер изделия (так называемый, обрезной размер). Это конечный размер после подрезки. TrimBox так же может сопровождаться метками реза (техническими элементами файла).

ArtBox — используется редко, определяет художественную часть изделия, важную его часть. Если говорить дословно — ту самую часть где по замыслу автора из изделия должен доноситься арт, креатив и т.п.  

 

 

Перед конвертацией в PDF все изображения должны быть переведены в CMYK. Если есть элементы, которые печатаются отдельными прогонами (пантоны), им должны быть назначены соответствующие цвета по палитрам Pantone Solid Coated/Uncoated. Цветовое пространство CMYK должно быть с профилем ISO Coated v2.

Если Ваш макет содержит прозрачности (или пантон с прозрачностью), которые невозможно доработать растрированием с фоном, то выберайте версию PDF не 1.3, а 1.5 — 1.6, чтобы прозрачности в растровых линках PSD/TIFF не бились и не создавали белых полос по периметру. Главное, чтобы прозрачности и эффекты не лежали поверх текста и векторных объектов.

Если используете PDF версий PDF 1.3, то знайте, что данная версия PDF не поддерживает использование эффектов прозрачности и смешения цветов (blending mode), поэтому при записи PDF 1.3 все эффекты преобразуются в простые объекты. 

  • Corel Draw (на примере X4, английская версия)

File >  Publish to PDF >  указать название файла только латинскими символами >  Settings  >  Compability: PDF/x-1a >  Закладка Prepress поставить флажок на Bleed Limit и указать значение 5 мм > Закладка Objects поставить флажок на Export all Text as curves >  Нажать ОК и сохранить файл.

  • Adobe Illustator (на примере CS4, английская версия)

File > Save As > указать название файла только латинскими символами, в выпадающем списке «тип файла» выбрать Adobe PDF. Сохранить >  в поле Adobe PDF выбрать пункт PDF/X-1a:2001 (PDF 1.6, если нужно сохранить прозрачности) >  в закладке Marks and Bleeds в разделе Bleeds выставить все значения по 5 мм (top, bottom, left, right) >  Save PDF

 

  • Adobe Photoshop (на примере CS4, английская версия)

File >  Save As > указать название файла только латинскими символами, в выпадающем списке «тип файла» выбрать Photoshop PDF. Сохранить >  в поле Adobe PDF Preset выбрать пункт PDF/X-1a:2001 >  в закладке Output, в разделе Color, Color Conversion: No Color Conversion, Profile Inclusion Policy: Don’t Include Profile >  Save PDF

 

  • Adobe InDesign (на примере CC, английская версия)

File >  Export… > указать название файла только латинскими символами, в выпадающем списке «тип файла» выбрать Adobe PDF. Сохранить >  в поле Adobe PDF Preset выбрать пункт PDF/X-1a:2001 (PDF 1.6, если нужно сохранить прозрачности) >  в закладке General, установить диапазон печати All, флажок Spreads должен быть снят > в закладке Marks and Bleeds, в разделе Bleeds выставить все значения по 5 мм (top, bottom, left, right) >  в закладке Output, в разделе Color, Color Conversion: No Color Conversion, Profile Inclusion Policy: Don’t Include Profile  >  Export

 

  • QuarkXPress (на примере 8.0, английская версия)

File >  Export > Layout as PDF > указать название файла только латинскими символами. Options >  в поле PDF Style выбрать пункт PDF/X-1a:2001 >  в закладке Pages, флажок Spreads должен быть снят > в закладке Bleed: Bleed Type – Symmetric, Amount 5 мм >  OК  >  Сохранить.

 

  • MS Office (на примере 2007).

Приложения MS Office не предназначены для подготовки файлов к высококачественной печати, поэтому даже конвертация макета в PDF не всегда избавляет от проблем. Гарантией того, что в готовом изделии Вы увидите то же, что и на мониторе, является только подписанная цветопроба. Минимизировать ошибки поможет сохранение документа в PDF. Сохранить как  >  Adobe PDF  >  Adobe PDF Conversion Options  >  поставить флажок на Make PDF/A-1а: 2005 compliant file >  Ok  >  указать название файла только латинскими символами  >  Сохранить файл

 

 

Сохранение или конвертация файлов в формат PDF или XPS в классической версии Project

Чтобы экспортировать или сохранить файл Office в формате PDF, откройте его и в меню Файл выберите пункт Экспорт или Сохранить как. Чтобы просмотреть пошаговые инструкции, выберите приложение Office в раскрывающемся списке.

  1. Откройте таблицу или отчет, которые требуется опубликовать в формате PDF.

  2. На вкладке Внешние данные в группе Экспорт нажмите кнопку PDF или XPS.

  3. В поле Имя файла введите или выберите имя документа.

  4. В списке Тип файла выберите PDF.

    • Если требуется высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. Нажмите кнопку ОК.

  6. Нажмите кнопку Опубликовать.

Эти сведения также относятся к Microsoft Excel Starter 2010.

Примечание: Вы не можете сохранять листы Power View как PDF-файлы.

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы от видите диалоговое окно Сохранить как в Excel 2013 или Excel 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

    • Если файл требуется открыть в выбранном формате после его сохранения, установите флажок Открыть файл после публикации.

    • Если необходимо высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. Подробную информацию о диалоговом окне «Параметры» в Excel см. в статье Дополнительные сведения о вариантах создания PDF. По завершении нажмите кнопку ОК.

  6. Нажмите кнопку Сохранить.



OneNote 2013 и OneNote 2016

  1. Откройте вкладку Файл.

  2. Нажмите кнопку Экспорт.

  3. В разделе Экспорт текущего элемента выберите часть записной книжки, которую необходимо сохранить в формате PDF.

  4. В разделе Выбор формата выберите пункт PDF (*.pdf) и нажмите кнопку Экспорт.

  5. В диалоговом окне Сохранить как в поле Имя файла введите название записной книжки.

  6. Нажмите кнопку Сохранить.


OneNote 2010

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как и выберите параметр, соответствующий части записной книжки, которую необходимо сохранить в формате PDF.

  3. В разделе Сохранить раздел как выберите пункт PDF и нажмите кнопку Сохранить как.

  4. В поле Имя файла введите имя для записной книжки.

  5. Нажмите кнопку Сохранить.

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы увидеть диалоговое окно Сохранить как в PowerPoint 2013 и PowerPoint 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

    • Если файл требуется открыть в выбранном формате после его сохранения, установите флажок Открыть файл после публикации.

    • Если необходимо высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. По завершении нажмите кнопку ОК.

  6. Нажмите кнопку Сохранить.

  1. На вкладке Файл выберите команду Сохранить как.
    Чтобы от видите диалоговое окно Сохранить как в Project 2013 или Project 2016, необходимо выбрать расположение и папку.

  2. В поле Имя файла введите имя файла, если оно еще не присвоено.

  3. В списке Тип файла выберите PDF-файлы (*.pdf) или XPS-файлы (*.xps) и нажмите кнопку Сохранить.

  4. В диалоговом окне Параметры экспорта документа укажите в пункте Диапазон публикации, следует ли Включить непечатаемые данные или использовать Совместимость с ISO 19500-1 (только для PDF).


Советы по форматированию

Приложение Project не поддерживает все возможные функции форматирования документов PDF или XPS, но с помощью некоторых параметров печати вы можете изменять вид конечного документа.

На вкладке Файл выберите пункт Печать, а затем измените любой из следующих параметров:

В диалоговом окне Параметры страницы вы можете изменить параметры на таких вкладках:

  • «Поля»,

  • «Легенда»,

  • «Вид».

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы диалоговое окно Сохранить как в Publisher 2013 или Publisher 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

  5. Если необходимо изменить способ оптимизации документа, выберите команду Изменить. (Щелкните Параметры в Publisher 2013 или Publisher 2016).

    • Внесите все необходимые изменения в разрешение изображения и непечатаемые сведения.

    • Чтобы изменить параметры печати документа, выберите Параметры печати.

    • По завершении нажмите кнопку ОК.

  6. Если после сохранения файл требуется открыть в выбранном формате, установите флажок Открыть файл после публикации.

  7. Нажмите кнопку Сохранить.

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы от видите диалоговое окно Сохранить как в Visio 2013 или Visio 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

    • Если файл требуется открыть в выбранном формате после его сохранения, установите флажок Автоматический просмотр файла после сохранения.

    • Если необходимо высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. Нажмите кнопку ОК.

  6. Нажмите кнопку Сохранить.


Word 2013 и более новые

  1. Выберите Файл > Экспорт > Создать PDF/XPS.

  2. Если свойства документа Word содержат информацию, которую вы не хотите включать в PDF-файл, в окне Опубликовать как PDF или XPS нажмите кнопку Параметры. Затем выберите пункт Документ и снимите флажок Свойства документа. Задайте другие нужные параметры и нажмите кнопку ОК.

    Дополнительные сведения о свойствах документа см. в разделе Просмотр или изменение свойств файла Office 2016.

  3. В окне Опубликовать как PDF или XPS выберите место, где нужно сохранить файл. При необходимости измените имя файла.

  4. Нажмите кнопку Опубликовать.


Дополнительные сведения о вариантах создания PDF

  • Чтобы преобразовать в формат PDF только некоторые страницы, укажите их в полях Страницы.

  • Чтобы включить исправления в PDF, в разделе Опубликовать установите переключатель в положение Документ с исправлениями. В противном случае убедитесь установите переключатель в положение Документ.

  • Чтобы создать набор закладок в PDF-файле, установите флажок Создать закладки, используя. Затем установите переключатель Заголовки или, если вы добавили закладки в свой документ, Закладки Word.

  • Если вы хотите включить в PDF-файл свойства документа, убедитесь в том, что флажок Свойства документа установлен.

  • Чтобы сделать документ удобней для чтения в программах чтения с экрана, установите флажок Теги структуры документа для улучшения восприятия.


  • Совместимость с ISO 19005-1 (PDF/A). Этот параметр предписывает создать PDF-документ, используя стандарт архивации 1.7 PDF. Стандарт PDF/A позволяет гарантировать, что при открытии на другом компьютере документ будет выглядеть точно так же.


  • Преобразовать текст в точечный рисунок, если невозможно внедрить шрифты. Если невозможно внедрить шрифты в документ, при создании PDF-файла используется точечный рисунок текста, чтобы PDF-документ выглядел так же, как оригинальный. Если этот параметр не выбран и в файле используется невстраиваемый шрифт, программа чтения PDF-файлов может применить другой шрифт.


  • Зашифровать документ с помощью пароля. Выберите этот параметр, чтобы ограничить доступ к PDF-файлу людям, у которых нет пароля. Когда вы нажмете кнопку ОК, Word откроет диалоговое окно Шифрование документа в формате PDF, в котором вы можете ввести пароль и его подтверждение.


Открытие PDF-файла в Word и копирование содержимого из него

Вы можете скопировать из PDF-документа нужное содержимое, открыв его в Word.

Выберите Файл > Открыть и найдите PDF-файл. Word откроет PDF в новом файле. Вы можете скопировать нужное содержимое, включая изображения и схемы.


Word 2010

Эти сведения также относятся к Microsoft Word Starter 2010.

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы увидеть диалоговое окно Сохранить как в Word 2013 и Word 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

    • Если файл требуется открыть в выбранном формате после его сохранения, установите флажок Открыть файл после публикации.

    • Если необходимо высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. По завершении нажмите кнопку ОК.

  6. Нажмите кнопку Сохранить.

Чтобы сохранить файл в формате PDF в Office для Mac, выполните эти простые действия:

  1. Откройте вкладку Файл.

  2. Нажмите кнопку Сохранить как.

  3. Щелкните Формат файла в нижней части окна.

  4. Выберите PDF в списке доступных форматов.

  5. Присвойте файлу имя, если оно еще не указано, а затем нажмите кнопку Экспорт.

С помощью Word, PowerPoint и OneNote в Интернете можно преобразовать документ в формат PDF.

  1. Выберите файл > печать >печать (в PowerPoint выберите один из трех форматов).

  2. В меню в области Принтер выберитесохранить в формате PDF, а затем — Сохранить.

  3. Затем в открываемом меню проводника можно назвать PDF-файл, выбрать, где его сохранить, а затем выбрать сохранить.

При этом приложение создаст обычный PDF-файл, в котором будут сохранены макет и форматирование исходного документа.

Если вам нужны дополнительные возможности для управления PDF-файлом, например добавление закладок, преобразуйте документ в ФОРМАТ PDF с помощью настольного приложения. Нажмите кнопку Открыть в настольном приложении на панели инструментов PowerPoint и OneNote, чтобы начать работу с классическим приложением, а затем в Word сначала выберите в word dropdown Editing (Редактирование), а затем выберите открыть в настольном приложении.

Если у вас нет настольного приложения, вы можете попробовать или купить последнюю версию Office сейчас.

У вас есть предложения для этой возможности?


Голосуйте за понравившиеся идеи или предлагайте свои в копилке идей на сайте word.uservoice.com.


Чтобы экспортировать документ Word или книгу Excel в файл формата PDF на устройстве с iOS, нажмите в левом верхнем углу кнопку Файл и выберите пункт Экспорт, а затем — PDF.

Что такое PDF файлы и почему мы все еще полагаемся на них?

Подробности




сентября 06, 2017




Просмотров: 9409


Вы открывали PDF на этой неделе? Скорее всего, вы регулярно работаете с ними. Несмотря на то, что некоторые другие типы файлов исчезают в неизвестности, PDF-файлы по-прежнему остаются популярным выбором. Вы когда-нибудь задумывались, почему это так? Давайте рассмотрим, как работают PDF-файлы, почему они так важны и почему они по-прежнему пользуются такой популярностью.

История PDF

PDF – расшифровывается как «Portable Document Format», что в переводе означает «Переносимый формат документов». Созданный Adobe, он впервые был запущен в начале 1990-х годов как способ полностью сохранить документ в одном файле. Поскольку интернет тогда был еще молод, они в основном использовались для публикации на рабочем столе документов для печати. Компании использовали PDF-файлы для сохранения плакатов, флаеров и других подобных файлов для физической печати.

Adobe Acrobat было нелегко заполучить, у PDF-файлов не было всех функций интеграции, которые они делают сегодня, и использование dial-up для загрузки большого PDF было очень медленным. Через несколько лет Adobe выпустила Adobe Reader бесплатно для всех, и в конечном итоге PDF выбил несколько конкурентов, чтобы стать файловым стандартом для фиксированных документов.

Интересно, что PDF был первоначально проприетарным форматом, что означает, что Adobe контролирует PDF-файлы и как они функционируют. В 2008 году они отказались от этого права собственности, и PDF стал открытым стандартом. Теперь PDF-файлы по-прежнему имеют базовый набор свойств, но они не зависят от Adobe. В самом деле, вы можете найти десятки других бесплатных PDF-читателей.

 

Как работают PDF-файлы

Чтобы понять, почему PDF был такой революцией, когда он только появился, мы должны понять, что такое этот стандарт в то время. В начале 90-х профессиональное программное обеспечение, используемое для создания графики и документов, приводило к невыносимо большим файлам, особенно когда в них были встроены изображения, шрифты и другие графические элементы. Помните, что машины в это время имели крошечную часть вычислительной мощности компьютера, который вы используете сегодня, что означает, что каждый бит эффективности был жизненно важен.

Чтобы исправить это, разработчики программного обеспечения начали использовать ссылки на другие ресурсы на компьютере. Предположим, вы использовали специальный шрифт в своем документе. Вместо того, чтобы сохранять все данные для этого шрифта внутри вашего документа, он вытащил необходимую информацию из установочной папки шрифта на вашем компьютере. Это уменьшило нагрузку на файл документа, сделав его более легким.

Это будет работать нормально, если вы не перемещаете шрифт на свой компьютер. Однако, если вы принесли файл на другой компьютер, у которого не было вашего конкретного шрифта, это выглядело бы неправильно. Вы можете представить себе сколько времени вы потратили на создание важного документа, а затем он стал выглядеть просто ужасно, потому что вы не сохранили ссылки на графические элементы.

PDF изменил это. Adobe нашла способ собрать все части файла и превратить его в более мелкие. Очевидно, что это намного эффективнее, чем обходные решения, которые разработчики использовали перед тем, как был представлен PDF.

И поэтому PDF стали стандартом.

 

Почему они так важны

Портативный формат PDF имеет большое значение: PDF-файлы выглядят одинаково независимо от того, на каком устройстве они просматриваются. Независимо от того, используете ли вы Windows 10, Mac, Chrome OS, Android, Windows Phone, iPad или Windows XP — на любом программном и аппаратном обеспечении, файлы PDF остаются неизменными. Информация, содержащаяся в PDF-файле, не зависит от устройства создателя или зрителя. Включение шрифтов, картинок, диаграмм и т. п. — это не борьба за PDF.

Сравните это с отправкой документа Microsoft Word. Что произойдет, если ваш получатель не имеет Microsoft Word на своем компьютере? Конечно, они могут открыть его в Документах Google, но документ при этом может сильно отличаться, поскольку Docs обрабатывает файлы по-разному. Если вы потратили много времени на создание таблиц, изображений и других элементов в правильном порядке, все это могло бы выйти из окна. И что, если они попытаются открыть документ Word на своем телефоне?

Как правило, PDF-файлы предназначены для просмотра. То, что вы видите, когда вы нажимаете «Сохранить», — это то, что получит кто-то другой, который просмотрит документ. И вам даже не нужно устанавливать программу — большинство современных браузеров открывают PDF-файлы без проблем. Хотя вы можете редактировать PDF-файлы, вы ограничены несколькими вариантами, если не заплатите за премиальное программное обеспечение, такое как Adobe Acrobat, Foxit PhantomPDF или Nitro.

 

Почему они все еще популярны

В дополнение к переносимости, описанной выше, PDF-файлы имеют несколько функций, которые способствовали их постоянной популярности.

Во-первых, PDF-файлы позволяют настраивать параметры безопасности. Когда вы создаете PDF-файл, вы можете отключить способность зрителей печатать документ, оставлять комментарии к нему или копировать его текст. Таким образом, когда правительства и предприятия размещают онлайн-формы, они могут в значительной степени ограничить их для предотвращения злоупотреблений. Для большей безопасности вы также можете защитить PDF паролем.

Вы, вероятно, заметили, что PDF-файлы также работают с полями заполнения. Создатель PDF может размещать выделенные блоки в любом месте документа, чтобы показать, где они хотели бы, чтобы читатель добавлял информацию. Даже если они ограничивают редактирование, зритель все равно может набрать свое имя, адрес и другую соответствующую информацию в эти поля. Подпишитесь на RSS, подпишитесь на электронную подпитку, чтобы вы могли добавить свое согласие на документ, не распечатывая его.

Незначительные функции, такие как добавление комментариев, выделение, штампы, гиперссылки и другой контент в прямом эфире, сохранили PDF-файлы в течение текущего десятилетия. Программное обеспечение оптического распознавания может захватывать документы и легко превратить их в PDF-файлы, а некоторые независимые издатели даже выпускают книги в формате PDF. Его простота использования, надежный набор функций и вездесущность закрепили PDF в повседневной вычислительной жизни.

 

Что вы узнали о формате PDF?

Я провел краткий обзор формата PDF, чтобы Вы узнали, как это началось, как он работает и что делает его настолько важным и популярным. В мире с различными операционными системами, размерами экрана, браузерами и аппаратными компонентами, PDF остается стойким и неизменным. Зная, что созданный вами документ не пройдет каких-либо странных изменений, прежде чем ваш зритель это увидит. Это то, что предоставляет PDF, и, таким образом, он является стандартом уже более двух десятилетий.

Теперь, когда вы знаете все о PDF-файлах, ответьте на следующие вопросы:

Как часто вы используете PDF-файлы? Есть ли у вас другая причина использовать их, кроме перечисленных здесь? Дайте нам знать, что вы думаете об этом формате файла в комментариях!

Читайте также

 

 

 

 

Как подписать документ с помощью ЭЦП

В статье описывается как подписать документы (pdf, word, excel, xml, архив) с помощью ЭЦП. Рассмотрим какое программное обеспечение необходимо, чтобы подписать документы с помощью ЭЦП, их плюсы и минусы.

Как подписать файл с помощью ЭЦП

Есть две программы с помощью которых можно подписать файл с помощью ЭЦП:

  1. ViPNet CryptoFile;
  2. КриптоАРМ.

ViPNet CryptoFile

Скачать можно по этой ссылке.

С помощью этой программы можно подписать любой файл, например: doc, xls, jpg, xml, txt, подписать декларацию эцп, архив. После подписания файл будет с окончанием .sig

Плюсы: бесплатная требующая регистрации на сайте программа (ключ получите на электронную почту). Также есть возможность при подписании файла с ЭЦП использовать прикрепленную подпись к файлу, т.е. файл и ключ будет находиться в одном файле или отдельно от файла.

Минусы: при подписании можно добавить только одну электронную подпись;

Подписать документ ЭЦП можно правой кнопкой мыши на файле выбрать в меню ViPNet CryptoFile -> Подписать.

КриптоАРМ

Скачать можно по этой ссылке.

Минусы: платное программное обеспечение;

Плюсы: можно добавить множество ЭЦП подписей при подписывании файла.

Подписать документ ЭЦП можно правой кнопкой мыши на файле выбрать в меню  КриптоАРМ -> Подписать.

Как подписать pdf с помощью ЭЦП

Если Вам необходимо подписать документ например для налоговой, читайте инструкцию выше «Как подписать файл с помощью ЭЦП», если же Вам необходима подпись с видимой частью в документе, то читайте инструкцию ниже.

Для того чтобы подписать pdf документ с помощью ЭЦП необходимо ПО КриптоПро PDF.

Плюсы: Электронная подпись видна в документе.

Минусы: Стоимость программы (90 дней бесплатно.)

также, необходимо чтобы был установлен Acrobat Reader DC или Adobe Acrobat Pro.

Прежде чем вставить электронную подпись в документе pdf, необходимо настроить Acrobat Reader DC для работы с программой КриптоПро PDF,  для этого в Acrobat Reader DC нажимаем Ctrl+K или заходим в меню Редактирование -> Установки, в категориях выбираем Подписи -> где «Создание и оформление» нажимаем Подробнее см. рисунок:

В «Методе подписания по умолчанию» выбираем КриптоПро PDF как на рисунке:

Подписываем документ pdf с ЭЦП

Открываем документ pdf -> в правой панели нажимаем на заполнить и подписать

 

В верхней панели программы Acrobat Reader нажимаем на «Заполнить и подписать» -> «Дополнительные инструменты»

Необходимо выбрать инструмент Сертификаты для добавления на панель.

После нажатие на Сертификаты на панели появиться инструмент «Поставить цифровую подпись», нажимаем на нее, далее выделяем курсором участок где хотим поставить цифровую подпись, появиться окно с выбором сертификата.

Выберите сертификат -> ОК -> Подписать.

Цифровая подпись в pdf выглядет вот таким образом:

Наш документ pdf подписан, таким же способом можно поставить несколько подписей в одном файле pdf.

Как подписать документ Word с помощью ЭЦП

Если Вам необходимо подписать документ с видимой частью подписи в документе, то читайте инструкцию ниже, если же Вам необходимо подписать документ word и отправить например в налоговую, то Вам подойдет инструкция выше «Как подписать файл с помощью ЭЦП».

Для того чтобы подписать документ Word с помощью ЭЦП нам необходима программа КриптоПро Office Signature.

КриптоПро Office Signature — платное программное обеспечение, служит для подписания документов Wort, Excel.

После установки можно сразу приступить к подписанию документов Word ЭЦП, для этого открываем документ Word который необходимо подписать с ЭЦП -> меню Ставка -> в блоке Текст нажать на Строка подписи и выбрать Строка подписи (КРИПТО-ПРО).

 

Предположим, что необходимо вставить две электронные подписи в документ Word, для этого проделываем два раза операцию показанную выше, без подписания. Так как после подписания одной подписью, документ станет не редактируемым. Поэтому вставляем два поля для электронной подписи.

 

После этого можно подписывать нажав на одну подпись, выбрать ЭЦП и подписать, далее такие же действия произвести и со второй подписью.

Подписанный ЭЦП документ word выглядит вот так:

Как подписать документ Excel с помощью ЭЦП

Не буду повторяться, для того чтобы подписать документ Excel c помощью ЭЦП, необходимо проделать все тоже самое что и для Word см, чуть выше.

Внимание: Если Вам необходимо подписать документ excel с видимой частью подписи в документе, то читайте инструкцию дальше «Как подписать документ Word с помощью ЭЦП» , если же Вам необходимо подписать документ excel и отправить например в налоговую, то Вам подойдет инструкция в начале страницы «Как подписать файл с помощью ЭЦП».

Как подписать договор с помощью ЭЦП

В зависимости в каком формате создан договор, прочитайте выше статью Как подписать документ Word или PDF.

Как подписать доверенность с помощью ЭЦП

Прочитайте выше статью и выберите подходящий вариант как подписать доверенность с помощью ЭЦП.

Вопросы:

Разрешается ли редактирование файла подписанного ЭЦП

— Нет, после подписания файл отредактировать не получиться, например, если попытаться отредактировать текст подписанный в Word-е, то все подписи удаляются.

Как выглядит документ подписанный ЭЦП

—  Все зависит каким методом вы подписывали документ. Если подписывали документ как в инструкции в начале, файл будет с расширение .sig. Также файл и ЭЦП может быть отдельным файлом, это зависит от метода подписания файла.

Если же вы подписывали документ pdf, word или excel с помощью специальных программ, то отличить их не предоставляется возможным. Необходимо открыть документ и уже внутри удостовериться, есть ли подпись или нет.

Официальное опубликование правовых актов ∙ Официальный интернет-портал правовой информации


1.


Номер опубликования:
0001202108250001
Дата опубликования:
25.08.2021


2.


Номер опубликования:
0001202108250003
Дата опубликования:
25.08.2021


3.


Номер опубликования:
0001202108250002
Дата опубликования:
25.08.2021


4.


Номер опубликования:
0001202108250029
Дата опубликования:
25.08.2021


5.


Номер опубликования:
0001202108240008
Дата опубликования:
24.08.2021


6.


Номер опубликования:
0001202108240007
Дата опубликования:
24.08.2021


7.


Номер опубликования:
0001202108240004
Дата опубликования:
24.08.2021


8.


Номер опубликования:
0001202108240010
Дата опубликования:
24.08.2021


9.


Номер опубликования:
0001202108240002
Дата опубликования:
24.08.2021


10.


Номер опубликования:
0001202108240001
Дата опубликования:
24.08.2021


11.


Номер опубликования:
0001202108240003
Дата опубликования:
24.08.2021


12.


Номер опубликования:
0001202108240005
Дата опубликования:
24.08.2021


13.


Номер опубликования:
0001202108230001
Дата опубликования:
23.08.2021


14.


Номер опубликования:
0001202108200053
Дата опубликования:
20.08.2021


15.


Номер опубликования:
0001202108200052
Дата опубликования:
20.08.2021


16.


Номер опубликования:
0001202108190038
Дата опубликования:
19.08.2021


17.


Номер опубликования:
0001202108160019
Дата опубликования:
16.08.2021


18.


Номер опубликования:
0001202108160035
Дата опубликования:
16.08.2021


19.


Номер опубликования:
0001202108160029
Дата опубликования:
16.08.2021


20.


Номер опубликования:
0001202108160020
Дата опубликования:
16.08.2021


21.


Номер опубликования:
0001202108160026
Дата опубликования:
16.08.2021


22.


Номер опубликования:
0001202108160018
Дата опубликования:
16.08.2021


23.


Номер опубликования:
0001202108160015
Дата опубликования:
16.08.2021


24.


Номер опубликования:
0001202108160028
Дата опубликования:
16.08.2021


25.


Номер опубликования:
0001202108160030
Дата опубликования:
16.08.2021


26.


Номер опубликования:
0001202108160034
Дата опубликования:
16.08.2021


27.


Номер опубликования:
0001202108160017
Дата опубликования:
16.08.2021


28.


Номер опубликования:
0001202108160023
Дата опубликования:
16.08.2021


29.


Номер опубликования:
0001202108160012
Дата опубликования:
16.08.2021


30.


Номер опубликования:
0001202108160003
Дата опубликования:
16.08.2021

Как скопировать текст из файла PDF — Сеть без проблем

Если вы хотите скопировать текст из файла PDF для добавления в документ Word, вставить формулу в электронную таблицу Excel или вставить в слайды PowerPoint для презентации, это можно сделать так же просто, как с помощью функции «Копировать и вставить».

Однако это может не обязательно работать для всех файлов PDF из-за безопасности и других разрешений, но есть и другие способы выполнения той же задачи.

Как скопировать текст из PDF

Прежде чем вы сможете скопировать текст из PDF в другое приложение, вы должны подтвердить, что в нем нет настроек безопасности, которые запрещают копирование, иначе вы не сможете ничего копировать. На это может указывать функция копирования, выделенная серым цветом или затемненная в Reader.

Если полученный PDF-файл защищен паролем, откройте его с помощью указанной комбинации паролей, а затем проверьте параметры безопасности, чтобы подтвердить, что копирование содержимого разрешено.

  • Для этого щелкните документ правой кнопкой мыши и выберите « Свойства документа».
  • Перейдите на вкладку « Безопасность » и просмотрите сводку ограничений по документам, чтобы узнать, разрешено или нет копирование содержимого.
  • Откройте PDF-файл в любом приложении для чтения, а затем скопируйте нужный текст одним из следующих способов.

Существует несколько способов копирования текста из файла PDF, которые мы рассмотрим в этом руководстве.

Функция копирования и вставки

Это де-факто метод копирования текста из большинства документов или файлов, а не только из PDF-файлов. Вы можете использовать сочетание клавиш CTRL + C, чтобы скопировать нужный текст, а затем использовать CTRL + V, чтобы вставить его в другой документ.

Если вы используете Mac, нажмите Command-C, чтобы скопировать текст, и Command-V, чтобы вставить содержимое буфера обмена в текущий документ или приложение.

Кроме того, вы можете использовать правую кнопку мыши или сенсорной панели и выбрать инструмент «Выбор» .

Выделите текст, который вы хотите скопировать в документе PDF, перетащив мышью, чтобы выделить часть, которую вы хотите скопировать, щелкните правой кнопкой мыши выделенный текст и выберите « Копировать» .

Вы также можете перейти на вкладку меню и нажать « Правка»> «Копировать» . После того, как он скопирован, перейдите к документу, в который вы хотите вставить скопированный текст, щелкните правой кнопкой мыши место, в котором вы хотите разместить его, и выберите «Вставить» или нажмите « Правка»> «Вставить» .

Инструмент для создания снимков или снимков экрана

Инструмент «Снимок» в программе чтения PDF-файлов поможет вам выбрать нужный текст в виде скриншота или рисунка, а затем вставить его в другой документ, не затрагивая форматирование. Если вы выберете этот метод, вы получите именно ту часть текста, которая вам нужна, но она не будет редактируемой.

Для этого откройте документ PDF, нажмите «Правка» > «Сделать снимок».

В качестве альтернативы, выберите строку заголовка окна PDF и нажмите Alt + PrtScn на клавиатуре, чтобы сделать снимок экрана, а затем обрезать на основе нужной части.

Если вы используете Mac, нажмите Ctrl + Shift + 4 и используйте курсор на экране, чтобы перетащить и выбрать текст, который вы хотите захватить.

Интернет PDF Reader

Вы можете скопировать текст из PDF-документа в браузере или онлайн-ридере.

Для этого откройте PDF-файл в браузере, щелкнув правой кнопкой мыши файл и выбрав « Открыть с помощью»> (выберите браузер) или перетащите его в открытое окно браузера.

Выберите текст, который вы хотите. Нажмите CTRL + C, чтобы скопировать текст и вставить его в другой документ, используя CTRL + V. Вы также можете щелкнуть правой кнопкой мыши по сенсорной панели и выбрать « Копировать» , а затем снова щелкнуть правой кнопкой мыши другой документ и выбрать « Вставить» .

Программное обеспечение для извлечения PDF

Сторонний инструмент для извлечения PDF также может помочь вам извлечь текст для использования в другом приложении, таком как Word, презентация PowerPoint или программное обеспечение для настольных издательских систем.

Вы можете использовать такой инструмент, как ExtractPDF, загрузить свой PDF и нажать Пуск. Инструмент будет извлекать изображения, текст или даже шрифты, если вы хотите, после чего вы можете скопировать то, что вы хотите из извлеченного контента и вставить его в другое приложение.

Существует множество сторонних инструментов извлечения файлов PDF, которые преобразуют их в HTML, сохраняя при этом макет страницы. Они также извлекают и преобразуют содержимое документа PDF в форматы векторной графики, которые можно использовать в других приложениях.

PDF Converter

Конвертер PDF позволяет вам конвертировать документ PDF в редактируемый документ , после чего вы можете скопировать свой текст и использовать его в другом приложении.

Одним из популярных PDF-конвертеров является SmallPDF, потому что это онлайн-инструмент, поэтому он не требует установки и прост в использовании. Чтобы использовать его, откройте SmallPDF в браузере, выберите формат вывода, например, PDF в Word .

Нажмите «Выбрать файл», чтобы загрузить PDF-файл, который вы хотите преобразовать.

Нажмите Загрузить, чтобы сохранить преобразованный файл на вашем устройстве. Затем откройте преобразованный документ Word и скопируйте нужный текст.

Инструмент OCR

Инструмент оптического распознавания символов (OCR) позволяет преобразовывать файл PDF в редактируемый документ Word, копировать текст из файлов PDF и сканированные изображения в редактируемые текстовые форматы.

Это особенно полезно, если вы получили отсканированный документ в формате PDF, поскольку он мгновенно превращает такие файлы в редактируемые PDF-файлы с пользовательскими шрифтами и редактируемым текстом, которые выглядят так же, как и в исходном документе.

Adobe Acrobat работает как текстовый конвертер с OCR, так как он автоматически извлекает текст из отсканированных изображений или бумажных документов и преобразует их в PDF-файлы.

Самое приятное то, что ваш PDF будет соответствовать оригинальной распечатке благодаря автоматическому созданию пользовательских шрифтов , и вы можете использовать его с другими приложениями Office, вырезая и вставляя или экспортируя в MS-Office. Это также позволяет вам сохранить точный внешний вид документа и ограничить редактирование содержимого.

Примечание. Для выполнения этих действий необходим Adobe Acrobat, а не Adobe Reader, поскольку последний предназначен только для просмотра PDF-файлов и не имеет инструмента OCR.

Чтобы использовать собственный инструмент OCR в Adobe Acrobat, откройте PDF-файл, содержащий отсканированный текст или изображение, в Acrobat для ПК или Mac и нажмите « Редактировать PDF» .

Acrobat автоматически применяет OCR к PDF и преобразует его в полностью редактируемую копию. Выделите текст, который хотите скопировать, и нажмите « Правка»> «Копировать» , а затем вставьте его в другое приложение.

Вы можете нажать Файл> Сохранить как, чтобы сохранить редактируемый документ для последующего использования.

Либо откройте отсканированный документ или изображение, с которым вы хотите использовать устройство чтения OCR, нажмите « Инструменты» в верхней правой части панели инструментов и выберите « Распознать текст»> «В этом файле» .

Вы увидите всплывающее окно с текущими общими настройками, такими как язык распознавания текста, стиль вывода PDF и разрешение. Нажмите OK, чтобы текст был распознан.

Если вы хотите изменить настройки, нажмите кнопку « Изменить» , а затем нажмите кнопку «ОК» после завершения.

Как только текст распознан на отсканированной странице, вы можете выбрать и скопировать нужный текст с обнаруженным форматированием, хотя это не так точно, как распознавание текста.

Если у вас есть только Adobe Reader и вы не хотите получать копию Acrobat, есть бесплатные инструменты OCR, такие как OCR OneNote для ПК, который можно использовать бесплатно, или библиотека Tesseract OCR для Mac.

Примечание. Если у вас есть Adobe Acrobat, вы можете распознать несколько документов одновременно. Просто откройте любой документ в Acrobat, нажмите « Распознать текст» на боковой панели « Инструменты» и выберите «В нескольких файлах». Перетащите PDF-файлы, которые вы хотите, в OCR, и Acrobat распознает текст для вас.

Есть ли у вас какие-либо другие приемы, которые вы используете для копирования текста из файла PDF? Расскажите нам об этом в комментарии ниже.

Как правильно подготовить файлы к печати в типографию?

Как правильно подготовить файлы к печати в типографию?


Если Вы это читаете, то скорее всего предоставленные Вами файлы в печать не подходят по техтребованиям. В данной статье мы не будем разбирать такие сложные для неопытного пользователя термины как цветовые профиля, оверпринт, трепинг и прочие сложно произносимые слова. И Вам не придется читать скучные техтребования типографий с непонятными словами, мы разберем все простым языком с картинками!

Мы просто научим Вас как правильно сделать эскиз в печать для любой типографии!


Обсудим только основные ошибки свойственные простым эскизам (например, для цифровой печати). Мы поможем избежать Вам лишних нервов, траты времени и денег на допечатную подготовку технически неправильно сделанных эскизов! Мы разложим основные ошибки при верстке макетов по пунктам, так Вам будет легче найти нужную информацию.


Часто к нам обращаются рестораны с уже готовыми эскизами меню (которые им сделал несомненно творчески одаренный, но технически не совсем подкованный человек), и часто бывает так что эти эскизы жизненно несовместимы с их реализацией на практике. Начнем по порядку с самых популярных:


 

#1 Вылеты под обрез


Что же такое вылеты и как их правильно сделать? Разберем на примере листовки формата А4. Размер листа А4 210х297мм, прибавим вылеты с каждой стороны по +3мм и получим 216х303мм — это ДОобрезной размер. За пределы формата А4 210х297мм (ПОСЛЕобрезной размер) должны выходить фоновые объекты, не текст и не белая рамочка. А важные элементы эскиза (такие как текст, изображения, логотип) которые не должны быть зарезаны, располагаются в пределах размера 200х287мм. В современной полиграфии под вылеты достаточно прибавить +3мм к ПОСЛЕобрезному формату с каждой стороны.




Зачем это нужно? Дело в том, что при печати на бумаге изображение может слегка сместиться или повернутся (на 1-2мм). Это нормальная погрешность, например, для цифровых печатных машин, особенно на плотной бумаге и особенно при двусторонней печати. После того как тираж отпечатан его не режут супер лазером каждый листик отдельно, а стопкой отдают на механический резак, где прямо так пачкой и режут в нужный размер, вот Вам еще 1-2мм погрешность. Плюс-минус 1-2мм туда, сюда и у постпечатников появляется поле для маневра. Получается, чтобы в итоге получить необходимый размер без части соседнего изображения или белой полосы с одной стороны (или нескольких сторон) необходимо сначала сделать +3мм лишнего эскиза, а потом его срезать до ПОСЛЕобрезного формата, а лишнее выбросить. Это касается всего что печатается и режется в нужный размер (буклеты, каталоги, листовки, визитки и т.п.). Если вылеты под обрез не добавить, то и качественный продукт без дефектов тоже сделать не получится.


 

#2 Крепления в папку или сшивка


При верстке эскиза обязательно нужно учитывать крепления если меню собирается на пружину, скрепку или в папку. Мы рекомендуем производить верстку эскиза сразу с уже отмеченными зонами крепления или сшивки. Причем необходимо учесть, что на первой странице крепление будет слева, а на второй справа, на третьей опять слева и т.д. Главное, чтобы под крепления не попадали важные элементы эскиза, такие как текст.



Сшивка в папку на болты



Сшивка на скрепку, пружину или КБС



Сшивка на разжимные кольца или кольцевой механизм в папку


 

#3 CMYK и RGB



RGB — цветовая модель для отображения на мониторе. Состоит из Red — Красный, Green — Зеленый и Blue — Синий. Изображения, созданные в модели RGB при переводе в CMYK, потеряет часть цвета и станет более тусклой.


CMYK — это цветовая модель для печатных машин (в особенности типографских), состоит из Cyan — Голубой, Magenta — Малиновый, Yellow — Желтый + отдельной краской идет К — черный. Смешиваясь между собой эти цвета дают картинку на бумаге.


Почему так получается? Если совсем уж просто объяснять — то дело в том, что монитор является источником света, а изображение на бумаге нет. Человек видит от листа бумаги отраженный свет. Можно сымитировать на бумаге яркое изображение если подсветить лист сзади яркими лампами равномерно (вроде как лайт-боксы). Но на практике это не применимо. Поэтому на бумаге НИКОГДА не будет изображение таким же ярким и с таким же большим цветовым охватом как на мониторе.


 


Чем грозит не соблюдение правил? Печать файла в режиме RGB в типографии приведет к тому что при конвертации, например, черный напечатается не чистым черным как 0-0-0-100, а составным. Получится цвет как 91-82-79-88 и выглядеть будет не черным, а сильно темно коричневым или очень темно синим и т.д. Цвет зависит от многих вещей (цветовых профилей, например). Кроме того, на лист ляжет избыток тонера что скажется на приклеивании ламината (в этом случае мы точно гарантию не даем на отклеивание). Цифровые машины (и офсетные) все равно печатают в CMYK и ваш файл как ни крути будет переведен в режим CMYK перед печатью самой печатной машиной (или при допечатной подготовке) с неизвестным результатом на выходе. Изменения по цвету неизбежны, например, красный уже не будет чистым красным, а станет бордовым или желтоватым и так далее — белый станет серым, синий станет фиолетовым.


 


#4 Растровые изображения


Все растровые изображения в эскизе должны иметь разрешение 300dpi (точек на дюйм) при масштабе 1:1 для достижения максимального качества печати. Часто в эскизах используются изображения из интернета низкого разрешения, а еще хуже — имеющие артефакты от компрессии. Это чревато низким качеством печати.


 


#5 Метки реза, кресты и цветовые шкалы



Никогда и нигде нельзя ставить кропы, метки, шкалы, для чего угодно (резки, биговки) и вообще все что не относится к эскизу! Делать это можно только в одном случае — если Вы самостоятельно будете печатать, ламинировать, резать и собирать этот тираж ;)


Во всех остальных случаях это задача и привилегия препресса! Подобная информация излагается в техническом задании отдельно от файлов в печать.


 

#6 Как правильно сохранить для печати в типографии готовый эскиз?


Есть два самых простых варианта, которые обязательно у Вас примут в печать при условии выполнения всех выше перечисленных рекомендаций. Это формат PDF/X-1a и растровый файл TIFF. Каждый из них именно для Вас будет удобен в конкретной ситуации, рассмотрим подробнее:


PDF/X-1a

Этот формат самый удобный, идеально подходит для многостраничных изделий. Когда сохраняете Ваш эскиз для отправки в полиграфию на печать делайте это с заготовкой (preset) PDF/X-1a, в каждой графической программе есть такая, со следующими параметрами:

1. Размер страницы равен ДОобрезному размеру эскиза

2. На каждой странице документа одна полоса

3. Все цвета при экспорте автоматически конвертируются в CMYK

4. Отключите любую компрессию в документе (LZW, JPG, ZIP и т.п.)

5. Не используйте метки, шкалы и т.п. (это не Вам решать на каком формате листа будет отпечатан эскиз)

6. При экспорте не забудьте выставить в настройках 300dpi для растровых объектов и желательно отключить компрессию.


Почему именно PDF/X-1a? Именно этот формат любим всеми типографиями. Его применение устраняет наиболее распространенные ошибки при подготовке файлов к печати. И даже если Вы чтото сделали не так, после экспорта результат будет явно виден в готовом файле PDF.


TIFF

Если Вы делаете эскиз в Photoshop то это формат Вам подходит идеально. Или, например, для наружной широкоформатной печати — баннеры, плакаты и т.п. Также можно экспортировать эскиз из любой попуряной программы для векторной графики в растровый TIFF, тоже подойдет. Вот некоторые рекомендации для Photoshop:

1. Создавая новый документ сразу выберите цветовую модель CMYK

2. Сразу задайте размеры листа в ДОобрезном формате

3. И обязательно установите разрешение документа как 300dpi


Почему именно TIFF? Это самый популярный растровый формат для передачи файла в печать без искажений и артефактов (как например JPG), а также в правильном размере и масштабе. Подобный формат (при соблюдении условий) у Вас примет в печать любая типография.


 

Глоссарий:


ДОобрезной формат — размер эскиза с вылетами под обрез, например, для А4 это 216х303мм (с вылетами по 3мм с каждой стороны).


ПОСЛЕобрезной формат — размер готового изделия которое Вы получаете на руки.


Допечатная подготовка — подготовка файлов к печати на необходимом оборудовании и формате носителя, установка меток реза и т.п. Также называется PrePress, подробнее можно ознакомиться здесь…>


 

Рекомендации:

  •          Прежде чем начать верстку эскиза создайте документ сразу с вылетами в ДОобрезном формате и убедитесь, что в документе выставлено цветовое пространство CMYK;
  •          Разметьте область (направляющими или просто прямоугольниками) ДОобрезного, ПОСЛЕобрезного формата и верстайте эскиз в размер на -5мм меньше чем ПОСЛЕобрезной размер;
  •          Сразу отметьте (например, направляющими) где на листе попадают элементы сшивки, такие как пружина, болты, кольцевой механизм или разжимные кольца. Это позволит избежать попадания отверстий для крепления на важные элементы дизайна (текст, фотографии).
  •          При должных знаниях уточните у Вашей типографии какие цветовые профиля используют они, и установите себе такие же для максимального попадания в цвет.


Важно сделать не только красивый, но и технически правильный макет, иначе всю красоту можно запороть, когда пружина или кольцевой механизм в эскизе попадает на текст в уже отпечатанном варианте, а Вы этого не предусмотрели.


Тем, кто готовит более сложные эскизы с пантонными цветами, выборочным лаком, оверпринтом и т.п., необходимы более широкие и профессиональные знания, не описанные в данной статье.


Сохраните себе в закладки эту страницу как шпаргалку, и Вы всегда сможете освежить себе память, если потребуется.

Что такое файл PDF?

Урок 8: Что такое файл PDF?

/ ru / базовые-компьютерные-навыки / ПО с открытым исходным кодом и с закрытым исходным кодом / контент /

Что такое PDF-файл?

Adobe PDF файлов — сокращенно для формата переносимых документов . файлов — сегодня являются одним из наиболее часто используемых типов файлов. Если вы когда-либо загружали форму или документ для печати из Интернета, например налоговую форму IRS, велика вероятность, что это был файл PDF. Каждый раз, когда вы видите файл, заканчивающийся на .pdf , это означает, что это файл PDF.

Зачем нужны файлы PDF?

Допустим, вы создаете информационный бюллетень в Microsoft Word и публикуете его в виде файла .docx , который является форматом файлов по умолчанию для документов Word. Если на компьютерах всех не установлено приложение Microsoft Word, нет гарантии, что они смогут открывать и просматривать информационный бюллетень. А поскольку документы Word предназначены для редактирования, есть вероятность, что некоторые форматирование и текст в вашем документе могут быть смещены.

Напротив, файлы PDF в первую очередь предназначены для просмотра , а не для редактирования . Одна из причин их популярности заключается в том, что PDF-файлы могут сохранять форматирование документа , что делает их более доступными для совместного использования и помогает им выглядеть одинаково на любом устройстве. Распространение информационного бюллетеня в виде файла PDF поможет гарантировать, что каждый сможет просматривать его так, как вы хотели.

Открытие файлов PDF

Открыть и просмотреть файл PDF довольно просто. Большинство современных веб-браузеров открывают файлы PDF прямо в окне вашего браузера , а не загружают их на ваш компьютер.Если ваш браузер не может этого сделать, он должен предложить вам загрузить файл. Попробуйте щелкнуть эту ссылку, чтобы увидеть, как она работает на вашем компьютере.

Если вам нужно просмотреть файл PDF только один раз, обычно проще всего открыть его в веб-браузере. Если вам понадобится доступ к PDF-файлу позже, вы захотите сохранить копию на свой компьютер. Этот процесс будет зависеть от вашего веб-браузера, но в приведенном ниже примере кнопка Сохранить PDF находится в правом верхнем углу.

Если файл PDF уже находится на вашем компьютере, вы можете просто дважды щелкнуть , чтобы открыть его. с помощью приложения PDF по умолчанию.

Если на вашем компьютере используется Windows 7 или более ранняя версия, вам может потребоваться загрузить бесплатную программу просмотра PDF (например, Adobe Reader), прежде чем вы сможете просматривать файлы PDF.

Редактирование файлов PDF

Как мы упоминали ранее, PDF-файлы в первую очередь предназначены для просмотра, а не редактирования. Однако могут быть случаи, когда вы сталкиваетесь с PDF-файлом, который позволяет вам ввести определенную информацию, например имя и адрес. В этих PDF-файлах используется специальная функция, называемая полей формы , которая позволяет вам вводить новую информацию в документ и сохранять изменения.Например, этот PDF-файл содержит несколько полей формы для ввода вашего имени, адреса и другой информации.

Эта функция поддерживается не всеми веб-браузерами, поэтому вам может потребоваться загрузить PDF-файл, прежде чем вы сможете использовать поля формы для добавления информации.

Также могут быть случаи, когда вы хотите сделать маленьких правок в файлы PDF, например, добавление комментария или выделение текста. Чтобы узнать больше о редактировании PDF-файлов, ознакомьтесь с нашим уроком о том, как редактировать и объединять PDF-файлы.

Создание файлов PDF

Существует несколько способов создания файлов PDF, но метод во многом зависит от используемого вами устройства. Например, если вы используете Windows 10, вы можете перейти в диалоговое окно «Печать» , затем выбрать PDF из списка принтеров наверху . Это позволяет вам создавать PDF-файлы из всего, что вы обычно можете распечатать, включая документы, электронные письма и веб-страницы.

Если вы работаете на Mac, в диалоговом окне «Печать» есть меню PDF, которое позволяет сохранить файл в формате PDF.

Если на вашем компьютере установлена ​​Windows 8 или более ранняя версия, у вас есть несколько вариантов. Самый простой способ — использовать программное обеспечение, которое поддерживает экспорт PDF , например Microsoft Office или Google Chrome.

Другой вариант — использовать конвертер PDF , например Smallpdf, бесплатное приложение, которое запускается в вашем веб-браузере. Smallpdf может конвертировать различные типы файлов , например документы Microsoft Office , в формат PDF.

Хорошо, это основы файлов PDF!

/ ru / basic-computer-skills / how-to-set-up-a-wifi-network / content /

Что такое файл PDF (и как его открыть)

В этой статье объясняется, что такое PDF-файлы, как их открывать, а также о различных способах их преобразования в другой формат, например в изображение или редактируемый файл, который можно использовать в Word или Excel, а также о том, как защитить их паролем или удалить пароль.

Что такое файл PDF?

Файл с расширением .PDF, разработанный Adobe, является файлом Portable Document Format.

Файлы PDF могут содержать не только изображения и текст, но также интерактивные кнопки, гиперссылки, встроенные шрифты, видео и многое другое.

Вы часто увидите руководства по продуктам, электронные книги, листовки, заявления о приеме на работу, отсканированные документы, брошюры и всевозможные другие документы, доступные в формате PDF. Веб-страницы могут быть даже сохранены в PDF-файлах в их полном форматировании для дальнейшего использования.

Поскольку PDF-файлы не зависят от программного обеспечения, которое их создало, ни от какой-либо конкретной операционной системы или оборудования, они выглядят одинаково независимо от того, на каком устройстве они открыты.

Как открыть файл PDF

Большинство людей сразу обращаются к Adobe Acrobat Reader, когда им нужно открыть PDF-файл. Adobe создала стандарт PDF, и его программа, безусловно, является самой популярной бесплатной программой для чтения PDF-файлов. Это совершенно нормально для использования, но мы считаем, что это несколько раздутая программа с множеством функций, которые вам, возможно, никогда не понадобятся или которые вы не захотите использовать.

Большинство веб-браузеров, например Chrome и Firefox, могут сами открывать PDF-файлы. Для этого вам может потребоваться надстройка или расширение, а может и не потребоваться, но очень удобно, чтобы они открывались автоматически, когда вы щелкаете ссылку PDF в Интернете.

Мы настоятельно рекомендуем SumatraPDF, Slim PDF Reader или MuPDF, если вам нужно что-то с немного большим количеством функций; все трое бесплатны. Смотрите наш список лучших бесплатных программ для чтения PDF, чтобы узнать о дополнительных возможностях.

Как редактировать файл PDF

Adobe Acrobat — самый популярный редактор PDF, но Microsoft Word тоже сделает это.Существуют и другие редакторы PDF, например PhantomPDF и Nitro Pro.

PDFescape, DocHub и PDF Buddy — это несколько бесплатных онлайн-редакторов PDF, которые позволяют очень легко заполнять формы, подобные тем, которые вы иногда видите в заявлении о приеме на работу или в налоговой форме. Просто загрузите свой PDF-файл на веб-сайт, чтобы делать такие вещи, как вставка изображений, текста, подписей, ссылок и т. Д., А затем загрузите его обратно на свой компьютер в виде PDF-файла.

Аналогичный онлайн-редактор PDF под названием Fill отлично подходит, если вам просто нужно добавить подпись к PDF.Он также поддерживает флажки, даты и обычный текст, но вы не можете редактировать существующий текст с его помощью или легко заполнять формы.

См. Наш список лучших бесплатных редакторов PDF, где вы найдете регулярно обновляемую коллекцию редакторов PDF, если вам нужно нечто большее, чем просто заполнение форм, например добавление или удаление текста или изображений из PDF-файла.

Сейда PDF редактор.

Если вы хотите извлечь часть файла PDF как собственный или разделить PDF-файл на несколько отдельных документов, есть несколько способов сделать это.Ознакомьтесь с нашими лучшими инструментами и методами для разделения PDF-файлов, чтобы получить всю необходимую помощь.

Как преобразовать файл PDF

Большинство людей, желающих преобразовать PDF-файл в какой-либо другой формат, заинтересованы в этом, чтобы они могли редактировать содержимое PDF-файла. Преобразование PDF означает, что он больше не будет .PDF и вместо этого будет открыт в программе, отличной от PDF-ридера.

Например, преобразование PDF-файла в файл Microsoft Word (DOC и DOCX) позволяет открывать файл не только в Word, но и в других программах для редактирования документов, таких как OpenOffice и LibreOffice.Использование этих типов программ для редактирования преобразованного PDF-файла, вероятно, является гораздо более удобным занятием по сравнению с незнакомым редактором PDF.

Если вместо этого вы хотите, чтобы файл, отличный от PDF, был файлом .PDF, вы можете использовать средство создания PDF . Эти типы инструментов могут принимать такие вещи, как изображения, электронные книги и документы Microsoft Word, и экспортировать их в формате PDF, что позволяет открывать их в PDF-формате или в программе для чтения электронных книг.

Сохранение или экспорт из какого-либо формата в PDF можно выполнить с помощью бесплатного средства создания PDF.Некоторые даже служат в качестве PDF-принтера, что позволяет практически «распечатать» практически любой файл в формате .PDF. На самом деле, это простой способ конвертировать в PDF что угодно. См. Раздел «Как печатать в PDF», чтобы полностью изучить эти параметры.

Печать веб-страницы в PDF в Chrome.

Некоторые программы по ссылкам выше можно использовать обоими способами, то есть вы можете использовать их для преобразования PDF-файлов в различные форматы и для создания PDF-файлов. Caliber — еще один пример бесплатной программы, которая поддерживает преобразование в формат электронных книг и обратно.

Кроме того, многие из упомянутых программ также могут объединять несколько PDF-файлов в один, извлекать определенные PDF-страницы и сохранять только изображения из PDF-файла. PDF Merge Free — это онлайн-метод для быстрого объединения нескольких PDF-файлов в один.

EasePDF — это один из примеров онлайн-конвертера PDF в Word, который может сохранять файл в DOCX.

См. Как конвертировать файлы PDF в JPG, если вы хотите, чтобы ваш PDF-файл был просто изображением, что может быть удобно, если вы не уверены, есть ли у человека, которому вы отправляете PDF-файл, или он хочет его установить. читатель.

EasyPDF.com — это еще один онлайн-конвертер PDF, который поддерживает сохранение PDF в различных форматах, чтобы он был совместим с Word, PowerPoint, Excel или AutoCAD. Вы также можете преобразовать страницы PDF в файлы GIF или в отдельный текстовый файл. PDF-файлы можно загружать из Dropbox, Google Диска или с вашего компьютера. CleverPDF — аналогичная альтернатива.

Еще одно преобразование, которое вы можете сделать, — это PDF в PPTX. Если вы используете PDFConverter.com для преобразования документа, каждая страница PDF-файла будет разделена на отдельные слайды, которые вы можете использовать в PowerPoint или любом другом программном обеспечении для презентаций, которое поддерживает файлы PPTX.

См. Эти бесплатные программы преобразования файлов и онлайн-службы, чтобы узнать о других способах преобразования файла PDF в другие форматы файлов, включая форматы изображений, HTML, SWF, MOBI, PDB, EPUB, TXT и другие.

Как защитить PDF-файл

Защита PDF-файла может включать запрос пароля для его открытия, а также запрет на печать PDF-файла, копирование его текста, добавление комментариев, вставку страниц и другие действия.

Некоторые из создателей и конвертеров PDF, на которые есть ссылки сверху, а также другие, такие как PDFMate PDF Converter Free, PrimoPDF, FreePDF Creator, Soda PDF и FoxyUtils, являются одними из многих бесплатных приложений, которые могут изменять эти типы параметров безопасности.

FAQ

  • Как уменьшить размер файла PDF?

    Adobe Acrobat предлагает онлайн-компрессор PDF, который автоматически уменьшает размер файла после его загрузки. Если вы являетесь пользователем Microsoft Word, конвертирующим файл Word в PDF, выберите Сохранить как > PDF > Минимизировать размер (публикация в Интернете) . В macOS используйте приложение Preview, чтобы уменьшить PDF-файл; откройте PDF-файл> выберите File > Export > Уменьшите размер файла в раскрывающемся меню Quartz Filter.

  • Как мне сделать PDF-файл из картинок?

    Вы можете конвертировать изображения в файлы PDF в большинстве программ и операционных систем, экспортируя или распечатывая файлы в формате PDF. В Windows откройте изображение> нажмите Ctrl + P > и выберите Microsoft Print to PDF . Используйте опцию Печать > Сохранить как PDF на смартфонах Android, а на macOS и iOS выберите Файл > Печать > Сохранить как PDF .

Спасибо, что сообщили нам об этом!

Расскажите, почему!

Другой

Недостаточно подробностей

Трудно понять

Какая польза от PDF? Почему люди используют файлы PDF?

Как часто вы работаете с PDF-документами? Вы их просто читаете или вам нужно копировать фрагменты текста и время от времени вносить поправки в содержащиеся в них данные? Вот некоторые из вопросов, которые мы задали этим летом более чем 500 сотрудникам средних и крупных компаний.Опрос выявил много интересных фактов о формате PDF и его использовании в современном офисе.

О PDF

PDF или Portable Document Format — это открытый формат файлов, используемый для обмена электронными документами. Документы, формы, изображения и веб-страницы, закодированные в формате PDF, могут корректно отображаться на любом устройстве, включая смартфоны и планшеты. Если вы распространяете свои отчеты в формате PDF, вы можете быть уверены, что все ваши коллеги смогут открывать и читать их на своих ПК, Mac или смартфонах Android.

PDF / A — это версия PDF, предназначенная для длительного архивирования цифровых документов. Он исключает некоторые функции PDF, которые несовместимы с долгосрочным архивированием, чтобы гарантировать, что когда пользователь откроет документ через несколько лет, он будет выглядеть точно так же, как когда он был заархивирован.

Вышеуказанные характеристики делают PDF одним из самых удобных форматов документов для работы.

PDF переоценен — ​​или нет?

PDF оказался даже более популярным, чем мы ожидали: каждый второй респондент заявил, что им регулярно необходимо манипулировать файлами PDF.Часто простого просмотра PDF-файлов было недостаточно. Вот пять наиболее распространенных сценариев, выявленных в ходе опроса:

  1. Поиск информации в документе PDF
  2. Копирование данных из документа PDF
  3. Управлять страницами в документе PDF, например добавить, удалить или изменить порядок страниц
  4. Внесите незначительные изменения в текст документа PDF, например исправить опечатки или ошибки
  5. Объедините несколько файлов в различных форматах в один документ PDF

Более 50% опрошенных заявили, что им регулярно приходилось выполнять хотя бы одну из пяти операций, указанных выше.Некоторые из них можно успешно решить с помощью простых приложений для просмотра PDF-файлов, которые можно легко загрузить бесплатно. С помощью бесплатного средства просмотра PDF пользователи могут открыть документ, найти определенную текстовую строку и, иногда, скопировать содержимое в буфер обмена. Однако для остальных трех требуется более мощное программное обеспечение.

Когда бесплатное программное обеспечение не справляется

Предположим, вы заметили опечатку в важном отчете. Как поправить в PDF? Не волнуйтесь, многие современные инструменты PDF позволяют вносить незначительные исправления в текст.Некоторые инструменты также позволяют объединить несколько документов (например, два документа Word и таблицу Excel) в один PDF-файл или изменить порядок страниц. Чем мощнее инструмент, тем меньше вероятность, что он будет бесплатным.

Однако простые приложения для просмотра PDF не могут успешно обрабатывать файлы PDF, созданные с помощью сканера. Предположим, вы просите коллегу прислать вам отчет в формате PDF, но у нее под рукой есть только бумажный оригинал. Поэтому она сканирует бумажные страницы в PDF и пересылает их вам. Теперь с помощью обычного средства просмотра PDF вы можете открыть и прочитать отчет, но вы не сможете скопировать какой-либо текст.Вы не одиноки в этом затруднительном положении: 81% офисных служащих жалуются на аналогичную проблему.

Загвоздка с такими отсканированными PDF-документами заключается в том, что они не содержат текстового слоя. Это просто фотографии бумажных страниц, как если бы они были сняты цифровым фотоаппаратом. Можно ли решить проблему? Да точно. Все, что вам нужно, — это более сложный программный продукт, который может «читать» текст на картинке и переводить его в редактируемые буквенно-цифровые символы. Бесплатные приложения для просмотра PDF-файлов не могут этого сделать.

А как насчет бумаги?

Это важный вопрос и для нас. Как люди, мы хотим сохранить леса Земли и, как компания, помогаем предприятиям перейти на цифровые документы. Мы попросили наших респондентов сообщить нам, заметили ли они какие-либо изменения в количестве бумажных документов, с которыми им приходилось иметь дело за последние два года.

Выяснилось, что, несмотря на рост использования цифровых документов, количество бумажных документов также увеличилось. Это засвидетельствовали 68% опрошенных , что однозначно свидетельствует о том, что наша работа еще не сделана.

Заключение

Очевидно одно. PDF становится важным форматом документов в офисе и требует программного обеспечения, которое было бы простым в использовании и достаточно сложным, чтобы обрабатывать все типы файлов, включая сканированные (помните, как растет количество бумажных документов?).

Формат файла PDF: базовая структура [обновлено в 2020 г.]

Все мы знаем, что существует ряд атак, при которых злоумышленник включает некоторый шелл-код в документ PDF. Этот шелл-код использует некоторую уязвимость в том, как документ PDF анализируется и представляется пользователю для выполнения вредоносного кода в целевой системе.

На следующем изображении показано количество уязвимостей, обнаруженных в популярной программе чтения PDF-файлов Adobe Acrobat Reader DC, выпущенной в 2015 году и ставшей единственной поддерживаемой версией Acrobat Reader после прекращения поддержки Acrobat XI в октябре 2017 года. Количество уязвимостей растет. с годами. Наиболее важные уязвимости — это уязвимости выполнения кода, которые злоумышленник может использовать для выполнения произвольного кода в целевой системе (если Acrobat Reader еще не исправлен).

Рисунок 1: Уязвимости Adobe Acrobat Reader DC

Это важный показатель, что мы должны регулярно обновлять нашу программу чтения PDF-файлов, потому что количество обнаруженных в последнее время уязвимостей весьма устрашающе.

Структура файла PDF

Каждый раз, когда мы хотим обнаружить новые уязвимости в программном обеспечении, мы должны сначала понять протокол или формат файла, в котором мы пытаемся обнаружить новые уязвимости. В нашем случае мы должны сначала подробно разобраться в формате файла PDF.В этой статье мы рассмотрим формат файла PDF и его внутреннее устройство.

PDF — это переносимый формат документов, который можно использовать для представления документов, содержащих текст, изображения, мультимедийные элементы, ссылки на веб-страницы и многое другое. Он имеет широкий спектр функций. Спецификация формата файла PDF общедоступна здесь и может использоваться всеми, кто интересуется форматом файла PDF. Документация только по формату PDF составляет почти 800 страниц, так что читать ее — это не то, что нужно делать по прихоти.

PDF имеет больше функций, чем просто текст: он может включать изображения и другие мультимедийные элементы, быть защищенным паролем, выполнять JavaScript и так далее. Базовая структура файла PDF представлена ​​на рисунке ниже:

Рисунок 2: Структура PDF

Каждый PDF-документ содержит следующие элементы:

Заголовок

Это первая строка файла PDF, в которой указывается номер версии используемой спецификации PDF, которая используется в документе.Если мы хотим это выяснить, мы можем использовать шестнадцатеричный редактор или просто использовать команду xxd , как показано ниже:

[простой]
# xxd temp.pdf | head -n 1
0000000: 2550 4446 2d31 2e33 0a25 c4e5 f2e5 eba7% PDF-1.3.% ……
[/ plain]

В PDF-документе temp.pdf используется спецификация PDF 1.3. Символ «%» является комментарием в PDF, поэтому в приведенном выше примере первая и вторая строки фактически представляют собой комментарии, что верно для всех документов PDF. Следующие байты взяты из вывода ниже: 2550 4446 2d31 2e33 0a25 c4e5 и соответствуют тексту ASCII «% PDF-1.3.% ». Ниже приведены некоторые символы ASCII, в которых используются непечатаемые символы (обратите внимание на точки ‘.’), Которые обычно используются, чтобы сообщить некоторым программным продуктам, что файл содержит двоичные данные и не должен рассматриваться как 7-битный ASCII. текст. В настоящее время номера версий имеют вид 1.N, где N находится в диапазоне 0-7.

Кузов

В теле документа PDF есть объекты, которые обычно включают в себя текстовые потоки, изображения, другие мультимедийные элементы и т. Д. Раздел «Тело» используется для хранения всех данных документа, показываемых пользователю.

таблица внешних ссылок

Это таблица перекрестных ссылок, которая содержит ссылки на все объекты в документе. Назначение таблицы перекрестных ссылок состоит в том, что она обеспечивает произвольный доступ к объектам в файле, поэтому нам не нужно читать весь документ PDF, чтобы найти конкретный объект. Каждый объект представлен одной записью в таблице перекрестных ссылок, которая всегда имеет длину 20 байт. Покажем пример:

[простой]
xref
0 1
0000000023 65535 f
3 1
0000025324 00000 n
21 4
0000025518 00002 n
0000025632 00000 n
0000000024 00001 f
0000000000 00001 f
36 1
0000026900 00000 n
[/ простой ]

Мы можем отобразить таблицу перекрестных ссылок документа PDF, просто открыв PDF-файл в текстовом редакторе и прокрутив его до конца документа.В приведенном выше примере мы видим, что у нас есть четыре подраздела (обратите внимание на четыре строки, содержащие только два числа). Первое число в этих строках соответствует номеру объекта, а вторая строка указывает количество объектов в текущем подразделе. Каждый объект представлен одной записью длиной 20 байт (включая CRLF).

Первые 10 байтов — это смещение объекта от начала документа PDF до начала этого объекта. Далее следует разделитель пробелом с другим числом, указывающим номер поколения объекта.После этого идет еще один разделитель пробела, за которым следует буква «f» или «n», чтобы указать, свободен ли объект или используется.

Первый объект имеет идентификатор 0 и всегда содержит одну запись с номером поколения 65535, которая находится в начале списка свободных объектов (обратите внимание на букву «f», что означает «свободный»). Последний объект в таблице перекрестных ссылок использует номер поколения 0.

Второй подраздел имеет идентификатор объекта 3 и содержит один элемент, объект 3, который начинается со смещения 25324 байта от начала документа.Третий подраздел состоит из четырех объектов, первый из которых имеет идентификатор 21 и начинается со смещения 25518 от начала файла. Остальные объекты имеют следующие номера 22, 23 и 24.

Все объекты отмечены флажком «f» или «n». Флаг «f» означает, что объект все еще может присутствовать в файле, но помечен как свободный, поэтому его не следует использовать. Эти объекты содержат ссылку на следующий свободный объект и номер поколения, который будет использоваться, если объект снова станет действительным. Флаг «n» используется для представления действительных и используемых объектов, которые содержат смещение от начала файла и номер поколения объекта.

Обратите внимание, что нулевой объект указывает на следующий свободный объект в таблице, объект 23. Поскольку объект 23 также свободен, он сам указывает на следующий свободный объект в таблице, объект 24. Но объект 24 является последним свободным объектом в таблице. файл, так что он указывает обратно на нулевой объект. Если представить приведенную выше таблицу перекрестных ссылок с каждым номером объекта, она будет выглядеть следующим образом:

[простой]
xref
0 1
0000000023 65535 f
3 1
0000025324 00000 n
21 1
0000025518 00002 n
22 1
0000025632 00000 n
23 1
0000000024 00001 f
24 1
0000000000 00001 f
36 1
0000026900 00000 n
[/ простой]

Номер поколения объекта увеличивается, когда объект освобождается, поэтому, если объект снова становится действительным (изменяет флаг с «f» на «n»), номер поколения все еще действителен без необходимости его увеличения.Номер поколения объекта 23 равен 1, поэтому, если он снова станет действительным, номер поколения по-прежнему будет 1, но если он снова будет удален, номер поколения увеличится до 2.

В документах PDF, которые постепенно обновляются, обычно присутствует несколько подразделов, в противном случае должен присутствовать только один подраздел, начинающийся с нуля.

Прицеп

Трейлер PDF указывает, как приложение, читающее документ PDF, должно найти таблицу перекрестных ссылок и другие специальные объекты.Все программы чтения PDF-файлов должны начинать чтение PDF-файла с конца файла. Пример трейлера представлен ниже:
трейлер
& amp; lt; & amp; lt;
/ Размер 22
/ Корень 2 0 R
/ Информация 1 0 R
& amp; gt; & amp; gt;
startxref
24212
%% EOF
Последняя строка документа PDF содержит конец строки файла «%% EOF». Перед концом тега файла находится строка со строкой startxref , которая указывает смещение от начала файла до таблицы перекрестных ссылок.В нашем случае таблица перекрестных ссылок начинается со смещения 24212 байт. Перед этим находится строка трейлер , которая определяет начало раздела трейлера. Содержимое разделов трейлера заключено в символы << и >> (это словарь, который принимает пары ключ-значение).

Мы видим, что раздел трейлера определяет несколько клавиш, каждая из которых предназначена для определенного действия. В разделе трейлера можно указать следующие ключи:

  • / Размер [целое число]: указывает количество записей в таблице перекрестных ссылок (включая также количество объектов в обновленных разделах).Используемый номер не должен быть косвенной ссылкой.
  • / Prev [целое число]: указывает смещение от начала файла до предыдущего раздела перекрестной ссылки, которое используется, если имеется несколько разделов перекрестных ссылок. Номер должен быть перекрестной ссылкой.
  • / Root [словарь]: указывает объект ссылки для объекта каталога документов, который представляет собой специальный объект, содержащий различные указатели на различные типы других специальных объектов (подробнее об этом позже).
  • / Encrypt [dictionary]: Задает словарь шифрования документа.
  • / Info [словарь]: указывает объект ссылки для информационного словаря документа.
  • / ID [массив]: Задает массив двухбайтовых незашифрованных строк, образующих идентификатор файла.
  • / XrefStm [integer]: указывает смещение от начала файла до потока перекрестных ссылок в декодированном потоке. Это присутствует только в файлах гибридных ссылок, которые указываются, если мы также хотим открывать документы, даже если приложения не поддерживают сжатые потоки ссылок.

Мы должны помнить, что первоначальная структура может быть изменена, если мы обновим документ PDF позже. Обновление обычно добавляет дополнительные элементы в конец файла.

Дополнительные обновления

PDF-файл был разработан с учетом инкрементальных обновлений, поскольку мы можем добавлять некоторые объекты в конец PDF-файла, не перезаписывая весь файл. Благодаря этому изменения в PDF-документе можно быстро сохранить. Новую структуру PDF-документа можно увидеть на картинке ниже:

Рисунок 3: Структура PDF

Мы видим, что документ PDF по-прежнему содержит исходный заголовок, тело, таблицу перекрестных ссылок и трейлер.Кроме того, в PDF-документ были добавлены другие разделы основного текста, перекрестных ссылок и трейлера. Дополнительные разделы перекрестных ссылок будут содержать только записи для объектов, которые были изменены, заменены или удалены. Удаленные объекты останутся в файле, но будут отмечены флажком «f». Каждый трейлер должен заканчиваться тегом «%% EOF» и содержать запись / Prev, которая указывает на предыдущий раздел перекрестных ссылок.

В PDF версиях 1.4 и выше мы можем указать запись версии в словаре каталога документа, чтобы заменить версию по умолчанию из заголовка PDF.

Пример

Давайте представим простой пример PDF и проанализируем его. Давайте загрузим отсюда образец PDF-документа и проанализируем его. При открытии этого PDF-документа он выглядит, как показано ниже:

Рисунок 4: PDF-документ, образец

Перекрестные ссылки и концевые разделы представлены на картинке ниже:

Рисунок 5: Перекрестная ссылка и разделы прицепа

Раздел с перекрестными ссылками был уменьшен для ясности.Раздел перекрестных ссылок содержит один подраздел, который содержит 223 объекта. Раздел трейлера начинается со смещения байта 50291, включает 223 объекта, где корневой элемент указывает на объект 221, а информационный элемент указывает на объект 222.

В следующем разделе мы рассмотрим основные типы данных структуры PDF.

Типы данных PDF

PDF-документ содержит восемь основных типов объектов, описанных ниже. Эти типы: логические, числа, строки, имена, массивы, словари, потоки и нулевой объект.Объекты могут быть помечены, чтобы на них могли ссылаться другие объекты. Помеченный объект также называется косвенным объектом.

Логические

Есть два ключевых слова: истина и ложь , которые представляют логические значения.

Номера

В документе PDF есть два типа чисел: целые и действительные. Целое число состоит из одной или нескольких цифр, которым может предшествовать знак плюс или минус. Пример целочисленных объектов можно увидеть ниже:

Действительное значение может быть представлено одной или несколькими цифрами, с дополнительным знаком и ведущей, конечной или встроенной десятичной точкой (точкой).Пример действительных чисел можно увидеть ниже:

  • 123,0 -123,0 +123,0 123. -,123

Имена

Имена в документах PDF представлены последовательностью символов ASCII в диапазоне 0x21 — 0x7E. Исключение составляют символы:%, (,), <,>, [,], {,}, / и #, которым должна предшествовать косая черта. Альтернативное представление символов — их шестнадцатеричный эквивалент, которому предшествует символ «#». Существует ограничение на длину элемента имени, которая может составлять всего 127 байт.

При написании имени необходимо использовать косую черту для обозначения имени; косая черта не является частью имени, а является префиксом, указывающим, что далее следует последовательность символов, представляющих имя. Если мы хотим использовать пробел или любой другой специальный символ как часть имени, он должен быть закодирован в двузначной шестнадцатеричной системе счисления.

Примеры имен можно увидеть в таблице ниже:

Рисунок 6: Имена PDF-файлов (источник)

Струны

Строки в документе PDF представлены в виде серии байтов, заключенных в круглые или угловые скобки, но могут иметь длину не более 65535 байтов.Любой символ может быть представлен в виде ASCII, а также в восьмеричном или шестнадцатеричном представлении. Восьмеричное представление требует, чтобы символ был записан в форме ддд, где ддд — восьмеричное число. Шестнадцатеричное представление требует, чтобы символ был записан в форме

, где dd — шестнадцатеричное число.

Пример представления строки, заключенной в круглые скобки, можно увидеть ниже:

Пример представления строки, заключенной в угловые скобки, можно увидеть ниже (шестнадцатеричное представление ниже такое же, как и выше, и читается как «mystring»):

Мы также можем использовать специальные хорошо известные символы при представлении строки.Это: n для новой строки, r для возврата каретки, t для горизонтального табулятора, b для возврата, f для подачи формы, (для левой скобки) для правой скобки и для обратной косой черты.

Массивы

Массивы в документах PDF представлены как последовательность объектов PDF, которые могут быть разных типов и заключены в квадратные скобки. Вот почему массив в документе PDF может содержать любые типы объектов, такие как числа, строки, словари и даже другие массивы. В массиве также могут быть нулевые элементы.Массив обозначается квадратной скобкой. Пример массива представлен ниже:

  • 123 123.0 true (mystring) / myname]

Словари

Словари в PDF-документе представлены в виде таблицы пар ключ / значение. Ключ должен быть объектом имени, тогда как значением может быть любой объект, включая другой словарь. Максимальное количество статей в словаре — 4096 статей. Словарь может быть представлен статьями, заключенными в двойные угловые скобки << и >>.Пример словаря представлен ниже:
& lt; & lt; / mykey1 123

/ mykey2 0,123

/ mykey3 & lt; & lt; / mykey4 правда

/ mykey5 (mystring)

& gt; & gt;

& gt; & gt;

Потоки

Объект потока представлен последовательностью байтов и может быть неограниченной по длине, поэтому изображения и другие блоки больших данных обычно представляются как потоки.Объект потока представлен объектом словаря, за которым следует поток ключевых слов, за которым следует новая строка и конечный поток.

Пример объекта потока можно увидеть ниже:
& lt; & lt;

/ Тип / Страница

/ Длина 23 0 R

/ Фильтр / LZWDecode

& gt; & gt;

поток

endstream
Все объекты потока должны быть косвенными объектами, а словарь потока должен быть прямым объектом. Словарь потока указывает точное количество байтов потока.После данных должна быть новая строка и ключевое слово endstream.

Общие ключевые слова, используемые во всех словарях потоков, следующие (обратите внимание, что запись Length является обязательной):

  • Длина: сколько байтов файла PDF используется для данных потока. Если поток содержит запись фильтра, длина должна указывать количество байтов закодированных данных.
  • Тип: Тип объекта PDF, описываемого в словаре.
  • Фильтр: имя фильтра, который будет применяться при обработке данных потока.Можно указать несколько фильтров в порядке их применения.
  • DecodeParms: словарь или массив словарей, используемых фильтрами, указанными в Filter. Это значение определяет параметры, которые необходимо передать фильтрам при их применении. В этом нет необходимости, если фильтры используют значения по умолчанию.
  • F: указывает файл, содержащий данные потока.
  • FFilter: имя фильтра, который будет применяться при обработке данных, обнаруженных во внешнем файле потока.
  • FDecodeParms: словарь или массив словарей, используемых фильтрами, указанными FFilter.
  • DL: указывает количество байтов в декодируемом потоке. Это можно использовать, если на диске достаточно места для записи потока в файл.
  • N: количество косвенных объектов, хранящихся в потоке.
  • Первый: смещение в декодированном потоке первого сжатого объекта.
  • Extends: указывает ссылку на другие потоки объектов, которые образуют дерево наследования.

Данные потока в потоке объектов будут содержать N пар целых чисел, где первое целое число представляет номер объекта, а второе целое число представляет смещение в декодированном потоке этого объекта. Объекты в потоках объектов являются последовательными, и их не нужно сохранять в порядке возрастания относительно номера объекта. Первая запись в словаре идентифицирует первый объект в потоке объектов.

Нельзя хранить в потоке объектов следующую информацию:

  • Потоковые объекты
  • Объекты с номером поколения, отличным от нуля
  • Словарь шифрования документа
  • Косвенный объект записи Length в словаре потока объектов
  • Каталог документов, словарь линеаризации, объекты страниц

В PDF 1.5, информация о перекрестных ссылках может храниться в потоке перекрестных ссылок вместо таблицы перекрестных ссылок. Каждый поток перекрестных ссылок содержит информацию, эквивалентную таблице перекрестных ссылок и трейлеру.

Нулевой объект

Нулевой объект представлен ключевым словом «null».

Косвенные объекты

Прежде всего, мы должны знать, что любой объект в документе PDF может быть помечен как косвенный объект. Это дает объекту уникальный идентификатор объекта, который другие объекты могут использовать для ссылки на косвенный объект.Косвенный объект — это пронумерованный объект, представленный ключевыми словами «obj» и «endobj». Endobj должен присутствовать в отдельной строке, но obj должен находиться в конце строки идентификатора объекта, которая является первой строкой косвенного объекта. Строка идентификатора объекта состоит из номера объекта, номера поколения и ключевого слова «obj». Пример косвенного объекта выглядит следующим образом:
2 1 obj

12345

endobj
В приведенном выше примере мы создаем новый косвенный объект, который содержит объект с номером 12345.Объявляя объект косвенным объектом, мы можем использовать его в таблице перекрестных ссылок документа PDF и повторно использовать его на любой странице, в словаре и т. Д. В документе. Поскольку каждый косвенный объект имеет свою собственную запись в таблице перекрестных ссылок, к косвенным объектам можно получить доступ очень быстро.

Идентификатор косвенного объекта состоит из двух частей; первая часть — это номер текущего косвенного объекта. Непрямые объекты не нужно нумеровать последовательно в PDF-документе.Вторая часть — это номер поколения, который устанавливается равным нулю для всех объектов во вновь созданном файле. Это число позже увеличивается при обновлении объектов.

Мы можем ссылаться на косвенные объекты с помощью косвенной ссылки, которая состоит из номера объекта, номера поколения и ключевого слова R. Чтобы ссылаться на вышеупомянутый косвенный объект, мы должны написать что-то вроде ниже:

Если мы пытаемся сослаться на неопределенный объект, на самом деле мы имеем в виду нулевой объект.

Структура документа

Документ PDF состоит из объектов, содержащихся в основной части файла PDF. Большинство объектов в документе PDF — это словари. Каждая страница документа представлена ​​объектом страницы, который представляет собой словарь, включающий ссылки на содержимое страницы. Объекты страниц связаны между собой и образуют дерево страниц, которое объявляется с косвенной ссылкой в ​​каталоге документов.

Вся структура PDF-документа может быть представлена ​​на картинке ниже [1]:

Рисунок 7: Структура документа PDF (источник)

На рисунке выше мы видим, что каталог документов содержит ссылки на дерево страниц, иерархию контуров, цепочки статей, именованные места назначения и интерактивную форму.Мы не будем вдаваться в подробности того, что делает каждый из этих разделов, но представим только самый важный раздел — дерево страниц.

Каталог документов

Из рисунка выше мы видим, что Каталог документов является корнем объектов в документе PDF. Мы уже говорили, что это элемент / Root в разделе Trailer PDF, который определяет каталог документов. Каталог документов содержит ссылки на другие объекты, которые определяют содержание документа. Он также содержит информацию о том, как документ будет отображаться на экране.Записи в каталоге документов следующие:

  • / Тип: Тип объекта PDF, описываемого каталогом (в нашем случае это Каталог, поскольку это объект каталога документов).
  • / Версия: Версия спецификации PDF, на основе которой был создан документ.
  • / Extensions: Информация о расширениях для разработчиков в этом документе.
  • / Pages: косвенная ссылка на объект, являющийся корнем дерева страниц документа.
  • / Dests: косвенная ссылка на объект, который является корнем указанного объекта назначения.
  • / Outlines: косвенная ссылка на объект каталога структуры, который является корнем иерархии структуры документа.
  • / Threads: косвенная ссылка на массив словарей потоков, которые представляют цепочки статей документа.
  • / Метаданные: косвенная ссылка на поток метаданных, который содержит метаданные для документа.

Есть много других записей, которые мы можем видеть как часть каталога документов, но не будем описывать их здесь.Подробности читатель может посмотреть в наших источниках. Пример каталога документов представлен ниже:
1 0 obj

& lt; & lt; / Тип / Каталог

/ Страницы 2 0 R

/ PageMode / UseOutlines

/ Наброски 3 0 R

& gt; & gt;

эндобдж

Дерево страниц

Доступ к страницам документа осуществляется через дерево страниц, которое определяет все страницы в документе PDF. Дерево содержит узлы, которые представляют страницы документа PDF, которые могут быть двух типов: промежуточные и листовые узлы.Промежуточные узлы также называются узлами дерева страниц, а конечные узлы — объектами страницы.

Простейшая древовидная структура страницы может состоять из одного узла дерева страниц, который напрямую ссылается на все объекты страницы (так что все объекты страницы являются листами).

Каждый узел в дереве страниц должен иметь следующие записи:

  • / Type: Тип объекта PDF, описываемого этим объектом (в нашем случае это Pages , поскольку мы говорим об узлах дерева страниц).
  • / Parent: должен присутствовать во всех узлах дерева страниц, кроме корневого, где эта запись не должна присутствовать. Эта запись указывает своего родителя.
  • / Kids: Должен присутствовать во всех узлах дерева страниц, кроме листьев, и указывает все дочерние элементы, непосредственно доступные из текущего узла.
  • / Count: указывает количество конечных узлов, которые являются потомками этого узла в последующем дереве страниц.

Мы должны помнить, что дерево страниц не имеет отношения ни к чему в документе PDF, например к страницам или главам.

Базовый пример дерева страниц можно увидеть ниже:
2 0 obj

& lt; & lt; / Тип / Страницы

/ Дети [4 0 R

10 0 Р

24 0 R

]

/ Количество 3

& gt; & gt;

эндобдж

4 0 объект

& lt; & lt; / Тип / Страница

& gt; & gt;

эндобдж

10 0 obj

& lt; & lt; / Тип / Страница

& gt; & gt;

эндобдж

24 0 obj

& lt; & lt; / Тип / Страница

& gt; & gt;

endobj
В дереве страниц выше определяется объект Root с идентификатором 2, у которого есть три дочерних объекта, объекты 4, 10 и 20.Мы также можем видеть, что листья дерева страниц — это словари, определяющие атрибуты отдельной страницы документа. Есть несколько атрибутов, которые мы можем использовать при их определении для каждой страницы документа.

Мы рассмотрели базовую структуру документа PDF и типы данных. Если мы хотим начать поиск уязвимостей в программах для чтения PDF-файлов, нам необходимо изменить PDF-документ таким образом, чтобы программа для чтения PDF-файлов не могла с этим справиться и вылетела из строя. Обычно, если нам удается вызвать сбой программы чтения PDF-файлов, мы обнаруживаем уязвимость системы безопасности, которую можем использовать для выполнения произвольного кода на целевой машине.

Пример

В этой статье мы рассмотрим очень простой пример документа PDF. Сначала нам нужно создать PDF-документ, чтобы затем мы попытались его проанализировать. Чтобы создать документ PDF, давайте сначала создадим очень простой документ .tex, содержащий то, что показано на рисунке ниже:

Рисунок 8: Простой документ

Мы видим, что документ .tex действительно не содержит много. Сначала мы определяем документ как статью, а затем включаем содержимое статьи в начальный и конечный документ.Мы добавляем новый раздел с заголовком (Введение) и статическим текстом «Hello World!».

Мы можем скомпилировать документ .tex в документ PDF с помощью команды pdflatex и указав имя файла .tex в качестве аргумента. Полученный PDF-файл будет выглядеть так, как показано на рисунке ниже:

Рисунок 9: Результат

Мы видим, что документ PDF на самом деле не содержит очень много, только текст, который мы фактически включили, и никаких изображений, JavaScript или других элементов.

Пример 1

Давайте посмотрим на структуру документа PDF, которая представлена ​​в выводе ниже:
% PDF-1.5

% ÐÔÅØ

3 0 объект & lt; & lt;

/ Длина 138

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

10 0 объект & lt; & lt;

/ Длина2 1526

/ Длина3 7193

/ Длина4 0

/ длина 8194

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

12 0 объект & lt; & lt;

/ Длина2 1509

/ Длина3 9410

/ Длина4 0

/ Длина 10422

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

15 0 объект & lt; & lt;

/ Производитель (pdfTeX-1.40,12)

/ Создатель (TeX)

/ CreationDate (D: 20121012175007 + 02’00 ’)

/ ModDate (D: 20121012175007 + 02’00 ’)

/ В ловушке / Ложь

/PTEX.Fullbanner (Это pdfTeX, версия 3.1415926-2.3-1.40.12 (TeX Live 2011) kpathsea версия 6.0.1)

& gt; & gt; эндобдж

6 0 объект & lt; & lt;

/ Тип / ObjStm

/ № 10

/ Первые 65

/ Длина 761

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

16 0 объект & lt; & lt;

/ Тип / XRef

/ Индекс [0 17]

/ Размер 17

/ Вт [1 2 1]

/ Корень 14 0 R

/ Инфо 15 0 R

/ ID [& lt; 1DC2E3E09458C9B4BEC8B67F56B57B63 & gt; & lt; 1DC2E3E09458C9B4BEC8B67F56B57B63 & gt;]

/ Длина 60

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

startxref

20215

%% EOF
Для создания такого простого документа PDF достаточно много элементов, поэтому мы можем представить, как будет выглядеть действительно сложный документ PDF.Мы также должны помнить, что все потоки закодированных данных были удалены и заменены тремя точками для ясности и краткости.

Давайте представим каждый из разделов PDF. Заголовок можно увидеть на картинке ниже:

Рисунок 10: Заголовок PDF

Корпус можно увидеть на картинке ниже:

Рисунок 11: Корпус PDF

Раздел xref можно увидеть на картинке ниже:

Рисунок 11: PDF xref

И, наконец, раздел Trailer представлен ниже:

Рисунок 12: Прицеп PDF

Мы представили все разделы PDF-документа, но нам еще предстоит их проанализировать.Заголовок PDF-документа стандартный, и нам не нужно об этом говорить, поэтому оставим текст на потом.

Вот почему мы должны сначала взглянуть на раздел xref. Мы видим, что смещение от начала файла до таблицы внешних ссылок составляет 20215 байт, что в шестнадцатеричной форме равно 0x4ef7. Если мы посмотрим на шестнадцатеричное представление файла, которое мы можем получить с помощью инструмента xxd, мы увидим то, что представлено на рисунке ниже:

Рисунок 13: Шестнадцатеричное представление файла

Выделенные байты лежат точно в начале смещения 20125 байтов от начала файла.Предыдущие байты 0x0a — это новая строка, а текущие байты 0x31 представляют собой число 1, которое в точности является началом таблицы внешних ссылок. Вот почему таблица xref представлена ​​косвенным объектом с идентификатором 16 и номером поколения 0. (Это должно быть так для всех объектов, поскольку мы только что создали документ PDF и ни один из объектов еще не был изменен. Если мы посмотрите на весь PDF-документ, и мы увидим, что это действительно так; все объекты имеют нулевой номер поколения.)

/ Тип косвенного объекта классифицирует его как таблицу внешних ссылок.Массив / Index содержит пару целых чисел для каждого подраздела этого раздела. Первое целое число указывает номер первого объекта в подразделе, а второе целое число указывает количество записей в подразделе. В нашем примере номер объекта равен нулю, и в этом подразделе 17 записей. Это также указывается в директиве / Size. Обратите внимание, что это число на единицу больше наибольшего числа любого номера объекта в подразделе. Атрибут / W определяет массив целых чисел, представляющих размер полей в записи перекрестной ссылки, что означает, что поля являются одним байтом, двумя байтами и одним байтом.

После этого идет элемент / Root, который указывает каталог каталога для документа PDF как объект номер 14. / Info — это каталог информации документа PDF, который содержится в объекте номер 15. Массив / ID требуется, потому что Зашифрованная запись присутствует и содержит две строки, составляющие идентификатор файла. Эти две строки используются в качестве входных данных для алгоритма шифрования.

Параметр / Length указывает длину ключа шифрования в битах; значение должно быть кратным 8 в диапазоне от 40 до 128 (значение по умолчанию — 40).В нашем случае длина ключа шифрования составляет 60 бит. / Filter указывает имя обработчика безопасности для этого документа; это также обработчик безопасности, который использовался для шифрования документа. В нашем случае это FlateDecode, который кодирует данные с помощью метода сжатия zlib / deflate.

Мы видим, что другая часть таблицы внешних ссылок сжата, поэтому мы не можем ее прочитать. Конечно, мы могли бы применить какой-нибудь алгоритм распаковки zlib к сжатым данным, но есть вариант получше.Зачем нам писать программу для этого, если инструмент уже существует? С помощью pdftk мы можем восстановить поврежденную таблицу внешних ссылок PDF-файла с помощью следующей команды:

  • # pdftk in.pdf output out.pdf

После этого файл out.pdf содержит следующие разделы внешних ссылок и трейлеров:

Рисунок 14: xref и трейлер

Очевидно, что номера объектов / Root и / Info изменились, а также другие вещи, но мы получили ключевые слова трейлера и xref, которые определяют таблицу xref.Мы видим, что в таблице внешних ссылок 14 объектов.

Мы могли бы продолжить и попытаться расшифровать и другие разделы, но это выходит за рамки данной статьи. Затем мы проверим документ, который не закодирован.

Пример 2

Давайте взглянем на образец документа PDF, доступный здесь. Некоторые объекты потока зашифрованы, но сейчас они не так важны. Поскольку мы уже знаем, как работать с PDF-документами, мы не потеряем слишком много слов в простых вещах.

Давайте откроем этот PDF-файл в текстовом редакторе, таком как gvim, и посмотрим на раздел трейлера.К настоящему моменту мы должны знать, что все документы PDF следует читать от конца до начала. Прицеп представлен на картинке ниже:

Рисунок 15: PDF-трейлер

Давайте также представим Xref всего с несколькими объектами (остальные были отброшены для ясности):

Рисунок 16: PDF xref

Мы видим, что корневой каталог / документа PDF содержится в объекте с ID 221, а в объекте 222 есть дополнительная информация.Объект 221 — самый важный объект во всем документе, поэтому давайте представим его:

Рисунок 17: Объект 221

Мы видим, что объект действительно является Каталогом документов. Объект Page Tree — 212, объект Outlines — 213, объект Names — 220, а объект OpenAction — 58. Мы не говорили ни о каких других типах, кроме объекта Page Tree, поэтому продолжим разговор о Page Tree. Только.

Объект Page Tree с ID 212 представлен на рисунке ниже:

Рисунок 18: Объект дерева страниц

Итак, объект 212 содержит фактические страницы документа PDF.Он содержит 10 страниц, что совершенно верно (мы можем проверить это, если откроем PDF-файл с помощью любого PDF-ридера и проверим количество страниц).

Мы знаем, что атрибут Kids определяет все дочерние элементы, напрямую доступные из текущего узла. В нашем случае есть два прямых дочерних узла с идентификаторами объектов 66 и 135. Объект 66 представлен ниже:

Рисунок 19: Объект 66

Объект 66 содержит другие дочерние элементы с ID 57, 69, 75, 97, 108 и 120.

Рисунок 20: Объект 135

Объект 135 дополнительно определяет объекты 129, 138, 133 и 158.

Если мы посчитаем все элементы, мы увидим, что есть ровно 10 элементов, что означает 10 страниц из 10 страниц. Это также подразумевает, что все представленные объекты на самом деле являются фактическими страницами документа PDF и не содержат дополнительных дочерних узлов.

Все представленные объекты объявлены одинаково, поэтому мы не будем рассматривать каждый из них по очереди.Вместо этого мы просто взглянем на один объект, а именно на объект 57. Объект 57 содержит, объявлен следующим образом:

Рисунок 21: Объект 57

Мы видим, что тип объекта — / Page, что напрямую подразумевает, что это листовой узел, представляющий одну из страниц документа PDF. Содержимое этой страницы PDF можно найти в объекте 62:

.

Рисунок 22: Объект 62

Мы видим, что фактическое содержимое страницы PDF кодируется с помощью FlateDecode, который представляет собой простой алгоритм кодирования zlib.

Заключение

Мы видели два примера создания PDF-документов. Обладая полученными знаниями, мы можем начать создавать неправильные PDF-документы и передавать их различным программам для чтения PDF-файлов. Если при чтении определенного PDF-документа происходит сбой определенного PDF-ридера, этот документ содержит что-то, что программа PDF-ридера не может обработать. Это подразумевает возможность уязвимости, которую необходимо изучить дополнительно.

В конце, если обнаружится, что уязвимость присутствует, мы даже можем написать PDF-документ, содержащий вредоносный код, который запускается, когда жертва открывает PDF-документ с помощью уязвимого PDF-ридера на своей целевой машине.В таких случаях вся машина может быть скомпрометирована, поскольку произвольный вредоносный код может быть запущен, просто открыв вредоносный документ PDF.

Источники

Статистика уязвимостей

, сведения о CVE

Политики поддержки Adobe: поддерживаемые версии продуктов, Adobe

Управление документами — Формат переносимых документов — Часть 1: PDF 1.7, Adobe (Archive.org)

Артикул:

[1]: формат файла PDF, доступный по адресу: http: //wwwimages.adobe.com / www.adobe.com / content / dam / Adobe / en / devnet / pdf / pdfs / PDF32000_2008.pdf.

Формат файла PDF — Что такое файл PDF?

Portable Document Format (PDF) — это тип документа, созданный Adobe еще в 1990-х годах. Целью этого формата файла было введение стандарта для представления документов и других справочных материалов в формате, который не зависит от прикладного программного обеспечения, оборудования и операционной системы. Формат файла PDF имеет полную возможность содержать такую ​​информацию, как текст, изображения, гиперссылки, поля формы, мультимедиа, цифровые подписи, вложения, метаданные, геопространственные функции и трехмерные объекты, которые могут стать частью исходного документа.

В большинстве случаев существующие документы конвертируются в PDF, а не создаются с нуля. Но это не означает, что нет программного обеспечения для создания или обработки файлов PDF.

(Хотите поделиться чем-нибудь о формате PDF-файла? Вы можете опубликовать свои выводы в разделе новостей формата PDF-файла.)

Формат PDF-файла — краткая история

Быстрый просмотр временной шкалы формирования PDF-файла в сроки следующие:

1993 — Adobe Systems предоставила спецификации PDF бесплатно

2008 — PDF был выпущен в качестве открытого стандарта 1 июля 2008 г. и был опубликован Международной организацией по стандартизации как ISO 32000-1: 2008 .

2008 — Adobe опубликовала публичную патентную лицензию в формате ISO 32000-1 без лицензионных отчислений на все патенты, принадлежащие Adobe, которые необходимы для создания, использования, продажи и распространения реализаций, совместимых с PDF.

Первая версия PDF, обозначенная как PDF 1.0, позже претерпела изменения до PDF 1.7. PDF 1.7, который стал ISO 32000-1, включает некоторые нестандартные проприетарные технологии, а также Adobe XML Forms Architecture (XFA) и расширение JavaScript для Acrobat.28 июля 2017 года был опубликован PDF 2.0, известный как ISO 32000-2: 2017, который не включает никаких нестандартных технологий.

Спецификации формата файла PDF

Файл PDF — это набор байтов, которые могут быть сгруппированы в токены в соответствии с правилами синтаксиса, определенными спецификациями PDF. Один или несколько маркеров объединяются для формирования синтаксических сущностей более высокого уровня, в основном объектов, которые являются базовыми значениями данных, из которых создается PDF-документ.

Файловая структура файлов PDF

Содержимое PDF-файла расположено внутри файла в следующей последовательности.

| Заголовок
| Тело
| Таблица перекрестных ссылок
| Прицеп

Заголовок файла PDF

Независимо от версии PDF файл PDF начинается с заголовка, содержащего уникальный идентификатор для PDF и версию формата, например% PDF-1.x, где x находится в диапазоне от 1 до 7.

Тело файла

Тело файла PDF состоит из последовательности косвенных объектов, представляющих содержимое документа. Объекты, как описано выше, представляют компоненты документа, такие как шрифты, страницы и образцы изображений.Начиная с PDF 1.5, тело также может содержать потоки объектов, каждый из которых содержит последовательность косвенных объектов.

Таблица перекрестных ссылок

Таблица перекрестных ссылок содержит информацию, которая разрешает произвольный доступ к косвенным объектам в файле, так что не нужно читать весь файл, чтобы найти какой-либо конкретный объект. Таблица должна содержать однострочную запись для каждого косвенного объекта, определяющую байтовое смещение этого объекта в теле файла. (Начиная с PDF 1.5, некоторая или вся информация о перекрестных ссылках может альтернативно содержаться в потоках перекрестных ссылок.

Трейлер файла

Трейлер файла PDF позволяет соответствующему читателю быстро найти таблицу перекрестных ссылок и некоторые специальные объекты. Соответствующие читатели должны читать PDF-файл с его конца. Последняя строка файла должна содержать только маркер конца файла %% EOF. Две предыдущие строки должны содержать, по одной на строку и в определенном порядке, ключевое слово startxref и байтовое смещение в декодированном потоке от начала файла до начала ключевого слова xref в последнем разделе перекрестных ссылок.

Объекты PDF

Файл PDF включает несколько различных типов объектов следующих типов

  • Логические значения — представляющие условное истинное или ложное значение
  • Числа — целые и действительные значения
  • Строки — содержат символы в круглых скобках
  • Имена — начать с вперед / символа, например / ASomewhatLongerName приводит к ASomewhatLongerName
  • Массивы — PDF поддерживает одномерные массивы. Массивы более высоких измерений могут быть построены с использованием массивов в качестве вложенных элементов
  • Словари — коллекция объектов в виде пар ключ-значение.Он может иметь нулевые записи.
  • Streams — представляет последовательность байтов, которая также может иметь неограниченную длину
  • Null Object — представляет нулевое значение

Могут быть другие другие объекты, такие как комментарии, которые представлены знаком% и могут содержать 8-битные символы .

Косвенные объекты

Любой объект в файле PDF может быть помечен как косвенный объект. Косвенным объектам присваивается уникальный идентификатор объекта, по которому другие объекты могут ссылаться на него.Перекрестные ссылки на них поддерживаются в индексной таблице и помечаются ключевым словом xref, которое следует за основным телом и дает байтовое смещение каждого косвенного объекта от начала файла.

Линейные и нелинейные макеты PDF

Макеты PDF подразделяются на близкие и нелинейные в зависимости от целевых приложений и других факторов.

Нелинейный — Нелинейные PDF-файлы занимают меньше места на диске по сравнению с линейными PDF-файлами. PDF-страницы документа находятся в разрозненной форме по PDF-файлу, поэтому нелинейные файлы работают медленнее по сравнению с линейными файлами.

Linear PDF — ориентированные на онлайн-программы просмотра PDF, файлы Linear PDF построены таким образом, что они записываются на диск линейным образом. При этом не требуются плагины браузера для загрузки всего документа перед отображением.

Обзор объектов

Как уже упоминалось, тело PDF-файла представляет собой набор объектов, упомянутых выше. PDF в значительной степени основан на PostScript без таких функций управления языков программирования, как if и loop. Команды, выдаваемые кодом Postscript для создания графического содержимого, собираются и токенизируются в дополнение к любым файлам, графике или шрифтам, на которые ссылается документ.Все это содержимое накапливается в одном файле, в результате чего получается скомпонованный вывод PostScript.

Текст

Текст в PDF представлен текстовыми элементами, которые фактически отображаются с глифами из шрифтов. Глиф — это графическая форма, с которой можно выполнять все графические манипуляции, например преобразование координат. Из-за важности текста в большинстве описаний страниц PDF предоставляет средства более высокого уровня для удобного и эффективного описания, выбора и визуализации глифов.

Графика

Графические операторы, используемые в потоках содержимого PDF, описывают внешний вид страниц, которые должны воспроизводиться на устройстве вывода растров. Оборудование предназначено как для принтеров, так и для дисплеев. Графические операторы образуют шесть основных групп:

  • Графические операторы состояния манипулируют структурой данных, называемой графическим состоянием, глобальной структурой, в которой выполняются другие графические операторы. Состояние графики включает в себя текущую матрицу преобразования (CTM), которая отображает координаты пользовательского пространства, используемые в потоке содержимого PDF, в координаты устройства вывода.Он также включает текущий цвет, текущий контур обрезки и многие другие параметры, которые являются неявными операндами операторов рисования.
  • Операторы построения пути задают пути, которые определяют формы, линейные траектории и области различных типов. Они включают в себя операторы для начала нового пути, добавления к нему линейных сегментов и кривых и закрытия его.
  • Операторы рисования контура заполняют контур цветом, рисуют обводку вдоль него или используют его в качестве границы отсечения.
  • Другие операторы рисования рисуют определенные графические объекты с самоописанием.К ним относятся образцы изображений, геометрически определенные оттенки и целые потоки контента, которые, в свою очередь, содержат последовательности графических операторов.
  • Текстовые операторы выбирают и отображают глифы символов из шрифтов (описания гарнитур для представления текстовых символов). Поскольку PDF рассматривает глифы как общие графические формы, многие текстовые операторы можно сгруппировать с помощью операторов состояния графики или рисования. Однако структуры данных и механизмы для работы с описаниями глифов и шрифтов достаточно специализированы.
  • Операторы помеченного содержимого связывают логическую информацию более высокого уровня с объектами в потоке содержимого. Эта информация не влияет на визуализированный внешний вид контента; это полезно для приложений, использующих PDF для обмена документами.

Ссылки

Советы по использованию файлов Adobe PDF

Многие из наших онлайн-форм, отчетов, нормативных актов и публикаций доступны только в формате Portable Document Format (PDF). Файлы PDF можно просматривать с помощью бесплатного программного обеспечения Adobe Reader.

Скачать бесплатно Adobe Reader

Проблемы с нашими файлами PDF?

Существует несколько причин, по которым вы не сможете открывать или распечатывать онлайн-файлы PDF CDSS, особенно если это большой PDF-файл и / или если вы используете более медленный коммутируемый доступ в Интернет или старую версию Программное обеспечение Adobe Acrobat Reader.

Шаги, которые помогут вам просмотреть или распечатать онлайн-файлы PDF:

A. У вас есть рабочая копия последней версии Adobe Reader на вашем компьютере?
Вы можете проверить это, щелкнув указанную выше ссылку, чтобы перейти на сайт загрузки Adobe Reader.Вы также можете попробовать открыть другие файлы PDF (онлайн или хранящиеся на вашем компьютере), чтобы убедиться, что ваше программное обеспечение Reader работает правильно.

B. Если по-прежнему не удается открыть или распечатать файл PDF, обычно можно решить проблему, загрузив файл на свой компьютер перед его открытием. Вот как это сделать:

  1. Щелкните правой кнопкой мыши ссылку на файл PDF. НЕ открывайте его в это время.
  2. В раскрывающемся меню выберите «Сохранить объект как …». (Примечание: если вы используете Mac вместо ПК, выберите «загрузить на диск»). Появится окно «Сохранить как».Примечание. Окно «Сохранить как» может появиться через некоторое время, если вы загружаете большой файл PDF или используете коммутируемый доступ в Интернет.
  3. В поле «Сохранить в» вверху выберите место для сохранения файла на вашем компьютере, которое вам будет легко запомнить. Ваш рабочий стол или Мои документы — два наиболее распространенных места. Щелкните на «Сохранить».
  4. PDF-файл будет загружен на ваш компьютер. После завершения процесса загрузки перейдите в папку, в которой вы сохранили файл, и дважды щелкните по нему, чтобы открыть.Вы сможете без проблем открывать и распечатывать файл из этого места.

Формат файла Microsoft Excel

Формат Microsoft Excel (.xls) — это формат файла, который используется для загрузки данных для расчетов данных. Перед загрузкой данных на вашем компьютере должен быть установлен Microsoft Excel или бесплатная программа просмотра Microsoft Excel Viewer. Средство просмотра Microsoft Excel Viewer предлагает ограниченные возможности для управления данными и может быть загружено с веб-сайта Microsoft.

Adobe Portable Document Format (PDF) | Веб-службы | Коммуникации и маркетинг

Adobe Portable Document Format (PDF)

Что такое PDF?

PDF — это формат файла, который сохраняет истинное форматирование документа на разных платформах и полезен для документов со сложным форматированием, таких как информационные бюллетени или финансовые отчеты.Файлы PDF можно просматривать и распечатывать точно так, как задумал автор, с помощью бесплатного средства чтения файлов PDF.

Загрузите бесплатную программу просмотра PDF-файлов

Без программы просмотра PDF-файлов вы не сможете просматривать или распечатывать PDF-файлы. Во многих веб-браузерах еще не установлено средство просмотра файлов PDF.

PDF-файлов и специальные возможности

PDF-файлы

недоступны для многих пользователей, использующих программы чтения с экрана. Хотя Adobe Acrobat Standard или Professional предлагает возможность создавать PDF-файлы со специальными возможностями, для этого требуется, чтобы документ содержал настоящий текст и был размечен для удобства.Для просмотра файла со специальными возможностями у пользователя должна быть установлена ​​программа Acrobat Reader.

Для недоступных PDF-файлов Adobe предлагает онлайн-преобразование PDF в HTML.

Дополнительные сведения о файлах PDF и специальных возможностях см. По ссылкам ниже:

Создание PDF-файлов

Хотя бесплатную программу Adobe Acrobat Reader можно использовать для просмотра файлов PDF, Adobe продает программное обеспечение, используемое для создания файлов PDF. Вы не можете создавать PDF-файлы с помощью Acrobat Reader, Ghostscript или Xpdf.

Стандарты

доступности гласят, что веб-страница, для которой требуется подключаемый модуль или другая форма программного обеспечения для отображения содержимого страницы, должна содержать ссылку на необходимое программное обеспечение или подключаемый модуль.Эта веб-страница была разработана специально для K-Staters, чтобы указывать на ссылку на файл PDF.

Вот пример того, как связать файл PDF:
Эта организационная схема (PDF) показывает полную иерархию университетов.

Все апплеты, сценарии и надстройки (включая файлы PDF и PowerPoint и т. Д.) И содержимое в них доступны для вспомогательных технологий, в противном случае предоставляются альтернативные средства доступа к эквивалентному содержимому.

PDF-файл можно сделать доступным для пользователей программ чтения с экрана, но может быть лучше включить доступную HTML-версию документа вместо или в дополнение к PDF.Для файлов PowerPoint должны быть предусмотрены доступные альтернативы.

.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *