Что такое формат пдф: Что такое PDF? Формат PDF
Содержание
Чем отличается формат PDF от PDF/A. И что выбрать для хранения электронных документов
Ответ для самых торопливых: PDF/A — это версия формата PDF, стандартизированная ISO и предназначенная для использования при архивировании и долгосрочном хранении электронных документов. Если вы хотите возвращаться к скан-копии печатного оригинала или электронному документу спустя много лет, то лучше использовать именно его. А теперь разберём вопрос подробнее.
Электронный документ PDF: особенности и история формата
PDF (Portable document format) — это универсальный формат электронных документов. Он создан по инициативе компании Adobe в 1993 году, и его исходное предназначение — электронное представление печатных материалов.
Задачи формата PDF:
- хранение данных о цветовой схеме и расположении элементов;
- обеспечение идентичного представления информации на разных мониторах и принтерах.
За время своего существования PDF значительно прибавил в возможностях. Ещё в первой редакции формата появилась возможность вставлять ссылки в текст, шифровать документ с паролем и тем самым защищать его от модификации. Функциональность дополнялась год за годом:
Версия | Возможности |
PDF 1-1.1 (1993-1994) | Работа с потоками данных, защита паролем и цветопередача, независимая от устройства |
PDF 1.2 (1996) | Интерактивные элементы и возможность обрабатывать действия мыши |
PDF 1.3 (1999) | Электронная подпись (ЭП), javaSAFEscript |
PDF 1.4 (2001) | Прозрачность, текстовый слой поверх картинки, метаданные «ключ-значение» |
PDF 1.5 (2003) | Мультимедиа, объектные и перекрестные потоки, слои |
PDF 1.6 (2005) | XML-формы, AES-шифрование |
PDF 1.7-2.0 (2005-2020) | AES-шифрование 256-битным ключом, архитектура XML-форм XFA 3.0 |
Начиная с версии PDF 1.4, которая вышла в 2001 году, пользователи могут наносить текстовый слой поверх изображения. Причём он может быть невидимым. То есть пользователь, видя «картинку», тем не менее может копировать с неё текст. Кроме того, в этой же версии появилась возможность вставлять метаданные в виде пар «ключ-значение», каждая из которых может быть связана с какой-то частью документа (например, отдельным изображением) или со всем документом. Это важные нововведения, с точки зрения архивного хранения, и они поддерживаются форматом по сей день.
С 2008 года PDF — открытый стандарт ISO 32000 (последняя редакция международного стандарта качества — 32000-2 — опубликована в декабре 2020 года). Это значит, что сегодня PDF рекомендуется к использованию во всём мире.
Сохранение документа в PDF/A. Когда нужен этот формат?
В начале статьи мы уже дали ответ на этот вопрос: PDF/A — это версия PDF, которая рекомендована всё тем же ISO для долговременного архивирования электронных документов.
Длительный срок хранения становится возможным, потому что в содержимое электронного документа в формате PDF/A внедряется вся информация, необходимая для его отображения. В частности, к ней относятся шрифты — те из них, которые использованы в документе, включены в него. К слову, это влияет на его размер: документ в формате PDF/A часто больше по размеру, чем документ с аналогичным содержимым, сохранённый в PDF.
Считается, что документ, хранимый в формате PDF/A, из-за полного отсутствия связи с такими изменчивыми вещами как гиперссылки и мультимедийный контент можно будет открыть в любой операционной системе через какое угодно время с помощью приложения, поддерживающего соответствующий формат.
Есть ещё один аргумент в его пользу. Поскольку PDF/A обеспечен статусом международного стандарта, его поддержка разработчиками в долгосрочной перспективе оправдана, а использование целесообразно. Чего не скажешь о других доступных форматах хранения электронных документов, которые могут измениться в любой момент времени.
При этом целостность и неизменность неподписанного документа в формате PDF/A не может быть гарантирована и не заявляется как особенность формата. Другими словами, несмотря на то, что данный формат позиционируется как обеспечивающий долгосрочное хранение, изменение содержимого документа возможно и не является отклонением от нормы, если оно не зашифровано.
Однако есть ещё один нюанс: для каждого конкретного документа, формат которого заявлен как PDF/A, невозможно заведомо утверждать, что это действительно так. В каждом случае необходима верификация на соответствие требованиям формата. И если на этапе размещения в архиве или после очередного изменения она не будет проведена, можно считать миссию обеспечения долгосрочного хранения потенциально проваленной (с некоторыми оговорками, но всё же).
Как проверить PDF/A
Действительно ли документ сохранён в нужном формате — очевидные сомнения. Внешне определить, PDF это или PDF/A, очень сложно.
Если файл соответствует формату PDF/A, то информацию об этом можно увидеть в приложении Acrobat Distiller на панели «Навигация» (Просмотр — Показать/Скрыть — Панели навигации — Стандарты). Подробнее — в справке Adobe.com.
Также в этих случаях используются программы-валидаторы. Пример — veraPDF (можно скачать здесь). Программу создавал союз нескольких профессиональных сообществ, в том числе Ассоциация PDF (PDF Association).
Также есть сервисы, которые могут определить формат в режиме онлайн. В их числе avePDF, pdf-online и другие. Во многих таких сервисах можно не только проверить, но и изменить формат — перевести файл из PDF в PDF/A. Доверять онлайн-решениям или нет — вопрос, который остаётся на стороне пользователя. Во всяком случае к официально признанным программам-валидаторам PDF они не относятся.
Чтобы обеспечить целостность и юридическую значимость электронных документов, недостаточно использовать нужный формат. Также необходимо использовать специализированную систему долговременного хранения.
Как хранить отсканированный документ в PDF/A
Исходя из описанных выше различий между форматами PDF и его потомком PDF/A, вполне можно предположить, что первый больше пригоден для оперативного обмена и краткосрочного хранения электронных документов. При этом PDF/A, несмотря на потенциально большой размер единичного документа (в него внедрены все использованные шрифты, а это для краткосрочного использования избыточный и ощутимый балласт), имея статус международного стандарта, гарантирует, что даже через продолжительное время, вне зависимости от окружения и операционной системы, любой пользователь сможет открыть документ в данном формате, располагая приложением-просмотрщиком. Этот факт укладывается в концепцию архива электронных документов и должен учитываться при сохранении каждого документа в нём.
Теперь необходимо определиться с тем, что такое отсканированный образ документов. Чаще всего это растровое изображение. Предполагается, что текста поверх него нет, то есть в документе хранится исключительно отсканированный растр — изображение, текст на котором непонятен компьютеру, а понятен только человеку.
В исключительных случаях поверх растрового изображения может быть расположен текстовый слой, частично или целиком наполненный. Причём делается это либо вручную человеком, либо с помощью системы распознавания текста. Можно предположить, что документ содержит метаданные, так или иначе связанные с видом документа и его содержимым (например, если это счёт-фактура, метаданные могут содержать информацию о поставщике, дате выставления, сумме и т. д.).
Очевидно, что отсканированный образ документа допускает, но не подразумевает долгосрочного хранения. Но всё-таки в большинстве случаев образ должен храниться не меньше бумажного оригинала, а зачастую значительно дольше, поскольку значимость и важность его в контексте организации-владельца всегда есть. Кроме того, образ снят с бумажного документа, а это значит, что его изменение не подразумевается, хотя и возможно.
На основании перечисленных особенностей, которыми обладает отсканированный образ документа, можно смело заявлять, что для хранения одинаково пригодны оба формата. Хотя PDF/A допускает и метаданные, и текстовый слой поверх изображения, и даже подписание документа с целью защитить его от модификации.
Сохранение или преобразования в формат PDF на компьютере Mac
Примечание:
Мы стараемся как можно оперативнее обеспечивать вас актуальными справочными материалами на вашем языке. Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Просим вас уделить пару секунд и сообщить, помогла ли она вам, с помощью кнопок внизу страницы. Для удобства также приводим
ссылку на оригинал (на английском языке)
.
Если вы хотите, чтобы читать, но не редактировать в документе, можно сохранить его в формате PDF. В этом случае PDF сохранять форматирование и часто быть меньшего размера файла, чем исходного документа. Теги PDF-файлов упростить для средств чтения с экрана и другие специальные возможности для определения логических порядок чтения и переход к файлу, а также разрешения для содержимого Перекомпоновка при использовании больших типа отображает персональный (КПК), а мобильные телефоны. Маркировки это можно сделать автоматически при сохранении файла в формате PDF.
Сохранение документа в виде PDF-файла с тегами
-
В меню файл выберите команду Сохранить как. Или можно также сохранить файл, щелкнув значок » Сохранить » на ленте.
-
В поле Сохранить как введите имя файла.
Важно:
-
Назовите PDF-файл иначе, чем исходный документ. Итак, у вас получится два файла: документ Word, который можно изменять, и PDF-файл, которым вы можете поделиться.
-
Если вы не измените имя файла, документ будет преобразован в формат PDF и вы сможете обратить преобразование только с помощью специального программного обеспечения или надстройки от стороннего производителя.
-
-
В поле Формат файла выберите PDF.
-
Нажмите кнопку Экспорт.
Отправка по электронной почте копии документа в формате PDF из Word
Вы можете отправлять копии документов в формате PDF прямо из Word.
Дополнительные сведения
Дополнительные сведения о сохранении документов в формате PDF в других версиях Microsoft Word перейдите к Сохранение в формате PDF.
Создание удобочитаемых PDF-документов , которые необходимо узнать больше о документы PDF с тегами
Что такое формат PDF? | Конвертер PDF в Word
Что такое формат PDF?
Если файл имеет расширение .pdf, скорее всего это файл формата Portable Document Format (PDF), разработанный Adobe Systems, Inc. PDF файл позволяет просматривать и печатать документ под различными платформами, включая Windows, UNIX и Mac.
Просмотр PDF файлов
Для просмотра PDF файлов необходимо скачать программу Adobe® Acrobat® Reader, которая является бесплатной и служит для просмотра и печати файлов формата Adobe Portable Document Format (PDF) в наиболее распространенных операционных системах и платформах.
PDF Navigation Features
Certain features built into the PDF specification allow authors to expand the usefulness of a document. For example, you can add bookmarks, thumbnails of each page, internal and external links, form fields, article threads, buttons for navigation, notes to annotate information, and views to magnify or reduce a page to fit within the user’s computer screen. PDF allows users to magnify up to 800% on screen with no loss of clarity.
PDF Size and Performance
For the Web, smaller files are better since download time depends on file size. PDF files can be optimized to reduce file sizes and can create files up to 80% smaller than their HTML counterparts.
PDF files can be «linearized» to allow the user to start viewing the document before it is fully downloaded, similar to the process used to deliver streaming video over the internet.
PDF can be interwoven seamlessly into most Web sites. This combination of HTML and PDF formats enables authors to serve content in its most appropriate format based on the demands of content versus technology. Also, on most popular Web servers there is no compression, translation, or filtering penalty for serving PDF files.
PDF Security
PDF has a well-established security feature set. Authors of PDF files can prevent users from editing, printing, and/or copying content (text and graphics). Software developers can create their own software to read, create, or modify PDF files without special permission or licensing. The only condition that Adobe insists on is that the document author’s PDF security settings be respected.
Что такое PDF формат файла и как с ним работать
23 сентября, 2018
Автор: Maksim
Один из самых популярных видов электронных документов, которым пользуются миллионы пользователей по всему миру. PDF это идеальный формат файла для представления полиграфической продукции.
Многие из вас слышали о нем, а некоторые пользуются каждый день, например, читают в ПДФ книги. Если вам интересно более подробно узнать, что это за формат и кем он был создан, то эта статья именно для вас.
Недавно мы изучили, что такое расширение файла, сегодня рассмотрим такое расширение, как «.PDF». Узнаем, каким образом с ним можно работать, как открывать и редактировать.
Что такое PDF формат
PDF (Portable Document Format) — это специальный формат/расширение файла, предназначенный для электронных документов. Был создан американской компанией Adobe Systems в целях оптимизации/организации хранения и представления текстовых и графических данных в виде электронных документов.
На данное время — это универсальный формат, который по умолчанию используют большинство производителей печатного оборудования. Так поддержка этого расширения встроена по умолчанию в их устройства, без надобности устанавливать дополнительно программное обеспечение, чтобы печатать такие документы.
Популярен в первую очередь за свою универсальность, чем бы вы не открыли такой документ — он везде будет отображаться одинаково. Чаще всего в сети в ПДФ вы можете встретить: книги, журналы, руководства и т.д. Текст в этом формате удобно читается, в нём удобно хранить графические файлы, и он не занимает много места на компьютере.
Преимущества PDF
- Универсальное отображение на всех устройствах и в программах. Т.е. где бы и на чем бы вы не открыли такой документ — он будет отображаться везде единообразно.
- Безопасность. Имеется возможность устанавливать различные уровни доступа.
- Компактность. Благодаря встроенной поддержке архивации данных, такие файлы занимают совсем немного пространства.
- Удобство. Довольно легко пользоваться.
Недостатки
- Не во всех программах и не у каждого документа есть возможность редактировать текст и графику. Может попасться простой скан в виде картинки и текст просто не будет с нее копироваться или просто запароленная информация.
Программы для работы с файлами формата PDF
Тем, кто иногда или часто работает с книгами, например, в целях учёбы, самообразования или читает художественную литературу знакомо то, что для работы с ПДФ требуется специальная программа. Вот список самых лучших и проверенных из них.
Foxit Reader
Скачать Foxit Reader
Одна из самых популярных программ такого рода, особенно в России. Абсолютно бесплатна и на русском языке. Занимает немного места на компьютере и довольно быстро загружается даже на старых ПК. Мы рекомендуем именно Фоксит.
Adobe Reader DC
Скачать Adobe Reader DC
Софт от самих создателей данного расширения. Очень популярен и востребован. Также на русском языке и абсолютно бесплатен. Но, в новых версиях занимает значительно больше места на жестком диске, чем в прошлых.
STDU Viewer
Скачать stdu viewer
Еще один очень интересный просмотрщик, который кроме ПДФ поддерживает еще множество других форматов. Абсолютно бесплатный и также на русском языке.
Soda PDF
Скачать Soda PDF
Удобный и простой софт. Понравится любителям почитать литературу в ПДФ, также есть возможность редактирования.
PDF XChange Viewer
Скачать PDF XChange Viewer
Довольно известный софт для чтения и редактирования ПДФ, который поддерживает и другие расширения, например, «.djvu».
В заключение
Вот вы и узнали, что в этом термине нет ничего сложного, все довольно просто. Надеюсь вам была полезна эта информация, заходите к нам почаще, ведь мы и дальше будем продолжать эту тему, будет интересно!
Как открыть файл PDF на компьютере в Windows 10 (7, 8) программами, онлайн
Многие пользователи ПК и ноутбуков не раз сталкивались с файлами формата PDF. Некоторые знают, что это вид документа, однако что это за документ, для чего он используется и что вообще из себя представляет знает далеко не каждый юзер. А уж о том чем открыть PDF и подавно не слышали. Пришло время устранить пробелы в знаниях.
Что за формат PDF и для чего он нужен?
Аббревиатура PDF расшифровывается как Portable Document Format. Что в свою очередь переводится как «портативный формат документа». Слово «портативный» не стоит понимать в буквальном смысле. Здесь оно означает, что даже документы с изображениями в этом формате будут занимать очень мало места. Формат PDF отличается тем, что может содержать в себе различные шрифты, растровую и векторную графику и прочие необходимые атрибуты. Это универсальный формат для хранения документов и отсканированных страниц. Отчасти он чем-то похож на DjVu (читайте: как открыть DjVu на компьютере), но область его применения намного шире.
Открытие файла PDF на компьютере
Хоть эти файлы и являются документами, классические текстовые редакторы (MS Word, WordPad, Блокнот) не в состоянии их открыть. Для осуществления этого действия требуются специальные утилиты. Среди них есть как платные, так и бесплатные. Разницы нет никакой, поскольку все они прекрасно справляются со своей задачей. Отличия только в дополнительном функционале.
- AdobeAcrobatReader. Проприетарный продукт от компании Adobe. Этот мощный инструмент способен открывать и редактировать практически все файлы документов: от DOC и TXT до PDF и DjVu. Однако есть несколько минусов: утилита работает очень медленно, поскольку перегружена совершенно ненужными плагинами и интерфейсами. Второй минус заключается в том, что продукт отнюдь не бесплатный, но есть бесплатная версия, которая вполне подходит для открытия и просмотра документов.
- PDFReader. Небольшая бесплатная утилита, которая умеет работать только с PDF файлами (что ясно видно из ее названия). Программа занимает очень мало места, работает быстро и способна вносить небольшие правки в документ PDF. Интерфейс прост и понятен. Также присутствует русский язык в комплекте. Программа относится к свободному программному обеспечению. Платить за ее использование не нужно.
- FoxitReader. Мощный инструмент, умеющий работать с самыми популярными форматами электронных документов. Программа занимает очень мало места на жестком диске и отличается нетребовательностью к системным ресурсам. Утилита имеет русский язык в комплекте и способна открывать файлы в режиме защищенного просмотра. Программа является свободным продуктом и не требует никаких финансовых транзакций.
- PhantomPDF. Еще одно бесплатное приложение от компании Foxit. От обычного Reader утилита отличается более богатым функционалом и широкими возможностями редактирования документа. Однако утилита обладает теми же особенностями: «легковесна», имеет поддержку русского языка и очень быстро работает. Эта программа также не требует у пользователя оплаты.
- FreePDFEditor. Небольшая свободная утилита для просмотра и редактирования файлов PDF. Умеет работать только с этим форматом и не на что больше не способна. Зато есть русский язык и простой интерфейс. К тому же, платить за использование утилиты не нужно. Она распространяется абсолютно бесплатно.
- PDFescape. Мощный и надежный инструмент для работы с электронными документами. Поддерживает множество форматов, умеет их редактировать, быстро и четко работает, может похвастаться огромным количеством настроек. В этой программе все хорошо. Однако есть и минус. За ее использование придется платить. Без покупки лицензии – никуда.
Открытие PDF с помощью Acrobat Reader
Продукт от Adobe наиболее универсальный (и наиболее сложный в обращении) инструмент для работы с электронными документами. Итак, как открыть PDF с помощью Adobe Acrobat Reader DC? Для начала скачайте и установите ПО с сайта Adobe.
- Открываем программу с помощью ярлыка на рабочем столе Windows 10 (7, 8).
- В главном окне Adobe Acrobat (в самом верху) требуется найти пункт «Файл», щелкнуть по нему и нажать на «Открыть».
- Следующим шагом будет переход в каталог с нужным файлом и его выбор. Для завершения операции потребуется нажать на кнопку «Открыть».
- В главном окне программы появится открытый документ.
Однако это не единственный способ открытия PDF файла с помощью Adobe Acrobat. После установки приложения, оно назначает себя для открытия PDF по умолчанию двойным кликом ЛКМ. Если назначено иное приложение, тогда проделайте такие действия.
- Нужно открыть «Проводник» Windows и перейти в каталог, содержащий файл PDF и щелкнуть по нему правой кнопкой мыши. В выпадающем меню наводим курсор на пункт «Открыть с помощью», затем выбираем открытие другим приложением.
- В следующем окошке отмечаем пункт «Всегда использовать это приложение для открытия .pdf файлов», щелкаем по пункту «Adobe Acrobat» и жмем на «ОК».
Бывает и такое, что файл PDF защищен паролем. В этом случае при его открытии программа попросит ввести нужный пароль. Если вы его не знаете, то открыть его не получится. Обойти эту защиту никак нельзя.
Открытие PDF в браузерах
В настоящее время многие браузеры могут открыть PDF документ без посторонней помощи. Такие популярные продукты, как Mozilla и Chrome делают это легко. Даже стандартный Edge в Windows 10 без проблем справляется с этой задачей.
- MicrosoftEdge. Быстрый и легкий (но не очень удобный) браузер от Microsoft имеет в своем арсенале встроенный плагин для чтения файлов формата PDF. Никаких дополнительных действий не требуется. Просто нужно щелкнуть по файлу и выбрать опцию открытия через этот браузер. Однако Edge не совсем правильно отображает весь контент. Это ведь Microsoft.
- GoogleChrome. В быстром, но прожорливом на оперативную память браузере от Google опция открытия электронных документов тоже встроена по умолчанию. Браузер способен автоматически открывать документ сразу после скачивания. Также можно открыть документ, находящийся на локальном диске. В отличие от Edge Хром отлично справляется с правильным отображением всего контента.
- Яндекс Браузер. Самый известный «вирусный» браузер, который внедряют в каждый второй установщик. Возможно, именно поэтому никто не хочет им пользоваться. Эта программа является точной копией Google Chrome с немного измененным интерфейсом. Поэтому он обладает точно такими же возможностями в плане открытия PDF.
- MozillaFirefox. Этот быстрый, легкий и безопасный браузер также имеет встроенное средство просмотра электронных документов в формате PDF. Достаточно всего лишь скачать файл и Mozilla тут же его откроет. Не нужно для этого предпринимать никаких дополнительных действий. Также есть возможность открытия файлов, расположенных на жестком диске.
- Opera. В последних версиях сего легендарного браузера разработчики и вовсе убрали опцию скачивания документов PDF на компьютер пользователя. Теперь весь контент сразу отображается в браузере. Сие «соломоново решение» пришлось не по нраву пользователям. И после этого новшества началась миграция поклонников Opera на другие продукты.
Для того, чтобы можно было в дальнейшем открывать документы просто двойным кликом нужно назначить свой основной браузер приложением по умолчанию для открытия PDF файлов. Сделать это очень просто.
- Открываем «Проводник» Windows 7, 8, 10 и идем в каталог с нужным файлом. Здесь нужно щелкнуть правой кнопкой мыши по файлу, выбрать пункт «Открыть с помощью» и щелкнуть по надписи «Выбрать другое приложение».
- В следующем окне отмечаем использование приложения по умолчанию, щелкаем по названию браузера и нажимаем «ОК».
Открытие PDF онлайн
Сейчас существует огромное количество онлайн-сервисов, с помощью которых можно открыть файл формата PDF. Например, к таким сервисам относятся:
- pdfonlinereader.com;
- pdf2go.com/ru/edit-pdf;
- smallpdf.com/ru/edit-pdf;
- другие.
Они используются в том случае, если браузер по какой-то причине не может открыть данный тип документа и на компьютере нет никаких программ, способных на это. Итак, как открыть файл PDF онлайн? Рассмотрим пример открытия файла при помощи сервиса pdfonlinereader.com.
- Открываем браузер и в адресной строке вводим адрес сайта. Нажимаем Enter.
- В окне появится сайт с кучей английских букв. Однако требуется нажать только на одну кнопку – «Upload A PDF».
- Далее в привычном уже окне выбираем нужный документ и нажимаем кнопку «Открыть».
- После недолгих раздумий сервер выдаст окно с открытым файлом. Теперь можно конвертировать, редактировать или просто изучать документ.
Что делать, если не открывается PDF?
Иногда бывает так, что ни одно приложение, установленное на ПК не может открыть файл PDF. Причин тому может быть несколько. Нужно разобрать самые распространенные проблемы и найти решение.
- «Битый» файл. Самая распространенная проблема. Вероятно, пользователь скачал поврежденный файл документа. Также такое возможно в том случае, если документ просто не докачался. Решение простое: заново скачать документ. Если же это не помогло, то можно попробовать поискать файл на других источниках.
- «Глюк» программы. Весьма вероятно, что в работе приложения для открытия этих файлов произошел какой-то сбой. Можно попробовать открыть документ другим приложением. Или же переустановить то, которое используется в данный момент. Также может возникнуть ситуация, в которой программа просто не в силах распознать кодировку документа. В этом случае требуется заменить приложение.
- Файл зашифрован. Здесь уже ничего нельзя сделать. Такое часто бывает при шифровании документа с помощью утилиты BitDefender или какой-либо другой. Здесь без знания пароля никак не обойтись.
Итак, теперь понятно, как открыть файл PDF на компьютере. Для этого есть огромное количество программ и онлайн-сервисов. Даже самый обычный браузер в состоянии справиться с этой задачей без установки дополнительных плагинов. А все потому, что этот формат электронных документов самый распространенный.
Посмотрите еще статьи:
Вы можете пропустить чтение записи и оставить комментарий. Размещение ссылок запрещено.
что такое файл pdf и как его открыть
что такое файл pdf
Наверняка вы не раз встречались с таким форматом файлов, как PDF, ведь он очень популярен, и им пользуются миллионы людей по всему миру. Возможно, вы работаете с данным форматом каждый день, либо же иногда читаете с помощью него книги или вовсе стараетесь обходить PDF стороной, так как не знаете, как с ним работать. В любом случае данная статья будет вам полезна и расскажет много интересного о PDF файлах…
Для чего же нужен формат PDF?
Представьте, что вы написали тест в Ворде, красиво его оформили, вставили картинки, рисунки и графики и пошли показать свою работу коллегам. Коллеги берут ваш файл и открывают его с помощью программы, которая отличается от вашей, и вместо красивого аккуратного текста видят непонятное полотно с разъехавшимися в разные стороны шрифтами и картинками.
Такое происходит, потому что разные программы могут совершенно по-разному отображать созданный вами документ. Даже разные версии одной и той же программы могут выдавать подобный результат. И чтобы такого не происходило, был создан формат файлов PDF.
PDF – это формат файлов, который позволяет отображать ваш документ на любом компьютере и в любой программе именно в том виде, в котором вы его создали. Он позволяет сохранить шрифты, картинки и вид исходного документа независимо от того, на какой платформе и в какой программе создавался документ. Этот формат считается общемировым стандартом.
Такой файл можно сравнить с распечатанным на листе бумажным документом: его нельзя ни изменить, ни добавить лишний абзац, ни изменить шрифт или картинки в нем. Для внесения изменений необходимо использовать либо специальное программное обеспечение, либо отредактировать документ в программе, в которой его создали, и заново сохранить файл.
В то же время формат PDF очень функционален: он может содержать не только текст и картинки, но также видео, звуковые файлы и ссылки на сайты. Кроме того, такие файлы очень просты в использовании.
что за формат pdf и какой программой его открыть
Как мы уже говорили выше, формат PDF очень популярен, многие пользователи постоянно передают информацию именно в таком формате, и, вполне вероятно, вас может интересовать вопрос “А как же открыть такой файл?”.
Открыть PDF файл можно несколькими способами:
C помощью любого браузера (Яндекс Браузер, Opera, Google Chrome, Mozilla Firefox).С помощью оригинальной программы Adobe Acrobat Reader.Используя любую программу для чтения PDF файлов, которые мы рассмотрим ниже.
Для того, чтобы это сделать, необходимо следовать следующему алгоритму действий:
Нажмите правой кнопкой мыши на документ, который необходимо открыть, в появившемся списке выберите «Открыть с помощью», далее – «Выбрать программу».Во всплывшем окошке выбираете программу, с помощью которой хотите открыть файл (например браузер).Нажмите «ОК».
Как вы можете увидеть, это достаточно просто.
что такое файл pdf и как с ним работать
Если же вы вдруг столкнулись с необходимостью осуществить определенную работу с PDF файлами, то наши инструкции могут вам помочь.
К работе с пдф форматами можно отнести следующие действия:
Конвертация пдф в другие форматы (JPG, Word, PPT и др.) и наоборот. Сжатие пдф для уменьшения его размера. Редактирование PDF документа. Перевернуть файл. Разделение такого файлика на несколько или объединение нескольких в один.
Для проделывания всех вышеперечисленных действий подойдут следующие программы:
Foxit ReaderAdobe Reader DCSTDU ViewerSoda PDFPDF XChange Viewer
что такое файл pdf и как его создать
Очень часто требуется не только отредактировать уже имеющийся пдф формат, но и создать свой собственный, например, когда вы хотите отправить статью в журнал или распечатать информационные буклеты.
Создать его можно с помощью:
оригинальной программы Adobe Acrobat.Word’а (создаем документ и при сохранении выбираем формат PDF).Любого браузера (функция «Сохранить как PDF).Виртуального принтера (наживаем в меню «Печать» (Ctrl + P) и выбираем в списке принтеров вариант «Сохранить как PDF»).Также многие другие программы позволяют сохранять созданный файл в формате пдф, для этого при сохранении выбирайте нужный вам формат.
что такое файл pdf на айфоне
Актуален такой формат и для пользователей Apple, так как он не имеет никаких аналогов. Независимость пдф формата от платформы, на которой его открывают, справедлива и для iOS. Чтобы открыть пдф на Айфоне, можно воспользоваться приложением iBooks, браузером Safari или же встроенным просмотрщиком Mail.
что такое файл pdf википедия
Согласно Википедии, пдф – это формат электронных документов, который одинаково отображает документы на всех платформах. Для того, чтобы просмотреть пдф, можно воспользоваться официальной программой Adobe Reader. Также существует огромное количество подобных программ от других разработчиков, они могут быть как платными, так и бесплатными.
что такое файл pdf с текстовой подложкой
Наверняка вы не раз замечали в госучреждениях документ-образец, предоставляемый для помощи в заполнении бланков. На нём обычно часто написано слово «Образец», которое сразу дает взявшему в руки лист понять, что это пример, на который можно опираться при заполнении бланка или написания заявления. Это называется подложкой или водяным знаком.
Текстовая подложка (водяной знак) в пдф – это слово или несколько слов, используемое в качестве фона для документа, располагаемое как бы под текстом. Обычно подложка имеет серый полупрозрачный, но в то же время крупный шрифт, чтобы его можно было легко увидеть, и чтобы он не мешал просмотру документа.
Таким образом, этот формат пдф – это очень популярный формат файлов, который используется повсеместно. Он давно стал общемировым стандартом передачи и хранения электронных документов. Конечно, у него есть и свои недостатки, для работы с ним требуется дополнительное программное обеспечение, однако на данный момент этот формат является единственным, который позволяет просматривать его на любом устройстве и в любой программе с сохранением оригинального внешнего вида документа без каких-либо искажений.
Как отредактировать PDF-файл? | KV.by
Определённо, многим пользователям, так или иначе, приходится сталкиваться с файлами в формате PDF. Но как их редактировать? Давайте попробуем найти ответ на этот вопрос вместе.
PDF (Portable Document Format) был разработан фирмой Adobe Systems как формат представления в электронном виде полиграфической продукции, документации, презентаций — при этом, независимый от платформы (т.е. файл, созданный в этом формате, будет отображаться неизменно вне зависимости от операционной системы и программы, в которой его откроют).
В основном, формат PDF используют для распространения, а не для создания документации. И, несмотря на то, что программ для работы с этим типов файлов довольно много, большинство из них предназначены только для чтения PDF. И если с просмотром проблем не возникает, то вопрос о том, как отредактировать PDF-файл, для многих пользователей остаётся без ответа. В этой статье мы расскажем о редактировании PDF-файлов и о том, какие программы можно для этого использовать.
Программы для просмотра, которые использует большинство пользователей, не умеют изменять структуру или текст документа, добавлять или удалять изображения. Но порой возникает необходимость не только прочитать, но и изменить файл.
Итак, с помощью каких программ можно отредактировать PDF-файл? Благо, и такого софта достаточно; на свой вкус и для своих целей можно выбрать подходящую программу. В основном такие программы повторяют определённые возможности Adobe Acrobat Professional.
Adobe Acrobat Professional позволяет и создавать, и редактировать PDF-документы, конвертировать документы Microsoft Word в PDF и наоборот. Также программа позволяет использовать для создания PDF-файлов аудио, а также видеоконтент, совместимый с Adobe Flash Player.
Основными возможностями программы являются:
- Конвертирование и сканирование в формат PDF
- Сканирование и сохранение документов в формате PDF
- Преобразование HTML в PDF
- Преобразование сообщений электронной почты в PDF
- Экспорт PDF-файлов
- Редактирование PDF-файлов
- Комбинирование разных файлов и разного контента
Adobe Acrobat был и остаётся популярен среди людей, работающих с PDF-форматом. Программа удобна в тех случаях, когда надо использовать по максимуму возможности формата, однако в случае, когда в этом нет необходимости, имеет смысл рассмотреть альтернативные варианты, более быстрые и доступные.
В общем-то, большинство редакторов PDF похожи, и мы рассмотрим редактирование PDF-файла на примере одной из наиболее популярных и распространённых программ на сегодняшний день — это PDF XChange Viewer.
PDF XChange Viewer предназначается непосредственно для редактирования PDF-файлов. Эта бесплатная программа поддерживает возможность изменения текста, графики, добавления или удаления отдельных элементов документа. В программе отсутствуют функции шифрования документов, добавление цифровых подписей и т.д.
Каковы основные возможности программы и как ими пользоваться?
Удаление страниц из редактируемого PDF-файла и добавление страниц из другого PDF-файла.
Найти необходимую команду можно в меню «Документ».
Соответственно, для удаления выбираем графу «Удаление страниц», а для вставки — «Вставка страниц». Такие действия производятся аналогично.
Допустим, необходимо вставить несколько страниц из другого документа.
Выбираем соответствующую команду, далее, в открывшемся окне необходимо указать файл, выбрать страницы, которые вы хотите добавить, а так же расположение этих страниц в редактируемом файле.
Работа с текстом.
В документ можно добавлять текст в виде комментариев: сноски, примечания и т.д.
Это можно сделать в меню «Инструменты», выбрав графу «комментарии и пометки», или же с помощью соответствующих кнопок на панели инструментов. Можно задавать цвет, тип, размер шрифта, заключать текст в рамки, выбирать цвет фона надписи. Таким образом, можно отредактировать текст так, чтобы он смотрелся либо как изначальный, либо как самостоятельная пометка.
Кроме пометок, можно зачёркивать, подчёркивать, выделять цветом уже существующий текст (всё через то же меню «Инструменты»).
Помимо этого, в документ можно добавлять различные фигуры, линии, окружности, прямоугольники, многоугольники и т.д. Присутствуют такие инструменты как «Карандаш» и «Ластик».
Также имеется возможность вставлять в документ различные графические файлы и работать с ними.
Какими ещё программами можно воспользоваться для редактирования PDF?
Foxit PDF Editor
Коммерческая программа, которая предоставляет возможность просмотра текста с изменением шрифта и размера имеющихся картинок, умеет экспортировать PDF в текстовые файлы, HTML, Microsoft Office или в графические форматы. Также с помощью этой программы можно добавлять в документ свой текст, картинки и штампы. Есть поддержка распознавания отсканированного текста (OCR) и шифрования документов.
Infix PDF Editor
Довольно быстрая, простая и удобная программа (в обращении похожая на обычный текстовый редактор), с помощью которой можно также изменять содержание текста, его шрифт, размер и т.д. Программа имеет достаточно большие возможности работы с текстом, комментариями, закладками, колонтитулами, слоями и изображениями.
Удобно то, что программа не требует инсталляции и может запускаться и с переносных носителей.
Cool PDF Reader
Cool PDF Reader — небольшая бесплатная программка, которая умеет конвертировать PDF-файлы в BMP, JPG, GIF, PNG, WMF, EMF и EPS-форматы, извлекать текст из документов в формат TXT, а также показывать PDF в режиме слайд-шоу.
Помимо вышеприведённых программ, существуют различные веб-приложения для работы с PDF-файлами, что удобно для людей, которые не работают с этим форматом постоянно.
PDFescape
PDFescape — это полноценный онлайн-редактор PDF-документов. Его возможности позволяют добавлять в файл новые страницы, делить документы на несколько файлов, вставлять комментарии, аннотации, изображения и т.д. В общем, если под рукой нет подходящей программы, а надо срочно подправить документ, то вам — сюда.
ILovePDF
Этот ресурс подойдёт вам, если нужно быстро разделить один документ на несколько, или же наоборот — собрать несколько воедино.
PDF-to-Word Converter
Название говорит само за себя. PDF-to-Word Converter не является полноценным редактором. Этот сайт фирма Nitro PDF Software запустила для рекламы своего платного конвертера. Принцип работы сервиса такой: вам нужно загрузить свой PDF-файл и указать e-mail, куда вам через несколько минут вышлют готовый документ в формате DOC.
PDF to Flash Page Flip
И напоследок — довольно забавный сервис, который поможет вам легко создать из PDF-файла (а потом и скачать) виртуальную книгу, страницы которой будут переворачиваться.
Для этого на сайт нужно всего лишь загрузить свой файл, из которого сервис сгенерирует книгу, и задать подходящие опции.
Итак, вопреки мифу о том, что в PDF-файл сложно внести изменения, мы показали, что отредактировать его можно достаточно просто, даже не имея особых навыков.
Приведённый выше перечень программ и сервисов для работы с PDF-документами далеко не полный, и продолжать его можно очень долго. PDF-редакторы очень разнообразны, от продвинутых, возможности которых удовлетворят профессионалов, до элементарных, позволяющих легко выполнять простейшие манипуляции, и не требующих особой подготовки.
Absinthium
Что такое формат файла PDF? Получите обзор формата файла PDF
PDF — это аббревиатура от Portable Document Format . Это многоплатформенный поддерживаемый формат файлов, разработанный и принадлежащий Adobe Systems (инициированный соучредителем Джоном Варноком в рамках проекта Camelot). Особенность формата файла PDF заключается в том, что его можно использовать для чтения документов независимо от основных вычислительных ресурсов, таких как используемое оборудование, работающее прикладное программное обеспечение, а также используемая операционная система.PDF-файл способен объединить текст, шрифт и графику в одном документе.
Файл PDF относится к категории формата документа .
PDF-файл
не зависит от оборудования, программного обеспечения или операционной системы, в которой он просматривается. Базовое программное обеспечение, необходимое для просмотра файлов PDF, — это Adobe Acrobat Reader.
Примечание. Adobe Systems являются патентами PDF, но структура лицензии не требует лицензионных отчислений.Проще говоря, любой человек или организация могут создавать приложения, которые можно использовать для разработки или чтения файлов PDF, не платя никакого капитала Adobe Systems.
Файл PDF изначально принадлежит и разработан Adobe Systems .
- заявка / pdf
- заявка / x-pdf
- приложение / acrobat
- заявок / вн.pdf
- текст / pdf
- текст / x-pdf
PDF-файлов используют цифровых подписей для аутентификации.
Структура файлов PDF основана на формате COS и модели обработки изображений PostScript.
COS
COS — это аббревиатура от «Карусель» Структура объекта .Формат файла COS имеет древовидную структуру, состоящую из восьми специфических типов объектов: —
- Логические значения: — истина или ложь
- Номера
- Струны
- Имена
- Массивы (линейная структура данных)
- Словари (индексированная библиотека имён)
- Streams (огромные хранилища данных)
- Нулевой объект (пустой)
На основе данной модели COS; Файлы PDF можно разделить на две категории: —
Модель изображения
— PostScript
Модель изображения, используемая в формате PDF; в значительной степени напоминает PostScript .В графике PDF используется декартова система координат, не зависящая от устройства, которая определяет поверхность страницы.
PDF-файл можно открыть с помощью бесплатного программного обеспечения, такого как Adobe PDF Viewer.
Какие существуют версии PDF / A?
Организации предпочитают PDF / A из-за его признания в отрасли и преимуществ перед другими форматами архивирования с точки зрения его способности сохранять текст, векторную графику, растровые изображения и связанные метаданные.Тем не менее, с различными стандартами PDF / A и уровнями соответствия (а в настоящее время — с восемью возможными комбинациями) легко заблудиться.
Если вы хотите освежить в памяти свою таксономию PDF / A, читайте дальше. В этой статье мы рассмотрим различные стандарты PDF / A и уровни соответствия, а также их значение.
Какие существуют версии PDF / A и уровни соответствия?
PDF / A поставляется во многих различных возможных вариантах, созданных путем смешивания различных стандартов PDF / A и уровней соответствия.Каждый стандарт PDF / A определяет набор доступных функций и технологий сжатия изображений, которые помогают сохранить содержимое файла. В свою очередь, каждый стандарт PDF / A поддерживает различные уровни соответствия (a и b для PDF / A-1; и a, b и u для PDF / A-2 и -3). Эти уровни соответствия контролируют требования «доступности» к файлу, которые влияют на способность машин и людей понимать контент.
Подробно: различные стандарты PDF / A
PDF / A-1: (ISO 19005-1: 2005)
PDF / A-1 — исходный стандарт PDF / A, наиболее часто используемый сегодня, и самый строгий.Поскольку он основан на более старом стандарте PDF, PDF 1.4, опубликованном Adobe Systems в 2001 году, PDF / A-1 не поддерживает JPEG 2000, слои или вложения. Кроме того, несмотря на поддержку в PDF 1.4, прозрачность считалась «слишком новой» во время создания PDF / A-1 и поэтому не включалась.
Отсутствующие функции: JPEG2000, прозрачность, слои и вложения
Уровни соответствия: a & b
На основе PDF 1.4
PDF / A-2: (ISO 19005-2: 2011)
На основе в PDF 1.7 (ISO 32000-1: 2008) PDF / A-2 представляет несколько функций, недоступных в PDF 1.4, а также прозрачность. Дополнения включают слои, улучшенное сжатие изображений (JPEG 2000 и JBIG2) и вложения — при условии, что эти вложения находятся в формате PDF / A.
PDF / A-2 не делает файлы PDF / A-1 устаревшими. Скорее, стандарт предназначен для обеспечения прямой совместимости: например, действительный файл PDF / A-1b должен пройти проверку в программном обеспечении, установленном для проверки для PDF / A-2b или PDF / A-3b.
Наконец, уровень соответствия u (как в Unicode ) также был введен с PDF / A-2.Уровень u позволяет организациям гарантировать, что текст документа может быть надежно найден и скопирован — при этом файл не должен соответствовать другим требованиям уровня a.
Новые и разрешенные функции: JPEG 2000, прозрачность, слои и вложения (только другие файлы PDF / A)
Уровни соответствия: a, b & u
На основе PDF 1.7 (ISO 32000-1: 2008 )
PDF / A-3 (ISO 19005-3: 2012)
PDF / A-3 практически идентичен PDF / A-2.(Они даже оставили нетронутыми опечатки.) Единственное отличие состоит в том, что PDF / A-3 допускает любой тип файла в качестве вложения.
Однако от программы просмотра PDF / A не требуется дополнительных действий с этими прикрепленными файлами, кроме обеспечения их правильного извлечения. Следовательно, стандарт не может гарантировать, сможете ли вы читать или иным образом использовать эти файлы в будущем. побуждает архивистов озвучивать опасения, что PDF / A-3 может позволить обойти архивные ограничения на разрешенные форматы.
В ответ на вышеуказанное беспокойство было отмечено, что тщательно разработанный рабочий процесс, построенный с учетом архивных соображений, может учитывать и использовать возможности PDF / A-3. Действительно, PDF / A-3 во многом был вдохновлен желанием иметь доступный машиночитаемый компонент, такой как проприетарные двоичные данные или XML, используемый в ситуациях, когда можно было бы тщательно прописать встроенные форматы. Примером этого является гибридный стандарт электронного выставления счетов ZUGFeRD, опубликованный через два года после внедрения PDF / A-3, одобренный правительством Германии и одобренный многими организациями и предприятиями Европейского Союза.
Новые и разрешенные функции: Вложения (файлы любого типа)
Уровни соответствия: a, b & u
На основе PDF 1.7 (ISO 32000-1: 2008)
PDF / A-4 (ISO 19005-4: 2019)
Иногда называемый PDF / A-NEXT, PDF / A-4 является следующей версией стандарта PDF / A, опубликованного в ноябре 2020 года как ISO 19005-4: 2020. A-4 обновляет PDF / A в соответствии с PDF 2.0, последней версией стандарта PDF ISO.
Важно отметить, что отдельные уровни соответствия a, b и u не используются в PDF / A-4.Вместо этого PDF / A-4 поощряет, но не требует добавления логических структур более высокого уровня, и требует отображения Unicode для всех шрифтов.
Кроме того, PDF / A-4 вводит два новых уровня соответствия, e и f. PDF / A-4f позволяет встраивать типы файлов любого другого формата, тогда как PDF / A-4e представляет поддержку RichMedia и аннотаций 3D-типов, а также встроенных файлов для создания версии PDF / A, совместимой с современными геопространственными, строительными и инженерные процессы. (‘E’ означает инженерию, как и в ранее созданном стандарте PDF / E.)
Новые функции: PDF 2.0 Совместимость
Уровни соответствия: e & f
На основе PDF 2.0 (ISO 32000-2: 2017)
Различные уровни соответствия PDF / A
Уровень b (базовый)
PDF / A-1b, PDF / A-2b, PDF / A- 3b
Соответствие уровня B требует только того, чтобы документы соответствовали рекомендациям по надежному просмотру, и, следовательно, это самый простой уровень для достижения.
Из спецификации ISO:
Уровень соответствия B Уровень соответствия
, охватывающий требования данной части ISO 19005 в отношении внешнего вида электронных документов, но не их структурные или семантические свойства, а также требование, чтобы весь текст имел эквиваленты Unicode .
Уровень a (доступный)
PDF / A-1a, PDF / A-2a, PDF / A-3a
«Доступное» соответствие — это надмножество соответствия b-уровня. Он добавляет требования к информации, предназначенной для сохранения логической структуры документа, семантического содержания и естественного порядка чтения.
Другими словами, соответствие на уровне a не только гарантирует, что документы будут выглядеть так же в будущем; он также помогает машинам и людям лучше понимать и перенаправлять его содержание.Допустимый PDF / A-документ высокого уровня будет иметь текст, который можно надежно искать и копировать, а также контент, более доступный для таких технологий, как программы чтения с экрана для слепых.
Список требований A-уровня выглядит следующим образом:
- Содержимое должно быть с тегами с иерархической структурой дерева , то есть такие элементы, как порядок чтения, рисунки и таблицы, явно идентифицируются через метаданные.
- Необходимо указать естественный язык документа.
- Изображения и символы должны иметь альтернативный описательный текст.
- Файл должен включать сопоставление символов с Unicode для надежного поиска и копирования.
Примечание: ни одно из этих требований не изменит внешний вид документа.
Уровень u (Unicode)
PDF / A-2u, PDF / A-3u
Как и «уровень a», соответствие u-уровню требует сопоставления символов с Unicode . Однако он снижает требования к уровню, включая встроенную логическую структуру (т.е., теги и структурное дерево), как указано в разделе 6.7 ISO 19005-2 (PDF 1.7). Следовательно, соответствие PDF / A уровню u будет иметь текст, который можно будет надежно найти и скопировать, но порядок чтения не будет гарантирован.
Подробнее о решениях PDF / A и PDFTron для PDF / A
Таким образом, знание параметров PDF / A поможет вам повысить ценность ваших документов для конкретных целей просмотра, совместного использования, печати или архивирования. Если вам нужна дополнительная информация в формате PDF / A, ознакомьтесь с нашей страницей, посвященной PDF / A.
Если вы заинтересованы в преобразовании в конкретный вариант PDF / A, попробуйте бесплатный онлайн-инструмент PDF / A конвертера PDFTron, способный преобразовать более 20 форматов файлов в любую версию PDF / A; или прочтите нашу статью о том, как преобразовать в PDF / A с помощью PDF SDK PDFTron или инструмента командной строки.
Если у вас есть какие-либо вопросы о PDF SDK PDFTron, свяжитесь с нами!
Описание | PDF / A — это семейство стандартов ISO для ограниченных форм PDF (см. PDF_family), предназначенных для длительного хранения страничных документов, для которых PDF уже используется на практике.Стандарты PDF / A разрабатываются и поддерживаются рабочей группой в составе представителей правительства, промышленности и научных кругов при активной поддержке со стороны Adobe Systems Incorporated. Рабочая группа — это РГ 5 Технического комитета ISO / TC 171, Приложения для управления документами, Подкомитет SC 2, Вопросы приложений [ISO TC171 / SC2 / WG5]. Эта группа работает в сотрудничестве с: ISO / TC130, Графические технологии; ISO / TC42, Фотография; и ISO / TC46 / SC11, Информация и документация, Архивы / записи PDF / A-1, первый стандарт PDF / A [ISO 19005-1: 2005], был основан на PDF версии 1.4 (см. PDF-1-4) и опубликован в 2005 году. PDF / A-2, как определено в ISO 19005-2: 2011, расширяет возможности PDF / A-1 и основан на PDF версии 1.7 (как определено в ISO 32000-1, см. PDF-1-7). Одна из новых возможностей заключалась в том, чтобы разрешить встраивание вложений, совместимых с PDF / A. В PDF / A-3 к своему предшественнику (PDF / A-2) добавлена одна очень важная функция, позволяющая встраивать файл или файлы в любом формате.Многие сторонники высказывают намерение, чтобы встроенные файлы не считались частью полезной нагрузки архивов. Однако появляются случаи использования, когда встроенные файлы, вероятно, потребуют сохранения в архивных учреждениях. Основное различие между PDF / A-1 и PDF / A-2 состоит в том, что они основаны на разных хронологических версиях PDF. Новая версия PDF / A на основе PDF 2.0 находится в стадии разработки как PDF / A-4. Планы были описаны в презентации 2017 года «Будущее PDF / A и валидации», в которой используется название PDF / A-Next. Основной целью формата PDF / A является представление электронных документов способом, который сохраняет их статический внешний вид с течением времени, независимо от инструментов и систем, используемых для создания, хранения или визуализации файлов. С этой целью PDF / A пытается максимизировать независимость устройства, автономность и самодокументирование. Ограничения для PDF / A-1, PDF / A-2 и PDF / A-3 включают:
Первые три стандарта PDF / A определяют аналогичные уровни соответствия.В стандартах ISO 19005-1, 19005-2 или 19005-3 (для PDF / A-1, PDF / A-2 и PDF / A-3, соответственно) уровень соответствия A удовлетворяет всем требованиям стандарта; уровень B и уровень U являются более низкими уровнями соответствия, по-прежнему удовлетворяющими требованиям в отношении внешнего вида электронных документов, но менее требовательными в отношении представления структурных или семантических свойств. Например, уровень соответствия B — это уровень, обычно используемый для файлов PDF / A, созданных из отсканированных страниц. Хотя эта терминология не используется в стандартах ISO, Ассоциация PDF в своем документе 2013 года PDF / A in a Nutshell 2.0 ввел термины Accessible , Basic и Unicode для описания трех уровней соответствия. Однако файл PDF / A, соответствующий уровню A, не обязательно соответствует стандарту PDF Enhancement for Accessibility (PDF / UA, ISO 14289-1: 2014). PDF / A-4 основан на PDF 2.0 и существенно отличается от своих предшественников в нескольких других отношениях. Он отбрасывает три уровня соответствия (A, B, U) и вводит два функциональных профиля, расширяющих основную спецификацию PDF / A-4.Приложение A определяет PDF / A-4f , профиль, который позволяет встраивать файлы в любом другом формате и действует как преемник стандарта PDF / A-3. Приложение B определяет PDF / A-4e , предназначенный для технической документации и действующий как преемник стандарта PDF / E-1. PDF / A-4e поддерживает Rich Media и 3D-аннотации, а также встроенные файлы. PDF / A-4 также снимает одно из перечисленных выше ограничений. Javascript теперь можно сохранить в файле, например, для хранения информации о значениях интерактивной формы или |
---|
|
Понимание формата файла PDF
Леон Атертон Леон — разработчик в IDRsolutions и менеджер по продукту для BuildVu. Помимо того, что он тратит много времени на написание кода, он наблюдает за стратегией и планом развития продукта BuildVu.
4 мин чтения
Формат файла PDF — это очень сложная структура документа, над которой мы работали более 20 лет. В этом руководстве мы собрали целую серию статей, охватывающих все аспекты формата PDF, включая ошибки, подводные камни и даже то, как вручную создать свой собственный файл PDF.
Общий:
Общие вопросы о файлах PDF и их формате.
Что нужно знать новым разработчикам PDF
Знакомство с PDF
Текст, формы и изображения
OCR (оптическое распознавание символов) Файлы PDF
Закладки и ссылки
Что такое PDF Pagesize? CropBox, MediaBox, ArtBox, BleedBox, TrimBox?
Информация о формате и стиле PDF
Краткое руководство для разработчиков PDF для Java (и не Java)
Почему написание парсера PDF — такая сложная задача (Часть 234)
Поиск файлов PDF
Как работают стеки в файлах PDF
Как файлы PDF обеспечивают безграничную точность позиционирования форм и изображений?
Почему даже Acrobat Reader не может поддерживать 100% спецификацию PDF
Выбор разумной оптимизации для файлов PDF
Файлы PDF повреждены? Может быть, это ваша проблема
Как сравнить 2 файла PDF
Определение размера страницы PDF в дюймах или сантиметрах
Спецификация файла PDF более одного
Не вините формат файла PDF
Будьте осторожны при удалении важных данных из Файл PDF
Узнайте, что на самом деле находится в ваших файлах PDF
3 причины важности команд PDF.
Полная книга PDF от ведущего эксперта по PDF
Сам файл PDF:
В этом разделе рассматривается фактический файл, отформатированный для хранения файла PDF — то, что вы видите, когда открываете PDF в текстовом редакторе.
Просмотр объектов PDF
Потоки объектов PDF
Несколько трейлеров в файлах PDF
Пояснения к таблицам внешних ссылок PDF
Текстовые потоки
decodeArray
Как хранятся изображения?
Словарь PDF
Именованные места
Линеаризованные файлы PDF
Форма XObjects
2 Проблемы с поврежденными потоками данных PDF
Как можно испортить файл PDF?
Идентификация файла PDF по его первой строке
В последних 1024 байтах не обнаружено Startxref?
Встраивание собственных данных в файлы PDF
Интригующий PDF-файл xref Выпуск
Странный PDF-файл недели
Изображения в PDF:
Изображения могут быть сохранены в файлах PDF несколькими способами
Изображения — Обзор
3 Примеры необычных способов для использования масок изображений PDF
3 типа масок изображений
DPI изображения в формате PDF
Объяснение преимуществ сжатия JBIG2 в PDF-файлах
В вашем PDF-файле есть несколько версий каждого изображения
Вам нужно изображение такого размера в PDF-файле?
Маленькие изображения могут вызвать большие проблемы в файлах PDF
Предложение команде разработчиков Prawn по созданию файлов PDF меньшего размера
Обеспечение уникальности имен изображений в файлах PDF
Большие изображения в файле PDF
Извлечение изображений Raw JPEG из файла PDF
Объекты Filter и DecodeParms для изображения PDF
Обработка цвета в PDF:
Поддержка цвета в файлах PDF очень эффективна и сложна.
Цвет — Обзор
Глубина цвета изображения PDF
Проиндексированные цветовые пространства
Белый цвет в файлах PDF
Цветовые пространства на основе ICC
Преобразование цвета YCCK в файлах PDF
CMYK не всегда означает CMYK
Точная настройка цвета изображения PDF с профилями ICC
Преобразование PDF в оттенки серого или черно-белый
Текст в PDF:
Как текст сохраняется, отображается и извлекается из файла PDF
Текст PDF — обзор
ActualText
Координаты текста PDF
Возврат каретки, пробелы и другие пробелы
PDF Mystery — Какое правильное значение для текстового поля
Извлечение текста PDF с помощью Java
Простой способ определить, содержит ли файл PDF структурированное содержимое
Почему я не могу извлечь текст из этого файла PDF, созданного GhostScript?
Почему я не могу извлечь текст из этого файла PDF?
Извлечение текстовых ссылок из файла PDF
Извлечение структурированного текста из файлов PDF
Пространство — это специальный символ
Пространство текста в файлах PDF
Пространство: последний рубеж… в PDF
Шрифты в PDF:
В файлах PDF
можно использовать три различных технологии шрифтов для отображения
Шрифты PDF — обзор
Введение в технологии шрифтов PDF
Встроенные таблицы CMAP
Что такое шрифты CID?
Пользовательские кодировки шрифтов
Действительно ли в файлах PDF есть 3 типа шрифтов? Информация о стандартном шрифте
Имена глифов — Что содержится в имени?
TrueType Font Hinting
Почему TrueType Hinting имеет значение истечение срока действия патента
Будьте осторожны со своими PDF-шрифтами
Ваши таблицы TrueType CMap обманывают вас?
Тайна файла PDF и отсутствующий символ евро
Проблемы, вызванные шрифтами Arial в файлах PDF
Различия в таблицах различий PDF
Подсказки TrueType — большие экраны для мелких деталей
Почему шрифты CID намного сложнее, чем шрифты не-CID?
Встроенные шрифты TrueType PDF всегда имеют кодировку MAC, если только они не являются
PDF с нечетными шрифтами Type3 в Ghostscript 8.50
Формы PDF, аннотации и интерактивные элементы:
Файлы PDF могут содержать интерактивные элементы
Введение в формы PDF
Введение в формы FDF
Введение в формы XFA
Интерактивные элементы
Слои в файлах PDF
Извлечение данных плоских форм из PDF Файл
Загадка имен PDF-форм
Что такое выравнивание PDF-форм?
Что такое текстовые поля PDF только для чтения?
Не все формы являются PDF-формами
Безопасность PDF:
Файлы PDF имеют собственные системы и процессы безопасности
Безопасность PDF (пароли и сертификаты)
Краткий обзор функций безопасности, предлагаемых форматом файлов PDF
Защита паролем PDF
Защита PDF Content
Зачем мне нужен пароль PDF, чтобы открыть файл PDF?
Создание собственных тестовых сертификатов и ключей для подписи файлов PDF
Вопросы и ответы:
Вопросы, которые нам часто задают разработчики
Зачем использовать формат файла PDF?
Насколько велика страница PDF в байтах?
Почему я не могу просто открыть и отредактировать файл PDF?
Как узнать используемую версию PDF?
Как штрих-коды отображаются в файле PDF?
Нужно ли мне загружать весь PDF-файл, если я просматриваю его через Интернет?
Почему мой PDF Producer отображается на китайском языке?
Что произойдет, если CropBox меньше MediaBox?
Если в Acrobat не работают битые файлы PDF?
С чего начинаются ваши PDF-объекты в PDF-файле?
PDF Ошибки, которые мы исследовали:
Здесь мы описываем некоторые из наиболее интересных ошибок, которые мы исследовали, в файлах PDF.
Экстремальный случай рекурсии
Использование SMask и изображения «в обратном направлении» вокруг
Нулевых байтов в строке
X Помечает место (или нет)
Цветовое пространство ICC Alt Setting
Моделирование SMask с помощью векторной графики
Смешанный объект шрифта
PDF Text — это действительно крошечное изображение с большим SMask
Tiny Dash Values и Java JVM
Values out of range
Missing Image Data
Missing Image Data 2
Работа с 3 типами шрифтов
Включение бессмысленных шрифтов
Проблема с нечетным отображением текста в Acrobat на Mac
Phantom PDF Objects
CCITT Кодирование в PDF:
CCITT используется для хранения сжатых данных внутри файлов PDF.
Кодирование CCITT в PDF — Преобразование данных CCITT в изображение TIFF
Кодирование CCITT в PDF — Черно-белые факты
Кодирование CCITT в PDF — Строки и высота Gotcha
Кодирование CCITT в PDF — Декодирование данных CCITT
Кодирование CCITT в PDF — G31D Обзор данных CCITT
Кодирование CCITT в PDF — Декодирование данных G31D CCITT
Создайте свой собственный файл PDF вручную с помощью нашего примера кодирования «Hello World»
Один из наших разработчиков смело решил написать учебное пособие для файлов PDF «Hello World», создание PDF-файла с нуля вручную в текстовом редакторе.Следуйте за серией:
Часть 1: Объекты PDF и типы данных
Часть 2: Структура файла PDF
Часть 2.5: Создание неработающего PDF
Часть 3: Пустая страница своими руками
Часть 4: Hello World Pdf
Часть 5: Объекты пути
Часть 6: Состояние графики
Вы разработчик, работающий с файлами PDF?
Наше руководство для разработчиков содержит большое количество технических сообщений, которые помогут вам понять формат файла PDF.
Узнайте больше о нашем программном обеспечении для разработчиков
Что в PDF? Проблемы популярного формата переносимых документов | Американский фонд для слепых
Примечание редактора: AccessWorld Solutions, консалтинговое подразделение Американского фонда слепых, работает с Adobe с августа 2003 года, помогая им улучшить и улучшить доступность и удобство использования некоторых продуктов Adobe для людей с ограниченными возможностями. включая продукты Adobe Acrobat и Reader 6.0 и 7.0 версии. Джамал Мазруи не связан с AccessWorld Solutions или Американским фондом помощи слепым.
Portable Document Format (PDF) — это формат электронных файлов, разработанный Adobe Systems из Сан-Хосе, Калифорния. PDF стал одним из самых популярных форматов файлов для публикации документов в Интернете и, таким образом, является обычным средством распространения знаний. В этой статье определяются особенности популярности PDF, анализируется их влияние на доступность и обсуждается использование программы Adobe Reader с программами чтения с экрана, такими как JAWS или Window-Eyes.
Популярные функции
Adobe публикует официальную спецификацию PDF, которая с годами эволюционировала до версии 1.6. По сравнению с другими форматами, которые могут использоваться для хранения и распространения документов в электронном виде, такими как HTML или Microsoft Word, PDF отличается как минимум четырьмя характеристиками: визуальная точность, компактность хранения, настройки безопасности и кроссплатформенная переносимость.
Визуальная точность
Подготовив документ в формате PDF, можно быть достаточно уверенным в том, что читателю будет представлен точный визуальный вид, который должен быть представлен, включая макет, шрифты, цвета и изображения.Это верно независимо от того, отображается ли результат на экране компьютера или распечатывается в виде бумажной копии. Поскольку файл PDF внутренне разделен на страницы вывода, каждая страница работы автора будет иметь вид и ощущение, которое он или она хочет передать. Эта визуальная точность является причиной того, что PDF широко используется для распространения публикаций в электронной форме.
Компактное хранилище
Документ в формате HTML обычно делится на несколько файлов, которые представлены в виде отдельных страниц на веб-сайте.Более того, изображения далее разделяются как графические файлы, которые связаны с текстовыми страницами. Таким образом, распространение документа в формате HTML обычно включает в себя сбор различных файлов в источнике и их размещение в соответствующем порядке в месте назначения, чтобы документ был согласован.
Если документ подготовлен в формате PDF, с другой стороны, весь текст и графика связаны в один файл. Кроме того, этот файл сжат: используются методы более компактного хранения повторяющихся последовательностей данных, что позволяет уменьшить общий размер.Программа для просмотра файла PDF автоматически распаковывает данные, поскольку представляет их содержимое в удобочитаемой форме. Такое компактное хранилище означает, что веб-сайт может хранить публикации в одном файле, соответствующем каждому документу, пользователь может загружать их быстрее, а отправка и получение упрощаются.
Настройки безопасности
PDF содержит дополнительные настройки, которые автор может включить, чтобы ограничить использование файла PDF. Без таких ограничений программа Adobe Reader позволяет пользователю просматривать файл PDF на экране, распечатывать его, копировать в буфер обмена и сохранять на диск в текстовом формате.Однако с настройками безопасности любое использование, кроме просмотра на экране, может быть полностью или ограничено каким-либо образом. Например, только часть может быть скопирована в буфер обмена или только диапазон страниц может быть напечатан один раз в неделю. Более строгие настройки могут помешать просмотру PDF-файла на любом компьютере, не содержащем лицензионного ключа для конкретного PDF-файла. Механизм аналогичен тем, которые иногда используются для предотвращения несанкционированного копирования программного обеспечения на другие компьютеры. Эти настройки безопасности означают, что авторы могут ограничивать, кто и как использует их документы.
Межплатформенная переносимость
Неотъемлемой частью поддержки PDF является бесплатное программное обеспечение, которое Adobe также разрабатывает для просмотра файлов PDF на нескольких различных компьютерных платформах или операционных системах, включая Microsoft Windows, Apple Macintosh, UNIX и карманные персональные цифровые помощники. Программа Adobe Reader гарантирует, что файл PDF можно просматривать с одинаковой визуальной точностью практически на любом типе компьютера. Поскольку эти программы можно получить бесплатно, стоимость программного обеспечения Adobe Reader не является препятствием для просмотра документа, доступного в формате PDF.Эта кроссплатформенная переносимость означает, что авторы могут широко распространять свои работы.
Проблемы доступности
Популярность PDF как средства распространения публикаций приносит определенную пользу слепым или слабовидящим людям. В общем, электронные публикации предлагают больше возможностей для доступного, независимого чтения, чем печатные публикации, поскольку компьютерные программы могут создавать выходные данные гибкими и альтернативными способами, включая синтетическую речь, шрифт Брайля и увеличенный текст.Это означает, что зрячий помощник-посредник не нужен, что обеспечивает удобство и конфиденциальность. Ранее обсуждавшиеся преимущества PDF помогают увеличить количество материалов для чтения, публикуемых в электронной форме. Кроме того, слабовидящий получает прямую выгоду, как и другие, от определенных функций PDF, таких как компактное хранилище.
Тем не менее, некоторые функции PDF, которые предоставляют преимущества общего характера, имели непреднамеренные неблагоприятные побочные эффекты для невизуальных читателей.Чтобы понять, почему, в этом разделе объясняются некоторые внутренние технические аспекты работы PDF. Спецификация для текущей версии 1.6 занимает более 1200 страниц. Чтобы не выходить за рамки этой статьи, обсуждение обязательно упростит техническое объяснение формата, сосредоточив внимание на концепциях, наиболее важных для доступности.
Язык PostScript
PDF основан на специализированном языке программирования PostScript, разработанном Adobe в 1980-х годах. Возможности PostScript отчасти объясняются его гибкостью в отношении порядка, в котором части вывода размещаются на странице.Порядок не обязательно должен быть слева направо и сверху вниз. Принтер с поддержкой PostScript выдает страницу за раз. Каждая страница вывода передается пакетом после завершения всех операций рисования с ней. Наблюдатель визуальной страницы может догадываться, но на самом деле не знает, в каком порядке был нарисован вывод.
Три компонента вывода
Выходные данные можно разделить на три компонента: текстовые символы, векторную графику и фотографические изображения.Как будет объяснено ниже, то, как эти разные объекты используются и комбинируются, влияет на доступность.
Текстовые символы
Текстовые символы основаны на таблице шрифтов: наборе ассоциаций между видимой формой символа и его числовым значением в системе, называемой Unicode. Исторически популярный код под названием ASCII (Американский стандартный код для обмена информацией) определяет около 250 возможных символов, которых обычно достаточно для выражения английского и других европейских языков.Для сравнения, Unicode определяет десятки тысяч символов для поддержки множества письменных языков мира, а также многих специализированных символов, используемых в определенных предметных областях. Программа PostScript рисует строку символов на странице, используя значение Unicode для каждого символа и просматривая связанную с ним форму в таблице шрифтов.
Векторная графика
Помимо текстовых символов, на основе математических вычислений на странице могут быть нарисованы многие другие формы.Такие формы, называемые векторной графикой, могут быть прямыми или изогнутыми линиями, геометрическими фигурами, такими как круги или квадраты, или заполненными областями в соответствии с узором. Фактически, PostScript может рисовать векторную графику для создания изображения практически всего на странице.
Фотографии
Третьим компонентом вывода является фотографическое изображение, которое можно представить как массив цветных точек, создающих буквальное изображение. PostScript не знает внутренней структуры изображения, поэтому по сути копирует, а не генерирует его в определенное место на странице.Такие изображения обычно определяются в формате, называемом TIFF (формат файла изображения тега).
Тип файла PDF
Adobe построила PDF как тип файла на основе PostScript как языка печати. PDF — это способ, с помощью которого документы можно просматривать на экране и обмениваться ими между пользователями, а не просто печатать на бумаге. PDF использует ту же «модель изображения», что и PostScript, для описания внешнего вида страницы. Файл PDF содержит сокращенный набор инструкций PostScript: в основном, последовательность операций рисования без других программных конструкций, таких как условия и циклы.
Следовательно, документ PDF — это файл, содержащий инструкции PostScript и используемые ими данные. Команды и данные подчиняются определенным правилам, которые Adobe определила как спецификацию для формата переносимых документов. В отличие от формата файла, внутренняя структура которого известна только разработчикам, спецификация PDF является опубликованной и открытой, а не частной и частной. Он защищен авторским правом и контролируется Adobe, но любой может свободно использовать его для разработки программного обеспечения, которое создает или просматривает файлы PDF в рамках общих условий лицензирования.Adobe также выпускает бесплатную программу просмотра и печати для множества различных устройств, чтобы все понимали PDF одинаково. Поэтому Adobe создала комбинацию формата файла и программного интерпретатора, которая позволяет авторам публиковать документы с определенным внешним видом для потенциальных читателей в самых разных средах.
Три типа файлов PDF
PDF-файлы можно разделить на три типа: только изображения, изображения с возможностью поиска и форматированный текст и графика.Эти типы различаются использованием только что описанных компонентов — текстовых символов, векторной графики и фотографических изображений.
PDF только для изображений
PDF-файл, содержащий только изображения, содержит фотографическое изображение, представляющее каждую страницу, и практически не содержит текстовых символов или векторной графики. Хотя текст может появляться на странице, на самом деле текст является поверхностным изображением без нижележащих символов. Для перевода в речь или шрифт Брайля необходимы отдельные символы, поэтому PDF-файл, содержащий только изображения, недоступен.
Файлы PDF только с изображениями обычно создаются путем сканирования бумажных документов на компьютер с подключенным сканирующим оборудованием. По сути, система делает снимок каждой напечатанной страницы, а затем упаковывает страницы в файл PDF. Можно использовать программное обеспечение оптического распознавания символов (OCR) для создания текстовых символов в файле PDF, но часто этого не делается, потому что процесс занимает гораздо больше времени: минуты для OCR по сравнению с секундами для фотографических снимков. Еще одна причина, по которой следует избегать OCR, заключается в том, что полученный текст обычно содержит ошибки распознавания, которые требуют ручной корректуры и исправления для обеспечения точности, что требует больше времени и навыков персонала.
Сканирование документов в PDF-файлы, содержащие только изображения, было обычным способом хранения информации для архивных целей, поскольку электронные носители намного меньше и менее громоздки, чем бумажные хранилища. Чем чаще документы создаются в электронной, а не в бумажной форме, тем меньше вероятность того, что документы нужно будет сканировать для архивирования. Таким образом, поскольку авторы все больше полагаются на компьютеры как на исходный источник документов, проблема доступности PDF-файлов на основе изображений может со временем уменьшиться.
Изображение с возможностью поиска
PDF-файл с изображениями с возможностью поиска также содержит изображение для каждой страницы, но этот тип также включает текстовый слой.Текстовые символы создаются в процессе распознавания текста, который анализирует каждое изображение на предмет того, что выглядит как символы. Везде, где на изображении распознаются символы, программа рисует под ними слой текста. Наблюдатель страницы видит только изображение поверхности, как и в случае PDF-файла только с изображениями.
Текстовый слой позволяет искать в файле PDF фразы, интересующие читателя, просматривающего документ. Этот текст также позволяет индексировать файлы PDF по ключевым словам в коллекции электронных документов, что позволяет исследователю находить конкретные из них, заслуживающие дальнейшего изучения.
Добавление текстового слоя увеличивает размер файла PDF, поэтому текст может быть опущен, если компактность имеет первостепенное значение. Однако обычно возможность поиска как для зрячих, так и для слабовидящих читателей перевешивает затраты на дополнительный размер, тем более что текст сжимается, как упоминалось ранее. Поскольку для невизуального доступа к содержимому PDF требуется текст, добавление возможности поиска в файл PDF также улучшает доступность.
Форматированный текст и графика
Третий тип PDF, называемый форматированным текстом и графикой, сводит к минимуму использование фотографических изображений в пользу текстовых символов и векторной графики.Никакой слой изображения не лежит поверх текстового слоя. Вместо этого текстовые символы и векторная графика рисуются везде, где они могут представлять содержимое страницы. Фотографические изображения используются только в том случае, если они представляют собой рисунки, которые нельзя создать из строительных блоков текстовых символов и векторной графики. Этот тип PDF-файла обычно является результатом преобразования из другого электронного формата файла, например Microsoft Word. Этот тип является наиболее компактным (часто 10% файла с одним и тем же содержимым, состоящего только из изображений).Кроме того, поскольку этот тип построен из более структурированных компонентов, его можно более гибко использовать для других целей. Например, такой PDF-файл может быть преобразован в HTML для отображения в виде веб-страниц или преобразован в Microsoft Word для редактирования как части другого документа.
PDF-файл, составленный как форматированный текст и графика, вероятно, будет более доступным, чем файл, составленный как доступное для поиска изображение. Хотя оба типа содержат текстовые символы, качество текста почти всегда лучше в последнем типе, поскольку он служит как цели представления, так и возможности поиска.Если файл PDF был создан путем сканирования, вероятно, было проделано больше работы, чем с типом изображения с возможностью поиска, чтобы исправить ошибки OCR и добиться презентабельного текста. Если файл PDF был создан путем преобразования другого электронного формата, то текстовые компоненты, вероятно, будут более полными, поскольку они происходят непосредственно из символьных шрифтов, а не косвенно из распознанных изображений. Однако, несмотря на потенциал доступности этого типа PDF, другие проблемы структурного характера могут создавать значительные проблемы доступности, как будет объяснено ниже.
Расшифровка символов
Текстовые символы являются необходимым условием доступности PDF, но их недостаточно. Некоторые инструменты для создания PDF-файлов не оставляют достаточно информации о шрифтах, используемых в программе просмотра PDF-файлов, чтобы расшифровать все символы в терминах хорошо понятного компьютерного алфавита. Программа просмотра видит фигуры, которые, как ей известно, являются персонажами, нарисованными на странице. Затем программа должна выполнить обратный перевод своих операций рисования, найти значение Unicode для каждой формы и отобразить его как стандартный экранный символ.Если исходная таблица шрифтов встроена в файл PDF, программа просмотра может декодировать символы. Расшифровка также возможна, если использовался общий шрифт, например, встроенный в операционную систему. Однако без доступной таблицы шрифтов программа просмотра не знает, какие текстовые символы существуют, потому что она выполняет быстрый поиск в таблице, а не сложное распознавание текста.
Порядок чтения
Даже если полное декодирование символов возможно, файл PDF может быть недоступен из-за проблем с «порядком чтения».«Этот термин относится к порядку слов, предложений и абзацев. Могут ли они быть извлечены из текста файла PDF в последовательном, линейном порядке, или они смешаны вместе разрозненными, сбивающими с толку способами?
Например, текст файла PDF может визуально выглядеть как газетные столбцы, где линия заканчивается посередине страницы и продолжается под ней, а не продолжается до правого поля. Визуально на экране или распечатке структура документа очевидна из-за дополнительных интервалов или границы, которая указывает, где заканчивается один столбец текста и начинается другой.Однако информация об этой структуре документа должна быть представлена в файле PDF, чтобы порядок чтения был понятным и понятным с помощью вспомогательных технологий. Без структурной информации, которая группирует и разделяет области страницы, документ может быть недоступен для невизуальных читателей.
Поскольку PDF часто выбирают для публикаций, которые должны выглядеть красивее, чем текст с одним столбцом, файлы PDF часто содержат нестандартные макеты страниц с несколькими столбцами, боковыми панелями и подписями к изображениям.Если у этих файлов отсутствует внутренняя структура, невизуальная их интерпретация обязательно предполагает предположения о порядке чтения, а ошибки могут серьезно подорвать понимание их содержания.
Специальные возможности
Добавление тегов к файлам PDF
Для решения таких проблем с доступностью Adobe представила расширение для PDF, называемое «тегами». Концепция аналогична тегам в формате HTML. В качестве фона Консорциум World Wide Web (W3C) провел новаторскую работу с тегами HTML, чтобы включить структуру документа, которая была необходима для доступности по мере развития стандарта HTML.
HTML включает части текста с маркерами, которые указывают структуру или цель текста. Например, фраза может быть помечена как заголовок раздела, заголовок изображения или ячейка в таблице. Некоторые теги необходимы для правильного визуального отображения в веб-браузере, который интерпретирует файлы HTML, тогда как другие теги — хотя и являются стандартной частью языка HTML — рекомендуются специально для облегчения доступа. Например, теги доступности включают указание меток строк и столбцов таблицы, что позволяет средству чтения с экрана сообщать пользователю о контексте каждой ячейки.Информация о ячейках может быть бесполезной или сбивающей с толку без знания связанных меток строк и столбцов. В совокупности теги HTML, необходимые для обеспечения доступности, иногда называют «доступной разметкой».
PDF-файл с тегами, разработанный Adobe, обладает аналогичными функциями. Теги отмечают части содержимого PDF и организованы в последовательности, которая соответствует предлагаемому порядку чтения. В то время как файлы HTML представляют собой читаемый текст с тегами в виде слов, заключенных в скобки, однако файлы PDF имеют сжатую двоичную форму с тегами, которые можно просматривать только с помощью специального программного обеспечения, такого как Adobe Acrobat.
Стандарты доступности и стимулы
W3C определил стандарты для доступной разметки, названные «Руководством по доступности веб-контента» (WCAG 1.0). Правительство США также определило стандарты доступности для веб-сайтов, программного обеспечения и других информационных технологий в нормативных актах, которые были впервые опубликованы в 2001 году для реализации Раздела 508 Закона о реабилитации с поправками. (См. Дополнительную информацию в конце этой статьи для ссылки на эти правила.Раздел 508 требует, чтобы федеральные агентства предоставляли информацию людям с ограниченными возможностями в порядке, сопоставимом с тем, что предоставляется людям без инвалидности.
Раздел 508 не требует, чтобы производители программного обеспечения делали доступные продукты, но он предоставляет им значительные рыночные стимулы для этого, поскольку федеральное правительство является крупным заказчиком, который заинтересован в продуктах, соответствующих минимальным стандартам доступности. Действительно, Конгресс принял Раздел 508 отчасти с заявленной целью создания добровольных рыночных стимулов для разработки технологий, которые приносят пользу людям с широким спектром физических характеристик, а не только с типичными уровнями зрения, слуха, ловкости рук и другими качествами.
Adobe, как и другие компании, продающие продукцию федеральному правительству, за последние годы заметно увеличила доступность своих продуктов, а на ее веб-сайте есть информация о соответствии стандартам Раздела 508. Формат PDF с тегами — это нововведение в области специальных возможностей, которое компания представила в 2001 году. Помимо бесплатной программы для просмотра файлов PDF под названием Adobe Reader, Adobe продает коммерческую программу для создания файлов PDF, включая файлы PDF с тегами, под названием Adobe Acrobat.Программа доступна как в стандартной, так и в профессиональной версии, причем последняя имеет наибольшее количество функций тегов и рекомендована Adobe клиентам, заинтересованным в доступности.
Adobe Acrobat
Базовое содержимое и макет документа PDF обычно создается и редактируется с помощью программы обработки текста, такой как Microsoft Word или Corel WordPerfect, а затем преобразуется в PDF для создания окончательной формы с использованием таких функций, как визуальная точность, компактное хранение , настройки безопасности и кроссплатформенность, как описано ранее.Adobe Acrobat позволяет конвертировать документ в PDF из других форматов, включая обычный текст, HTML и популярные программы обработки текста. Он позволяет объединить несколько исходных документов в один файл PDF, например отчет, состоящий из описательной части Microsoft Word и электронной таблицы Microsoft Excel. Затем это позволяет автору или дизайнеру подправить внешний вид для точной презентации, которая требуется.
Adobe Acrobat включает функцию, которая анализирует доступность файла PDF.Он сообщает о потенциальных проблемах, например о неидентифицируемых символах, неоднозначной структуре или изображениях без маркировки. Связанная функция добавляет теги, когда это можно сделать с высокой степенью уверенности в том, какая разметка подходит в контексте документа. Например, он может связать нижний колонтитул каждой страницы с соответствующим тегом, когда анализ обнаруживает значительное пространство между остальной частью страницы и последней строкой текста, и эта строка содержит номер страницы.
Adobe Acrobat не может определить, что содержит изображение, поэтому автору необходимо ввести тег подписи к изображению вручную.Таблицы также представляют собой проблему. Состоит ли левый столбец таблицы из меток для строк справа или он состоит из фактических данных в таблице с метками столбцов, но без меток строк?
Отчет о специальных возможностях, создаваемый Acrobat, выявляет потенциальные проблемы, которые обычно исправляются путем выбора части документа и выбора тега, указывающего на его назначение. Этот процесс добавления тегов вручную может потребовать значительного времени и навыков, в зависимости от сложности документа.
Использование Adobe Reader
Adobe и устройства чтения с экрана
Компании, занимающиеся вспомогательными технологиями, такие как Freedom Scientific, разработчик JAWS, и GW Micro, разработчик Window-Eyes, работали с Adobe, чтобы их программы чтения с экрана понимали теги файла PDF, который просматривается в Adobe Reader (или Acrobat) и тем самым сделать более доступным вывод в речи или шрифте Брайля. На момент написания последней версии Adobe Reader была версия 7.0.3, для которой требуется Windows 2000 или XP.При запуске Adobe Reader определяет, запущена ли программа чтения с экрана. Если это так, он представляет диалоговое окно с параметрами конфигурации, которые влияют на доступность, и устанавливает варианты по умолчанию, которые, по мнению Adobe Reader, с наибольшей вероятностью будут работать лучше всего.
Самая важная настройка специальных возможностей называется «выводить порядок чтения из документа». Если этот параметр активен, Adobe Reader проанализирует немаркированный PDF-файл и добавит временные теги для оптимизации порядка чтения. Анализ исследует интервалы между блоками текста, например, чтобы решить, есть ли несколько столбцов информации.
Хотя процесс автоматической маркировки удобен для порядка чтения, у него есть три недостатка. Во-первых, с большим файлом PDF, содержащим более 50 страниц, процесс может занять несколько минут или больше, в зависимости от сложности документа и скорости компьютера. Во-вторых, во время тегирования документа может оказаться невозможным работать с другими программами, поскольку процесс тегирования может замедлить работу других программ до невозможности сканирования. В-третьих, процесс маркировки не сигнализирует о завершении, поэтому нужно постоянно проверять с помощью программы чтения с экрана, чтобы определить, готов ли файл к чтению.
Из-за недостатков автоматического добавления тегов Adobe Reader просит пользователя подтверждать, следует ли добавлять теги, прежде чем запускать процесс каждый раз, когда он открывает файл. Обычно пользователю нужна маркировка для лучшего порядка чтения. Однако, если дополнительный шаг подтверждения кажется неэффективным или раздражающим, его можно отключить. Обратной стороной является то, что компьютер станет непригодным для использования в течение нескольких минут всякий раз, когда открывается большой файл PDF, и автоматическая пометка выполняется для всего файла. Этот процесс тегирования происходит, даже если тот же файл был открыт ранее — такие теги являются временными и не сохраняются Adobe Reader из одного сеанса в другой.
Если параметр подтверждения включен, а пользователь отказывается добавлять теги ко всему файлу заранее, пользователь все равно может читать большой файл PDF на странице за раз. Однако всякий раз, когда пользователь переходит на новую страницу, происходит пауза в несколько секунд, пока Adobe Reader добавляет временные теги для этой страницы и передает их программе чтения с экрана.
Многие параметры конфигурации Adobe Reader находятся в диалоговом окне «Настройки» в меню «Правка». Горячая клавиша для этого диалогового окна — Control-K.Пользователи версий JAWS до 6.1 должны помнить, что перед нажатием Control-K может потребоваться нажатие клавиши обхода Insert-3, поскольку JAWS использует Control-K для других целей.
Настройки Adobe Reader, относящиеся к специальным возможностям, расположены в основном на двух вкладках диалогового окна «Параметры», которые называются «Специальные возможности» и «Чтение». Adobe Reader также группирует большинство настроек специальных возможностей в другом диалоговом окне, которое называется Ассистент настройки специальных возможностей, которое можно выбрать в меню «Справка».Это удобное диалоговое окно позволяет настраивать параметры программы чтения с экрана, параметры увеличения экрана или и то, и другое. Он позволяет либо принять все рекомендуемые параметры, либо настроить параметры с помощью ряда страниц мастера. Рекомендуется сначала принять все рекомендуемые настройки, а затем изучить возможные модификации позже, если ваши результаты неудовлетворительны.
Поскольку пользователи программ чтения с экрана полагаются на обычные горячие клавиши, а не на указание и щелчки мышью, приложение может быть более сложным, если оно включает нестандартные нажатия клавиш.Отчасти это относится к интерфейсу программы чтения с экрана для Adobe Reader. Например, нужно узнать, что Control-Shift-PageUp, а не Control-Home идет в начало документа. Параметры конфигурации находятся в меню «Правка», а не в меню «Просмотр» или «Инструменты». Могут существовать некоторые нетрадиционные элементы интерфейса, потому что Adobe делает версии своего программного обеспечения Reader для нескольких операционных систем, поэтому может торговать некоторыми соглашениями Windows для обеспечения межплатформенной согласованности.
Проблема нетрадиционного интерфейса, однако, также связана с настройками программы чтения с экрана, сделанными для соответствия двум различным доступным режимам тегов: отдельной странице или целому документу.Используя приведенный выше пример, Control + Home фактически является горячей клавишей для перехода к началу документа в Adobe Reader, как и другие программы Windows. Однако, когда программа чтения с экрана запущена, она использует Control + Home для перехода либо к верхней части документа, либо к верхней части страницы, в зависимости от того, активен ли режим документа или страницы. Поэтому Control + Shift + PageUp реализован как способ всегда переходить в начало документа.
Полезные горячие клавиши
Вот несколько нестандартных, но полезных горячих клавиш Adobe Reader:
- Control-PageDown или Control-PageUp: переход к следующей или предыдущей странице
- Control-Shift-PageDown или Control-Shift-PageUp: переход к нижней или верхней части документа
- Control-K: перейти к диалоговому окну «Настройки»
- Control-D: отображение свойств документа, включая параметры безопасности и статус тегов, которые влияют на доступность
- Control-Shift + 6: проверить доступность порядка чтения
- Alt-F, затем V: сохранить в текст
- Alt-H, затем T: Ассистент настройки специальных возможностей
JAWS vs.Окно-Глаза
Сравнение доступности между JAWS и Window-Eyes часто бывает затруднительным, потому что каждая программа может адаптировать и добавить к функциям, которые другая запустила за шесть месяцев до этого. Обе компании заявляют, что предоставляют поддержку Adobe Reader, сопоставимую с их поддержкой Internet Explorer. С JAWS 6.20 и Window-Eyes 5.0 мы заметили прогресс в этом направлении.
Команды навигации по таблицам JAWS, которые ранее работали с веб-страницами в Internet Explorer, теперь также работают с файлами PDF в Adobe Reader.Команда Adobe Reader Find, вызываемая с помощью Control-F, не работает с JAWS. Он работает с Window-Eyes, но с заметной задержкой. Однако в обоих программах чтения с экрана реализованы альтернативные команды поиска, которые работают лучше: Control-Insert-F с использованием JAWS или Control-Shift-F с использованием Window-Eyes. Ни один из программ чтения с экрана не может полностью определить параметры безопасности в окне «Свойства документа» без необходимости навигации по окну с помощью клавиш имитации мыши.
В общем, оба средства чтения с экрана работают в Adobe Reader медленно, и этого достаточно, чтобы мы иногда расстраивались из-за неэффективности (при запуске под Windows 2000 на компьютере Pentium 4 на уровне 1.9 ГГц).
Итог
PDF-файлы широко распространены и необходимы для доступа слепым или слабовидящим людям. Хотя исходный формат затруднял доступность, новый формат с тегами является многообещающим, и последние версии Adobe Reader лучше работают с программами чтения с экрана.
Для получения дополнительной информации
Страница специальных возможностей
Adobe Systems:
Страница Adobe о соответствии Разделу 508:
Страница загрузки
Adobe Reader:
Использование документов PDF со специальными возможностями в Adobe Reader 7.0: Руководство для людей с ограниченными возможностями :
Инструмент онлайн-преобразования PDF:
Создание доступных PDF-документов с помощью Adobe Acrobat 7.0 :
Рекомендации по доступности веб-контента:
Правила раздела 508:
Техническая поддержка
Раздел 508:
Мнения, выраженные в этой статье, принадлежат автору и не обязательно отражают точку зрения Федеральной комиссии по связи или правительства США.
Что такое PDF-файл? PDF Определение
Что такое PDF-файл?
PDF означает переносимый формат документа. Формат файла PDF был создан Adobe в 1993 году и является одним из наиболее распространенных форматов, используемых сегодня. PDF-файл — это документ, доступный только для чтения, который сохраняет свой исходный макет, предотвращает внесение изменений, но позволяет пользователям легко делиться файлом и распечатывать его.
PDF-файлы могут содержать текст, гиперссылки, кнопки, видео, изображения, аудио и поля формы и могут быть зашифрованы, поэтому для их просмотра требуется пароль.Если вы когда-либо загружали веб-форму, пресс-релиз или другой подробный документ, скорее всего, вы уже использовали файл PDF.
Зачем нужен PDF?
Использование PDF дает множество преимуществ. При совместном использовании документа, созданного в такой программе, как Microsoft Word, нет гарантии, что получатель сможет открыть его, если только он не использует ту же самую программу. Кроме того, такая программа, как Microsoft Word, позволяет получателю редактировать документ, а это означает, что отправитель рискует изменить формат документа.
Использование PDF дает два преимущества, которые представляют собой решение этих препятствий. Во-первых, тот, кто получил файл PDF, может открыть его в любой программе. Другими словами, им не нужно иметь приложение, которое использовалось для создания файла, чтобы просматривать его.
Второе преимущество использования PDF-файла заключается в том, что он сохраняет форматирование документа и будет выглядеть одинаково на любом устройстве. Получатели PDF не могут редактировать файл, если это не форма, или если у них есть доступ к Adobe Acrobat или другим приложениям, которые предоставляют эту функцию.
Эти преимущества делают PDF-файлы более доступными для совместного использования, чем файлы других форматов, и гарантируют, что зрители увидят документ так, как задумано.
Вас также может заинтересовать:
JPEG
SVG
PNG
Как просмотреть PDF-файл
PDF-файл обычно отправляется через вложение электронной почты, загружается на общий диск или по ссылке на веб-страницу. Поскольку файлы PDF содержат стандартизованный формат, их можно открывать и просматривать в различных приложениях.К ним относятся веб-браузеры, Adobe Acrobat, сторонние приложения и текстовые редакторы.
Получив PDF-файл, вы можете открыть и просмотреть его двумя способами. Его можно открыть прямо в веб-браузере, что является лучшим решением, если вам нужно просмотреть файл только один раз. Кроме того, вы можете загрузить файл и сохранить его на свой компьютер, что является лучшим вариантом, если вам нужно сохранить файл или вы хотите просмотреть его позже.
Как создать файл PDF
Вы можете превратить практически любой документ в PDF.Сюда входят текстовые документы, таблицы Excel, веб-страницы и изображения. Это можно сделать напрямую с помощью Adobe Acrobat или путем преобразования файла в формат PDF на вашем компьютере.
Для начала выберите Файл вверху документа. Затем вы можете выбрать «Экспорт», «Загрузить», «Печать» или «Сохранить как», чтобы сохранить документ в формате PDF. В зависимости от системы эта функция преобразования может быть найдена в разных местах, но она доступна в Microsoft Office, Google Диске и других программах как на Mac, так и на Windows.
Вы также можете превратить веб-страницу в PDF в таких приложениях, как Chrome, у которых есть опция «просмотреть PDF» в разделе печати.
Третий вариант — использовать онлайн-приложение для преобразования PDF-файлов, которое может мгновенно преобразовывать файлы различных типов в загружаемый формат PDF.
Как редактировать файл PDF
Файлы PDF в основном используются для просмотра, а не редактирования, поэтому стандартный PDF-файл не позволяет редактировать. Однако бывают случаи, когда вы сталкиваетесь с PDF-файлом, предназначенным для редактирования, например с формой.Формы включают специальную функцию, называемую полем формы, которая позволяет пользователю вводить новую информацию в документ и сохранять изменения. Также можно подписать PDF электронным способом. Это удобно при работе с контрактами и другими юридическими или правительственными документами.
Кроме того, можно полностью редактировать PDF-файл с помощью программы Adobe Acrobat. Программное обеспечение даже позволяет пользователям конвертировать файлы PDF в редактируемые файлы Word, Excel или PPT. Хотя этот вариант может похвастаться лучшими функциями для редактирования PDF-файлов, недостатком является то, что он может быть дорогостоящим.Существуют также бесплатные онлайн-инструменты, которые позволят легко редактировать PDF-файлы, но пользователи должны изучить варианты, чтобы найти те, которые обеспечивают достойные функции и не имеют скрытых затрат.