Epub fb2 в чем разница
Электронные книги и их форматы: говорим про EPUB — его историю, плюсы и минусы
Ранее в блоге мы писали о том, как появились форматы электронных книг DjVu и FB2.
Тема сегодняшней статьи — EPUB.
Изображение: Nathan Oakley / CC BY
История формата
В то время Microsoft собиралась завоевывать рынок электронных книг и занималась разработкой приложения-читалки для Windows 95. Можно сказать, что создание нового формата являлось частью бизнес-стратегии ИТ-гиганта.
Если говорить о NuvoMedia, то эта компания считается производителем первой массовой электронной читалки Rocket eBook. Внутренняя память устройства составляла всего восемь мегабайт, а время автономной работы не превышало 40 часов. Что касается SoftBook Press, они также занимались разработкой электронных читалок. Но их девайсы имели отличительную особенность — встроенный модем — он позволял скачивать цифровую литературу напрямую из магазина SoftBookstore.
В начале нулевых обе компании — NuvoMedia и SoftBook — были куплены медиакомпанией Gemstar и объединены в Gemstar eBook Group. Эта организация еще несколько лет занималась продажей ридеров (например, RCA REB 1100) и цифровых книг, однако в 2003 году вышла из бизнеса.
Но вернемся к разработке единого стандарта. В 1999 году Microsoft, NuvoMedia и SoftBook Press основали организацию Open eBook Forum, в составе которой стали работать над черновиком документа, положившим начало EPUB. Изначально стандарт назывался OEBPS (расшифровывается как Open EBook Publication Structure). Он позволил распространять цифровую публикацию в одном файле (ZIP-архиве) и упростил перенос книг между различными аппаратными платформами.
Позже к Open eBook Forum присоединились ИТ-компании Adobe, IBM, HP, Nokia, Xerox и издатели McGraw Hill и Time Warner. Все вместе они продолжили разработку OEBPS и занимались развитием экосистемы цифровой литературы в целом. В 2005 году организацию переименовали в Международный форум по цифровым публикациям, или IDPF.
В 2007 году IDPF сменили название формата OEBPS на EPUB и начали разработку его второй версии. Её представили широкой публике в 2010 году. Новинка почти не отличалась от своего предшественника, однако получила поддержку векторной графики и встроенных шрифтов.
К этому времени EPUB завоевывал рынок и стал стандартом по умолчанию для многих издателей и производителей электронных гаджетов. Форматом уже пользовались O’Reilly и Cisco Press, плюс его поддерживали устройства Apple, Sony, Barnes & Noble, ONYX BOOX.
В 2009 году проект Google Books объявил о поддержке EPUB — его использовали для распространения более миллиона бесплатных книг. Популярность формат начал приобретать и у писателей. В 2011 году Джоан Роулинг рассказала о планах запустить сайт Pottermore и сделать его единственной точкой продаж книг Поттерианы в цифровом виде.
Стандартом для распространения литературы был выбран EPUB, в первую очередь из-за его возможности реализовать защиту от копирования (DRM). Все книги в онлайн-магазине писательницы до сих пор доступны только в этом в формате.
Третья версия формата EPUB вышла в 2011 году. Разработчики добавили возможность работать с аудио- и видеофайлами и сносками. Сегодня стандарт продолжает развиваться — в 2017 году IDPF даже вошла в состав консорциума W3C, который внедряет технологические стандарты для Всемирной паутины.
Как устроен EPUB
Книга в формате EPUB представляет собой ZIP-архив. В нем хранится текст публикации в виде XHTML- или HTML-страниц или файлов PDF. Также в архиве лежит медиаконтент (аудио, видео или изображения), шрифты и метаданные. Еще в нем могут находиться дополнительные файлы со стилями CSS или PLS-документы с информацией для сервисов генерации речи.
За отображение контента отвечает XML-разметка. Фрагмент книги со встроенной аудиозаписью и изображением может выглядеть следующим образом:
Помимо контентных файлов в архиве находится специальный навигационный документ (Navigation Document). Он описывает расположение текста и изображений в книге. Приложения-ридеры обращаются к нему в том случае, если читатель желает «перескочить» через несколько страниц.
Еще один обязательный файл в архиве — package. Он включает в себя метаданные — информацию об авторе, издателе, языке, названии и так далее. Туда же входит перечень (spine) подразделов книги. Пример package-документа можно посмотреть в репозитории IDPF на GitHub.
Достоинства
Преимущество формата — его гибкость. EPUB позволяет создавать динамическую разметку документа, адаптирующуюся под размеры экрана устройства. Это одна из главных причин, почему формат поддерживает большое количество читалок (и других электронных устройств). К примеру, с EPUB работают «из коробки» все ридеры ONYX BOOX: от базовой и 6-дюймовой Caesar 3 до премиальной и 9,7-дюймовой Euclid.
/ ONYX BOOX Caesar 3
Так как формат построен на основе популярных стандартов (XML), его легко конвертировать для чтения в интернете. Также EPUB поддерживает интерактивные элементы. Да, подобные элементы они есть и в PDF, однако добавить их в PDF-документ можно только c помощью проприетарного программного обеспечения. В случае с EPUB они добавляются в книгу разметкой и тегами XML в любом текстовом редакторе.
Другим достоинством EPUB являются функции для людей, испытывающих проблемы со зрением или страдающих дислексией. Стандарт дает модифицировать отображение текста на экране — например, подсветить определённые буквосочетания.
Еще EPUB, как мы уже отметили, дает издателю возможность установить защиту от копирования. При желании продавцы электронных книг могут использовать свои механизмы, ограничивающие доступ к документу. Для этого нужно модифицировать файл rights.xml в архиве.
Недостатки
Для создания EPUB-публикации необходимо разбираться в синтаксисе XML, XHTML и CSS. При этом приходится работать с большим количеством меток-идентификаторов. Для сравнения, тот же стандарт FB2 включает в себя лишь минимально необходимый набор тегов — достаточный для верстки художественной литературы. А для создания PDF-документов вообще не требуются особые знания — за все отвечает специализированное ПО.
Также EPUB критикуют за сложность оформления комиксов и других книг со множеством иллюстраций. В этом случае издателю приходится создавать статичный макет с фиксированными координатами для каждой картинки — на это может уходить много сил и времени.
Что дальше
Сейчас IDPF работает над новыми спецификациями для формата. Например, одна из них поможет создавать интерактивные учебные пособия со скрытыми разделами. Одна и та же книга будет по-разному выглядеть для преподавателя и студента — во втором случае окажутся скрыты, например, ответы на тесты или контрольные вопросы.
Изображение: Guian Bolisay / CC BY-SA
Ожидается, что новая функция поможет реорганизовать образовательный процесс. Сегодня EPUB довольно активно используется крупными вузами, например Оксфордским университетом. Несколько лет назад они добавили в свое приложение с цифровой библиотекой поддержку EPUB 3.0.
Также IDPF создает спецификацию для внедрения в EPUB сносок Open Annotation. Этот стандарт разработали в W3C в 2013 году — он упрощает работу со сложными видами аннотаций. Например, с его помощью можно поставить примечание к определенному участку JPEG-изображения. Дополнительно стандарт реализует механизм синхронизации изменений в аннотациях между копиями одного EPUB-документа. Примечания формата Open Annotation можно добавлять в EPUB-файлы и сейчас, однако формальная спецификация для них пока не принята.
Также ведется работа над новой версией стандарта — EPUB 3.2. В ней появятся форматы WOFF 2.0 и SFNT, которые используются для сжатия шрифтов (в некоторых случаях они позволяют сократить размеры файла на 30%). Также разработчики заменят некоторые устаревшие атрибуты HTML. Например, вместо отдельного элемента trigger для активации аудио- и видеофайлов в новом стандарте будут нативные HTML-элементы audio и video.
Черновик спецификации и список изменений уже доступны в GitHub-репозитории W3C.
Электронные книги и их форматы: FB2 и FB3 — история, плюсы, минусы и принципы работы
В прошлом материале мы рассказывали об особенностях формата DjVu. Сегодня мы решили остановиться на формате FictionBook2, более известном как FB2, и его «наследнике» FB3.
Появление формата
В середине 90-х годов энтузиасты начали оцифровывать советские книги. Они переводили и сохраняли литературу в самых разнообразных форматах. Одна из первых библиотек в Рунете — Библиотека Максима Мошкова — использовала форматированный текстовый файл (TXT).
Выбор в его пользу был сделан из-за устойчивости к повреждению байтов и универсальности — TXT открывается на любой операционной системе. Однако он затруднял обработку хранимой текстовой информации. Например, для перехода на тысячную строку приходилось обрабатывать 999 строк, идущих перед ней. Книги также хранили в «вордовских» документах и PDF — последний было сложно преобразовывать в другие форматы, а слабые компьютеры открывали и отображали PDF-документы с задержками.
Также для «хранения» электронной литературы использовали HTML. Он упростил индексацию, преобразование в другие форматы и создание документов (разметку текста тегами), но привнес собственные недостатки. Одним из самых значимых была «расплывчатость» стандарта: он позволял определенные вольности при написании тегов. Некоторые из них должны были быть закрыты, другие (например,
) — закрывать было необязательно. Сами теги могли иметь произвольный порядок вложения.
И хотя подобная работа с файлами не поощрялась — такие документы считались некорректными — стандарт требовал от ридеров попробовать отобразить содержимое. Здесь и возникали сложности, так как в каждом приложении процесс «домысливания» был реализован по-своему. При этом на тот момент имеющиеся на рынке устройства и приложения для чтения понимали один-два специализированных формата. Если книга имелась в одном формате, её приходилось переформатировать, чтобы прочесть. Решить все эти недостатки и был призван FictionBook2, или FB2, который взял на себя первичное «причесывание» текста и конвертацию.
Отметим, что у формата была первая версия — FictionBook1 — однако она носила лишь экспериментальный характер, просуществовала недолго, на сегодняшний день не поддерживается и не имеет обратной совместимости. Поэтому под FictionBook чаще всего подразумевают его «последователя» — формат FB2.
FB2 создала группа разработчиков, возглавляемая Дмитрием Грибовым, который является техническим директором компании «ЛитРес», и Михаилом Мацневым, создателем читалки Haali Reader. В основу формата лег XML, который строже, чем HTML, регламентирует работу с незакрытыми и вложенными тегами. XML-документ сопровождается так называемой XML-схемой. XML-схема — это специальный файл, в котором собраны все теги и описаны правила их применения (последовательность, вложенность, обязательность и необязательность и др.). В FictionBook схема находится в файле FictionBook2.xsd. Пример XML-схемы вы можете найти по ссылке (она используется магазином электронных книг «ЛитРес»).
Структура документа FB2
Тег содержит таблицы стилей, чтобы облегчить конвертацию в другие форматы. В лежат закодированные с помощью base64 данные, которые могут понадобится для рендеринга документа.
Элемент содержит всю необходимую информацию о книге: жанр произведения, список авторов (Ф. И. О., адрес электронной почты и сайт в интернете), название, блок с ключевыми словами, аннотацию. Также в нем может быть информация о вносимых в документ изменениях и данные об издателе книги, если она выпускалась на бумажном носителе.
Вот так выглядит часть блока в записи FictionBook для произведения «Этюд в багровых тонах» Артура Конана Дойла, взятого из Проекта «Гутенберг»:
FictionBook также предоставляет несколько тегов для работы с гиперссылками. Они основываются на спецификации XLink, разработанной консорциумом W3C специально для создания ссылок между различными ресурсами в XML-документах.
Достоинства формата
Стандарт FB2 включает в себя лишь минимально необходимый набор тегов (достаточный для «оформления» художественной литературы), что упрощает его обработку ридерами. Причем в случае прямой работы ридера с форматом FB, пользователь получает возможность настроить под себя практически все параметры отображения.
Строгая структура документа позволяет автоматизировать процесс преобразования из формата FB в любой другой. Эта же структура дает возможность работать с отдельными элементами документов — настраивать фильтры по авторам книг, названию, жанру и др. По этой причине формат FB2 и приобрел популярность в Рунете, став стандартом по умолчанию в российских электронных библиотеках и библиотеках стран СНГ.
Недостатки формата
Простота формата FB2 является его достоинством и недостатком одновременно. Это ограничивает функционал для сложной верстки текста (например, примечаний на полях). В нем нет векторной графики и поддержки нумерованных списков. По этой причине формат не очень подходит для учебников, справочников и технической литературы (об этом даже говорит само название формата — fiction book, или «художественная книга»).
При этом, чтобы отобразить минимальную информацию о книге — название, автора и обложку — программе требуется обработать практически весь XML-документ. Это связано с тем, что метаданные располагаются в начале текста, а изображения — в конце.
FB3 — развитие формата
В связи с возросшими требованиями к форматированию текстов книг (и чтобы нивелировать некоторые из недостатков FB2), Грибов начал работу над форматом FB3. Позже разработка остановилась, но в 2014 году была возобновлена.
По словам авторов, они изучили реальные потребности при издании технической литературы, посмотрели учебники, справочники, пособия и очертили более конкретный набор тегов, который бы позволил отобразить любую книгу.
В новой спецификации формат FictionBook представляет собой zip-архив, в котором отдельными файлами хранятся метаданные, изображения и текст. Требования к формату zip-файла и соглашения о его организации прописаны в стандарте ECMA-376, определяющем Open XML.
Был сделан ряд улучшений, связанных с форматированием (разрядка, подчеркивание) и добавлен новый объект — «блок» — оформляющий произвольный фрагмент книги в виде четырехугольника и способный внедряться в текст с обтеканием. Появилась поддержка нумерованных и маркированных списков.
FB3 распространяется по свободной лицензии и имеет открытый код, поэтому издателям и пользователям доступны все утилиты: конвертеры, облачные редакторы, читалки. Текущую версию формата, читалку и редактор можно найти в репозитории проекта на GitHub.
В целом FictionBook3 пока менее распространён, чем его старший брат, однако книги в этом формате уже предлагают несколько электронных библиотек. А в «ЛитРес» еще пару лет назад заявляли о намерении перевести весь свой каталог на новый формат. Часть ридеров уже поддерживает весь необходимый функционал FB3. Например, работать с этим форматом «из коробки» умеют все современные модели ридеров ONYX, например, Darwin 3 или Cleopatra 3.
/ ONYX BOOX Cleopatra 3
Более широкое распространение FictionBook3 позволит сформировать экосистему, ориентированную на полноценную и эффективную работу с текстом на любом устройстве с ограниченными ресурсами: черно-белым или небольшим дисплеем, низким объемом памяти и др. По словам разработчиков, единожды сверстанная книга будет максимально удобной в любой среде.
Что лучше fb2 или epub?
В статье будет дан обзор двух книжных форматов, коснёмся плюсов и минусов, дадим ответ: что на сегодня лучше: epub или FB2.
Сравнивать в середине 2014 года FB2 и epub — всё равно, что сравнивать windows XP и “семёрку” в конце 2009. (для тех, кто не в теме: октябрь 2009 — первый выпуск Win 7). Короче, что я хочу этим сказать?[adsense]
Epub — более современный и технологичный, наиболее “правильный” формат, который пользуется большей популярностью в Европе. К сожалению, в России он не так распространён. Ведь большинство электронных книг у нас именно в FB2.
Что такое epub и fb2?
Открыть форматы можно такими программами, как CoolReader, FB2reader, под линукс подойдёт Calibre.
Первое, что хочу отметить, это большую функциональность Epub.
Заключается она в возможности редактировать конкретные главы (ведь файлы книги идут не единым архивом, как FB2, а отдельными)
2. Так же, если захотите выдрать понравившийся картинку — сделать это будет проще, чем в FB2, т.к. все изображения, опять таки, лежат отдельно.
3. О возможности вставки формул в epub и невозможности сделать это в FB2 — упоминаю вскользь, рядовому пользователю это не пригодится.
В чём ещё заключаются различия?
FB2 — читается в блокноте, епуб — нет.
Зато Epub занимает чуть меньше места на жестком диске. И ещё его можно разорхивировать, т.к. он, по сути, zip архив.[adsense]
А что касается Вас? Что лучше по-вашему?
Формат ePub: чем и зачем открывать
Файлы с расширением ePub используются для создания электронных книг и документов. Рассмотрим чем открыть формат.
Рассмотрим сначала как открыть и чем читать файлы с расширением ePub на iPhone, Android-телефонах, затем на компьютерах с ОС Windows. Расскажем какие онлайн-сервисы и расширения браузера позволяют читать формат. В конце подробнее опишем особенности файла.
На телефоне
Android
Мы Подобрали 3 самых скачиваемых приложения в Google Play (Play Market).
ReadEra (бесплатно)
22,58 МБ. Полноценно интегрируется со смартфоном. Позволяет открывать текстовые вложения из почты и других приложений. Сохраняет последнюю открытую страницу и сортирует файлы по желанию пользователя: автор, жанр и время добавления. Открывает документы из ZIP архивов, вложений в письма и прочих документов, по запросу от приложений.
E-Book (бесплатная)
10,29 МБ. Встроены ссылки на бесплатные сайты для скачивания электронных книг. Дневной и ночной режимы чтения, при этом сохраняется первоначальный вид документа (таблицы, списки, ссылки). Поддерживает закладки на фрагменты текста. Можно использовать как конвертер EPUB в PDF.
22,58 МБ. Простой понятный интерфейс, часто обновляется, есть ночной режим. Поддерживает закладки, автоматически находит новые книги. Потребуется Android от 4.1 и выше. Примерно за 149 рублей можно докупить пакет функций: резервное копирование, настройку цвета текста и фона, синхронизацию через Google Диск с другими устройствами. Рекомендуем!
iOS (iPhone)
Мы долго искали, чем открыть ePub на iPhone и остановились на двух приложениях:
На компьютере
Посмотрим, чем открыть ePub на компьютере с различными версиями Windows. Программ для ПК существует много, но мы выбрали наиболее адекватные.
Windows 10
Calibre
66,68 МБ. Бесплатная. (Вероятно самый популярный ePub-ридер). Есть встроенный конвертер, информационная база о книгах, поддерживает новостные порталы The Guardian, National Geographic, Эхо Москвы и другие. Формирует базу по авторам, языкам, издателям.
Windows 7
Icecream Ebook Reader
28,25 МБ. Бесплатно. Есть редактирование текста, онлайн-поиск по выделенному фрагменту, добавление закладок. Поддерживает разбивку по форматам и категориям. Добавленные книги отображаются таблицей с авторами, датой добавления и прогрессом чтения в процентах.
Windows XP
Epub Reader
В браузере
Google Chrome: Readium
Firefox: EpuBReader
Кликаем на ссылку скачивания и файл открывается в браузере или идем в меню: «Файл / Открыть файл». Просто и удобно.
Онлайн
Если вас устраивает чтение в браузере и есть доступ к интернету, тогда проще открывать ePub в онлайн-сервисе.
EPUB Reader Online — не требует регистрации, установки плагинов или расширений, просто загрузите файл и читайте в браузере. Удобнее некуда.
Что такое EPUB
Историческая справка
Интересные факты
Проблемы с файлом
Альтернативы
Что лучше – EPUB или FB2?
Современные электронные библиотеки предлагают нам на выбор огромное количество самых разнообразных книг, но, как ни странно, разработчики и пользователи до сих пор не пришли к единому стандарту электронной книги. Новичку, впервые задавшемуся вопросом, какая именно книга ему нужна, важно понимать, что даст ему тот или иной формат книги. Мы рассмотрим два наиболее распространенных типа электронных книг.
Почему EPUB?
EPUB весьма популярен среди любителей электронных книг. Связано это с тем, что он хорошо подходит для хранения книг с иллюстрациями, то есть чем красочнее Ваша книга – тем больше Вам по пути именно с EPUB. В связи с этим на Западе именно этот формат развивается наиболее динамично – там большинство книг оформляется именно как EPUB, под него «заточены» ридеры, и так далее. Впрочем, помните, что данный формат не слишком хорош для самостоятельного оформления, другими словами, у Вас либо официальная книга от издателя (вряд ли бесплатная тогда), или, с большой долей вероятности, нечто неаккуратное.
Почему FB2?
FB2, в общем-то, хранит структуру документа, пожалуй, не хуже. Скорее всего, он менее популярен на Западе только потому, что его намного проще сделать своими руками, а это дает широкие возможности для распространения пиратского контента. Именно поэтому он очень распространен на постсоветском пространстве – здесь книги в основном оформляют именно так. Отсюда напрашивается вывод, что если Вы хотите создать русскоязычную библиотеку из книг одного формата, то лучше сразу начинать с FB2. Кстати, если Вам почему-то не нравится читать в этом формате, Вы легко можете переконвертировать его в любой другой – FB2 при конвертировании во что-то другое дает минимальную потерю оформления.
Вместо вывода
Оба формата по-своему хороши, и выбрать один довольно сложно. Лучше всего – найти способ открывать оба формата на одном устройстве. К счастью, различных читалок накачать не сложно, а все современные ридеры должны поддерживать как FB2, так и EPUB.