The Ebook. Книга об электронных книгах Прохоренков Владимир
Развитые страны уже много лет контролируют копирование на уровне пользователя и фиксируют факт распространения путём определения направления потока данных. Например, в Германии и США это является отдельным видом бизнеса, когда сотрудники специализированных компаний доказывают факт нарушения авторских прав и направляют личное уведомление о возмещение ущерба. Если пользователь отказывается заплатить указанную сумму в определённые сроки, дело отправляется в суд с автоматическим увеличением финансовых претензий. В большинстве случаев конечный потребитель не хочет оспаривать свои действия в суде, если не преследует иные цели. Но такой подход отбивает какое-либо желание афишировать причастность к «пиратской деятельности», как минимум.
Задача юридических служб в зарубежных странах направлена на уменьшение популярности нелегального копирования через потребителей, в то время как отечественные правообладатели до сих пор оперируют понятием легальности по отношению к ресурсам. Метод создаёт обратную реакцию, объединяет единомышленников вокруг файлообменных сетей любого типа, не оказывая никакого влияния на их личную ответственность перед законом, увеличивая степень безнаказанности.
Несовершенство законодательной базы создаёт прецеденты для нарушения законов об авторском праве и увеличивает условную личную свободу при использовании «нелегального копирования», как естественную идеологию потребителей на современном этапе, в то время как исполнение существующего закона не рассматривается в качестве важного фактора для развития интеллектуальной собственности.
В качестве доказательства необходимости бесконтрольного копирования и несовершенства законодательства используется обоснование того, что авторские права имеют слишком большой временной период, что искусство должно принадлежать более широким массам, особенно среди так называемых классических произведений, что слишком высока цена за отдельный экземпляр и многое другое. Выбор и широта оправданий зависит от степени подготовленности, временных рамок, страны проживания, личных убеждений и многого другого.
Законность приобретения контента во многом зависит от степени развития отрасли. Это верно не только по отношению к электронным книгам, как к сегменту рынка. Во многом законность зависит от социального развития общества, от увеличения спроса на собственность в области интеллектуальной деятельности.
Законность тех или иных видов деятельности вырабатывается государством и обществом последовательно в течение длительного периода. От запретительных и карательных мер к более широкому, тонкому толкованию законов и их соблюдению.
Нарушение законов говорит только о том, что существующее авторское право не отвечает современным запросам общества на основные свободы и отсутствует умение поддерживать точное соблюдение законов на уровне государства, а также международных договоров.
Какие форматы лучше?
Общие сведения
Выбор интересной книги для чтения в электронном виде многие читатели начинают с пристрастия к цифровому формату. Это постепенно становится устаревшим представлением о ценности контента в той или иной форме, но до сих пор является актуальным представлением, потому что люди спорят и доказывают себе преимущество форматов исходя из доступности контента.
Каким-то образом потребитель выбирает лучший для него формат из всех существующих, потом это становится привычкой, и основной поток литературы читается в одном и том же формате независимо от того, что формат может быть неудобен для другого устройства, которое рано или поздно появится. Приверженность к формату не учитывает перспектив и более длительного хранения библиотеки в цифровой форме, в отличие от бумажных книг, где носитель является неотъемлемой частью контента. Любой существующий цифровой формат невозможно представить как «форму наследства». Контент в определённом формате живёт до тех пор, пока актуален «носитель» и «распространитель».
Довольно часто подобное происходит с плохо масштабируемыми форматами PDF и DJVU, которые не подходят для маленьких экранов и медлительных устройств. Например, пользователь начал привыкать к электронному чтению через эти форматы, читая на большом экране компьютера, собрав большую коллекцию книг и переведя собственные документы в электронный вид. Все это было удобно, красиво, классифицировано, наглядно, похоже на настоящую электронную библиотеку внутри компьютера и являлось откровенной гордостью владельца. Но когда пришёл очередной этап развития, захотелось читать накопленные файлы на мобильном устройстве, в этот момент — привычка, а не комфорт, берет вверх! Огромная библиотека оказывается не востребованной внутри маленького устройства. История повторяется. Начинается мучительное и длительное отвыкание от «самого лучшего формата» в пользу другого «лучшего», распространённого и популярного для конкретной платформы. После очередного накопления книг в электронной библиотеке, формат вновь становится незаменимым, а, следовательно «лучшим». Библиотека формируется заново различными способами конвертации и с помощью повторного приобретения.
Окунаясь в историю с головой можно проследить приверженность пользователей к «лучшим форматам» и к рождению популярных для локальных рынков и устройств.
Популярность форматов
В 1994 году Максим Мошков создал самую популярную (по тем временам) русскоязычную библиотеку Lib.ru. Со слов основателя: «начал с собирательства файлов, а читал бумажные книги». Будет интересно узнать, что Мошкова (тогда) «мнение окружающих об электронных книгах не волновало совершенно. Это стало объектом собирательства, коллекционирования. Файлы собирал, а читать не мог — глаза болели от обычных мониторов». По мнению Максима: «только сейчас, что-то меняется, когда оказалось, что эти файлы ещё и читать можно, причём без риска ослепнуть окончательно».
Тем не менее, к 2000 году это была самая крупная библиотека книг в формате TXT и не только на русском языке. Основной потребитель библиотеки использовал для чтения громоздкий компьютер, а небольшая часть пользователей уже тогда читала книги на мобильных устройствах, которые были доступны в продаже на тот момент.
На стыке веков родился самый популярный отечественный формат FB2. В его задачу входило создать структуру привычной книги в цифровой форме, а не контейнер в готовом виде, в котором прописано всё и сразу, на все случаи жизни, что обычно усложняет эту самую жизнь на различных устройствах.
Дмитрий Грибов, разработчик FB2, изначально создал структурированный формат на основе XML. У автора был перерыв в чтении бумажных книг, а потом резкий старт и пристрастие к электронной форме чтения, так как был виден иной смысл — не в накоплении файлов, а в комфорте чтения и хранении книг. С его слов: «начал читать — начал думать, как сделать действительно удобную библиотеку».
Для создания любви к «отечественному формату» была выбрана тактика «популяризация и привыкание». Для готового формата FB2 были необходимы потребители, которые его оценят. Сделать это можно, если предложить попробовать готовый контент в специализированной программе и желательно на мобильном устройстве.
В 2002 году, через 3 года после начала разработки формата, был представлен финальный вариант второй версии формата «Fiction Book», одновременно с открытием небольшой библиотеки fictionbook.ru. Программа Haali Reader (на тот момент) была максимально популярной на мобильной платформе и уже поддерживала первую и впоследствии вторую версию Fiction Book. Таким образом, Михаил Мацнев, как автор программы, стал ещё и соучастником в популяризации формата FB2.
Библиотека fictionbook.ru демонстрировала очень важную и главную цель нового формата — «удобство хранения книг с помощью FB2». Формат был задуман как «первоисточник контента», из которого можно автоматически пересоздавать книги в любых форматах. FB2 имеет структуру книги, а не готовое форматирование текста, всё остальное настраиваемо не только при чтении, но и при конвертации. Таким образом, создавалась «книга-исходник» в FB2 и через несколько секунд сервер её конвертировал в любые другие форматы. Соответственно для веб-сервера также автоматически генерировалась основная титульная информация привычной библиотеки — название книги, автор, обложка, анонс, различные коды для хранения и идентификации.
Изначально преимущество формата сводилось к тому, что достаточно «создать и опубликовать файл», всё остальное уже «известно как делать» и «что создавать». Это коренное отличие, которое позволяет расширять возможности структуры формата FB2 до бесконечности. Любой может вставить свою собственную ячейку с данными в существующую структуру контента для своих целей, причём устройства и программы будут считывать контент без искажения, он по-прежнему будет валидным, но они проигнорируют неизвестное, а создавший новую структуру удовлетворён новыми свойствами формата.
Чтобы стало понятно, можно легко придумать пример. Скажем нужно точно знать — какие книги надлежащего качества и кем проверенны. Вставляется пара тегов в готовый файл по правилам XML. Например:
<quality> атрибут качества </quality>
Теперь в программу каталогизатор достаточно вставить распознавание тега <quality> и добавления его в случае первичного осмотра.
Это так просто, что можно влюбиться!
Абсолютно очевидно, что страсть к книгам в простотелом формате TXT быстро подхватил FB2 и стал популярным сразу в нескольких странах Европы и Азии.
По историческим меркам подобный метод является классической формой популяризации формата (с любой точки зрения) — «популярному формату нужна платформа и доступность контента» и неважно кто это делает и как. При этом стоимость всего решения или отдельных частей не может учитываться и на самом деле являются абстрактными в полной мере.
Если контент можно не покупать (по какой-то одной или любой причине), то и устройство для чтения можно адаптировать из уже существующих у потребителя, а не приобретать специализированное, что не является обязательным решением, чтобы начать читать книги в электронной форме.
Это также верно, как если бы человек сам оцифровал часть или всю свою бумажную библиотеку. Мог бы начать читать сразу, на экране компьютера, не имея никакого доступа в Интернет или к ближайшему магазину электроники. Что есть, то уже может позволить читать в электронном виде. По крайней мере, с этого начиналось электронное чтение, и никто из энтузиастов не чувствовал себя ущербным по каким-либо причинам (или не сознается до сих пор, даже в частной беседе).
То есть, доступность платформы и контента позволяет сразу выбрать лучший формат для чтения с точки зрения потребителя. Очень важен первичный опыт, накопление литературы и выбираемая платформа.
Влияние на определение «лучшего формата» имеет массовый рынок в локальном и глобальном масштабе. Любой потребитель делится на несколько групп по уровню подготовленности и наличия желания в чем-либо разбираться.
Массовый рынок склонен к упрощению форматов, при том, что собственные возможности форматов путаются с развитостью программного обеспечения и устройствами.
Формат DJVU имел все шансы, чтобы стать популярным гибридным форматом, который содержит в себе не только графический образ страниц, но и текстовое дублирующее содержание, что значительно комфортнее для чтения на небольших по размеру экранах.
Например, корпоративные форматы ZINIO и PressDisplay (он же PressReader) содержат в себе сразу несколько возможностей:
• Графический образ страницы газеты, книги, журнала.
• Текстовый дубль для удобного чтения.
• Мультимедийные данные.
Но дело в том, что качество поддерживается не столько платформой, сколько источником, то есть сервером услуг (поставщиком услуг). DJVU фактически лишился этих свойств на массовом рынке, и пользователи сделали из формата контейнер для хранения графических образов печатных страниц, хотя хорошо осведомлены в вероятном существовании «OCR». И, тем не менее, они считают формат лучшим, хотя аналогичный результат можно получить в другом контейнере, даже в том, который ещё не родился. То есть, достаточно упаковать набор графических образов страниц, чтобы создать конкурента популярному формату.
Поэтому, «говоря абстрактно о преимуществе того или иного формата, следует точно представлять в нём текущий уровень качества контента».
Любой пользователь, попадая на сервер поставщика контента и сталкивающийся с тем, что книга предоставляется сразу в нескольких форматах, обязательно задаёт себе мысленный вопрос или пытается найти помощь со стороны — какой формат использовать, или какой из них лучше?
Лучшим всегда оказывает формат, который поддерживает устройство или программа для чтения, с учётом комфортного масштабирования или навигации. Родственные по возможностям форматы почти всегда можно конвертировать, если устройство имеет ограничения в их поддержке.
Можно смело утверждать, что для Kindle лучший формат — это MOBI (AZW, Kindle 8). Для Sony, Kobo, Barnes & Noble Nook и ряда других зарубежных устройств — лучше EPUB. Для отечественных и китайских устройств предпочтительнее формат FB2, а соответственно — лучше.
Форматы, защищённые DRM важны издателю, а конечный пользователь может забыть об этом «преимуществе», так как он не увеличивает комфорт чтения. DRM — это ключ на право чтения и ничего более.
Для крупных экранов и планшетных устройств подойдут любые форматы — текстовые и графические, так как экран может крупно показать читаемый фрагмент, а быстродействие и комфорт навигации позволяют быстро менять фрагмент на экране и листать страницы.
Очень трудно оценить лучший формат с точки зрения популярности, не имея точных цифр о количестве копий книг в цифровой форме. Может сложиться впечатление, что MOBI менее популярный формат, чем EPUB, хотя это не так и потребителей формата несколько десятков миллионов, что совсем не плохо! Иностранные производители, представляя свои устройства в России, очень часто включают поддержку FB2, не потому что формат является лучшим, а из-за высокой степени накопления контента в этом формате. И наконец, любой потребитель электроники скачивает с сайта производителя документацию в формате PDF и это за много лет превратилось в стандарт высокого качества поддержки и обслуживания потребителей во всем мире.
Не следует путать возможности форматов с программным обеспечением или гаджетами, хотя это надо учитывать при покупке устройства для чтения. Форматы сами по себе не осуществляют поиск по тексту, не начитывают его вслух. Это также верно, как овощи — ещё не готовый суп, а он, сам себя не съест и не похвалит!
Назначение форматов
Электронные книги описываются различными форматами данных, а их разнообразие зависит от назначения, возможностей, платформы, веса, кодировки, простоты или «универсальности» (последнее довольно часто субъективно). Потребителям не так важно уметь различать логически их принадлежность к целям и задачам, заменяя свои знания комфортом применения и доступностью контента в цифровом формате.
Очень важно понимать в какой формат пользователь может самостоятельно перевести свои документы, чтобы иметь возможность прочитать их с помощью различных устройств или с помощью специализированных программ. Не стоит отбрасывать в сторону возможность последующего редактирования оцифрованного документа. Если используется оцифровка книг, журналов или газет, а в последнее время ещё и статей из Интернета, то и здесь форматы могут использоваться по принципу простоты создания, архивирования и каталогизации, нежели целевого выбора и последующего комфорта чтения. Очень важно учитывать объем информации.
В результате контент может быть подготовлен фактически в любом формате, без определения качества, масштабируемости, «веса». Довольно часто использование форматов опирается на убеждение в принадлежности к чему-либо, чем на изначальную цель, которую закладывал в формат его разработчик.
Профессионалы могут поступать несколькими способами в зависимости от последующего качества применения и выделенных для этого ресурсов, в том числе и финансовых, а не только технических или людских:
• Создавать контент по природному происхождению и предназначению формата.
• Использовать формат ради последующей защиты, а не обязательного комфорта во время чтения.
• Или идти по самому короткому пути, как и обычный пользователь, упрощая создание цифрового контента, сокращая время, экономя бюджет. Для этого формат может быть выбран любой, лишь бы он мог быть доступен, и понимаем профессионалу.
• И самое неприятное свойство из всех перечисленных — неграмотность профессионала, который создаёт цифровой контент. Нет никакой разницы между созданием документа для чтения, но ради редактирования. Или наоборот, когда контент нужно сохранить для редактирования, а не для чтения в том виде, в котором невозможно создавать исправления и дополнения в тексте. На экране такой документ может выглядеть восхитительно и ради этого все создавалось неправильно.
Назначение форматов проще всего воспринимать правильно, если воспользоваться трактовкой термина — предназначение формата, определения того, ради чего нужно создать контент в определённом виде или, иначе говоря, «форме». В любом случае должна главенствовать конечная цель, которая сопоставляется с используемыми средствами (ресурсами в том числе) и возможностью последующего применения, хранения или всё одновременно.
Назначение форматов формируется за счёт нескольких свойств: возможности формата, предназначения, в которое включены свойства по созданию, редактированию и последующему чтению, причём следует учитывать конечную платформу для осуществления целей.
«Чтение» следует разделить на две части: комфорт функции и предварительный просмотр (ради ознакомления с материалом). Не всегда возможно совместить подобные свойства гармонично, или результат сводится к упрощению основной функции ради предварительного просмотра.
Здесь необходим реальный пример, чтобы чётко представлять различие.
PDF содержит в себе одну или множество страниц с контентом. RTF ничем не отличается в данном случае, хотя формат принципиально другой. Предварительный просмотр возможен с помощью вывода страницы на экран в любом объёме, то есть не обязательно демонстрировать всю страницу в полном размере. Достаточно видеть фрагмент, но при котором можно ознакомиться с содержимым, прочитать его или попросту рассмотреть. Сложность в том, что предварительный просмотр формируется по первой странице, по которой сложно определить содержимое всего документа. Всё это сводится к созданию крупной пиктограммы первой страницы.
Специализированные форматы содержат в себе дополнительные секции в структуре данных: анонс, трейлер, тизер.
Если представить электронную полку с книгами, то около обложек специализированных форматов можно вывести аннотацию, потому что она заранее известна и её не следует генерировать из основного текста. Прописана внутри данных и находится в специальной секции формата, а всем другим форматам доступна демонстрация обложки, создание крупной пиктограммы с текстом, случайное выдёргивание фрагмента после ключевого слова в тексте или после конкретной страницы и результат не предугадать заранее.
Основные предназначения форматов можно представить по типу:
• Просмотр — назначение форматов при просмотре подготовленного контента сводится к определению платформы для использования. Определяется электронный носитель или программное обеспечение для любого или специализированного устройства. Разница только в том, что создающий контент оператор подозревает конкретные ограничения при считывании формата.
• Возможности — определяются объёмом документа и разработчиком.
• Предназначение — предполагается потребителем и подразумевается разработчиком, который в свою очередь определяет степень открытости формата.
• Создание документа — определяется способом и его доступностью, технически и лично, или с помощью различных ресурсов, в том числе сторонней помощи (англ. «Freelance» — форма удалённой работы).
• Редактирование — определяются не только инструменты и программы для внесения исправлений, но и сама возможность, как часть предназначения формата. Для некоторых форматов возможности редактирования ограничены и могут применяться не для замены текста, а для редактирования графических образов и иллюстраций внутри формата.
Из указанных типов — все могут иметь ограничения в зависимости от технической реализации формата, которое сводится к защите данных (англ. «DRM» — технические средства защиты) или к сжатию определённых типов данных:
• Сжатие внедрения или связывания шрифтов и мультимедиа.
• Отдельное сжатие растровых изображений и текста.
• Сжатие самих «алгоритмов сжатия» растровых изображений.
• Использование встроенного механизма сжатия для всего документа и защита данных.
Назначение формата зависит от типа используемых данных:
• Векторные
• Графические
• Текстовые
• Мультимедиа
Каждый тип данных поддерживает цветовую модель или их гибрид: RGB, CMYK, Grayscale, Lab, Duotone, Bitmap.
В формат могут быть встроены или описаны для использования предполагаемые шрифты. Обычный и типичный набор: Times, Courier, Helvetica, Symbol, Zapf Dingbats. Можно описать шрифты по типам, а не конкретно по имени: рубленый, с засечками и символьный.
Для сокращения ошибок, но ограничения масштабирования, некоторый текст в формате может быть заменён на другой тип. Например, математические формулы описанные текстом с использованием символьных шрифтов могут быть заменены иллюстрацией. Таким образом, текст заменяется графическим типом данных. Такой подход изменяет набор инструментов для дальнейшего редактирования, и масштабирование текста может быть непропорциональным по отношению к иллюстрации.
Графические форматы могут масштабироваться на экране пропорционально изображению, но если страница сделана полностью в графическом виде, то масштабирование может быть увеличено за видимые границы экрана, тем самым используется не увеличение масштаба содержимого, а фрагментация страницы в другом масштабе. Графический текст поддерживает жёстко заданные границы полей и страниц, в отличие от текстовых форматов, которые могут увеличивать общее количество страниц в документе в зависимости от размера начертания шрифта.
В зависимости от формата данных внутри структуры документа некоторые форматы лучше использовать для определённого контента:
• TXT — используется только для текста без разметки, типографикой в данном случае будет заниматься программное обеспечение.
• EPUB, FB2 и MOBI — содержат в себе смешанный тип данных, поэтому подходят для масштабирования текста во время чтения с сохранением заложенной разметки. Типографикой будет заниматься программное обеспечение, но оно заранее знает выделение фрагментов текста. Переносы слов обычно не описываются форматом, и этим точно будет заниматься только программное обеспечение по запрограммированному алгоритму естественного языка текста.
• PDF — следует описать отдельно, так как формат хоть и можно отнести к графическому типу, из-за жёсткой разметки текста и иллюстраций, но при наличии текста внутри структуры возможно масштабирование с потерей разметки. Класс TextFlow описывает содержимое текста и внутри есть описание параграфа, ссылок, графики и разделителей.
• DJVU — графический формат, хотя может содержать в себе дополнительные элементы с текстовыми данными. Популярность формата привела к тому, что внутри документа фактически находятся только графические образы страниц и ничего более. С подобной задачей справится любой контейнер с набором иллюстраций в строгой последовательности страниц.
• CBZ и CBR — это как раз наглядный пример контейнера с графическими данными, где название файла соответствует номеру страницы (например, 001, 002, 003 и так далее). В качестве контейнера используются популярные архиваторы ZIP или RAR (последняя буква в обозначении формата).
Таким образом, форматы определяют тип используемых данных и по ним можно предположить предназначение форматов.
EPUB, FB2 и MOBI — современные форматы для чтения литературы в текстовом виде. Особой разницы для потребителей контента в них не заложено. Они в равной степени могут почти одно и то же. Изменение размера шрифта позволяет адаптировать текст под размер экрана носителя с учётом предпочтений конечного пользователя. Для профессионалов это форматы, в которых набор текста может быть сложен для табличных и формульных данных. Это трудоёмко и требует особого внимания и терпения. Часто эти типы данных конвертируют или сохраняют в графическом формате, чтобы сократить время набора и ограничить количество вероятных ошибок при сборке итогового документа. Таким образом, внутри масштабируемого формата могут быть данные, которые не подлежат масштабированию с переносом строк.
Графические форматы, к которым сейчас можно отнести почти всё, что в большей степени содержит факсимильный образ страницы, как правило, пригодны для печати. Удобство чтения форматов зависит от размера экрана электронного носителя. От комфорта — не только при увеличении или уменьшении фрагмента страницы, но и от скорости управления документом и этими функциями.
Форматы для комиксов CBZ и CBR хоть и являются полностью графическими, но лучшие существующие программы автоматически определяют границы кадров и могут по отдельности увеличивать на экране только их зоны. Не всегда возможно комфортное прочтение текста в «баблах», но это в основном в тех комиксах, которые создавались без учёта цифровой эпохи и были рассчитаны для чтения только в оригинальном размере печатной страницы.
Такие форматы как DOC или RTF годятся для последующего редактирования, но это ещё не значит, что программное обеспечение для чтения поддерживает функции не только полнофункционального редактора, но и даже самых простых возможностей — замены отдельных букв, слов, предложений и так далее. Из этого следует сделать вывод таким образом, что не существует универсально удобных инструментов для чтения и редактирования. В некоторых случаях функции доступны, но не обеспечивают должного комфорта.
Мнение об «универсальности форматов» — это тоже часть предназначения, но не их носителей. Например, PDF может быть удобен как формат с возможностью последующей распечатки на принтере или для чтения на большом экране компьютера, планшета, но плохо совместим с медлительными компактными устройствами, на которых удобно читать, но только в текстовом формате.
Поэтому, назначение форматов следует привязать между источником получения контента и носителем, где важным фактором, является «комфорт» приобретения и дальнейшего использования контента.
Полностью графические форматы JPG, PNG, TIFF и так далее, также могут применяться для чтения. Их назначение не будет отличаться от графических форматов описанных выше, но с очень важным ограничением — поддерживается только одна страница иначе это уже контейнер.
Проприетарность форматов
В начале взросления категории «электронные книги», приблизительно с 1998 по 2007 годы, существовала типичная схема развития, когда компания, выходящая на рынок, обеспечивала себя и для себя полный спектр необходимых элементов бизнеса: создавалось собственное устройство, формат, контент, доставка. Всё это необходимо было сделать с (почти) полного нуля или приобрести готовое, если такое вообще существовало. Это поведение можно было назвать трендом — компании хотели выйти на рынок электронного чтения и они сами создавали условия для решения конечной задачи, изобретая замкнутый круг полного цикла услуг и решений.
Именно в этот момент появилось несколько «проприетарных форматов» и это определение не совсем корректно с современной точки зрения. Потребители часто вводят себя в заблуждение, причисляя такие форматы к ущербному типу и даже являющиеся в чём-то непригодными для реального использования. В большинстве случаев это недостаток информации и выработанных привычек.
Необходимо рассмотреть несколько вариантов развития проприетарных форматов:
• Sony с самого первого устройства Librie использовала формат BBeB, специально разработанный компанией для собственных задач. Причём он делится на несколько типов — BBeB Book для книг и BBeB Dictionary для словарей. Книги существовали в двух вариантах — расширение файла LRF для книг BBeB Book и LRX для шифрованного варианта BBeB Secure Book. Если отбросить все эти нюансы в сторону и наглядно представить единый формат, в котором Sony распространяла книги и фактически заставляла конвертировать любые другие файлы в этот формат, чтобы прочитать на её устройстве, то это некий образец того, чем является проприетарный формат. Со временем BBeB не смог выдержать конкуренцию и устройства Sony стали использовать EPUB, а поддержка BBeB хоть и существовала в устройствах, но стала замалчиваться. Через несколько лет потребители полностью отказались от формата BBeB и даже забыли о нём. Потребовалось время, чтобы привыкнуть к новым правилам игры.
• Другой образец проприетарного формата — компания Amazon. Она не стала придумывать то, в чем за 3 года до появления первого устройства была не сильна и просто приобрела компанию MobiPocket заранее, со всем необходимым. Наследством стал формат MOBI и остальное, в том числе пригодились опытные специалисты по созданию и продаже цифрового контента, что до развития массового Интернета было попросту невостребованным. В контент больше вкладывали, чем зарабатывали. Amazon по тем временам использовала невероятный подход — она сделала формат незаметным. Он как бы есть — для тех, кто читает собственный контент, но его как бы нет — для тех, кто приобретает готовые книги в магазине Amazon. Формат MOBI, переименованный в AZW, существует до сих пор и развивается. Современным продолжением стал формат Kindle 8 с учётом мультимедийных данных, которые могут быть внедрены в контент. Для потребителя это по-прежнему «стелс-формат» (анг. Stealth — снижение заметности, распознавания, видимости), который есть и отсутствует одновременно.
О проприетарных форматах можно сделать важный вывод — это работает, когда формат становится массовым, востребованным внутри системы сервиса. Он не сдерживает развитие сам по себе, форматы развиваются исторически медленно.
Со страхами использования «проприетарных форматов» стоит разобраться отдельно.
«Проприетарный формат» — это принадлежность формата конкретному собственнику, как и права на дальнейшую разработку и использование на различных электронных носителях. Синонимами «проприетарного формата» можно считать свойства — закрытый, несвободный или частично свободный, частный, принадлежащий конкретному собственнику, необходимость лицензирования и так далее. То есть всё то, что можно ассоциировать с правами конкретного собственника, а не с понятием «технической ограниченности».
Сейчас определение «проприетарного формата» (по первичному значению) уже почти полностью стало размытым. Можно сказать, что существует только один формат MOBI, но, по сути, ничто не мешает читать книги в этом формате на других устройствах, если не используется защита контента, так как это требует регистрации носителя в определённой системе, что тоже технически возможно. Например, книги можно читать в устройствах под управлением операционных систем Android или iOS, и они могут быть сделаны кем угодно, а не только Amazon и не обязательно под брендом Kindle.
История показала, что устройства разделились на две группы по другому принципу: с поддержкой одного или множества форматов. Именно существование устройств с поддержкой одного формата является потребительским страхом или недостатком, причём на территории конкретного локального рынка.
В большинстве случаев, потребители многоформатных моделей устройств используют в 70 % случаях один единственный формат и какой-то ещё, то, что называется «на всякий случай». Например, 16 % потребителей читают в формате PDF, но внутри этой группы соотношение приверженности к одному формату сохраняет пропорции к использованию форматов. Найти устройство без поддержки PDF очень сложно, даже среди одноформатных устройств, это не говорит о качестве поддержки, просто как факт, а отсутствие поддержки DJVU довольно распространено даже среди многоформатных устройств, но также не говорит ничего о качестве чтения и дополнительных сервисов внутри устройства.
Самое интересное, что многоформатные устройства часто грешат качеством поддержки каждого формата в отдельности. Чаще это сводится к понятию «может открыть» и ничего более. Некоторые устройства поступают ещё более некорректно — очищают открываемый формат от лишних данных и тегов. В результате книга в формате FB2 может выглядеть на экране как «просто текст» в формате TXT, или лишена в какой-то пропорции различных возможностей — оглавления, поддержки таблиц и так далее.
Представить такую ситуацию с одноформатными устройствами сложнее. Как правило, они поддерживают 100 % возможностей формата и его структуры, а разница заключается только в количестве сервисных функций — наличие словарей, переносов слов по слогам и так далее, что не всегда определяется форматом или необязательно. Найти такие устройства без поддержки сносок фактически невозможно, другое дело, что это выглядит или работает не всегда так, как предполагается или хочется пользователю.
Чаще всего к одноформатным устройствам негативно относятся те локальные рынки, на которых исторически закрепилось желание обеспечивать себя контентом самостоятельно, но заранее не известен источник. Предполагается, что книги где-то есть и в каком-то конкретном или нескольких форматах. Эти локальные зоны не очень любят единые источники и воспринимают их как угрозу некой свободе выбора, слова и даже свободному распространению информации.
Если представить некий локальный рынок, на котором большинство читает в формате EPUB, FB2 или MOBI — разница будет заключаться только в частоте использования конкретного формата и доступности контента. Для конкретного рынка роль «проприетарного формата» уже становится не актуальной. Уже не так важно — какой формат главенствует, так как существование других форматов отрицается, недооценивается или менее распространено, что типично для локальных рынков.
Если представить устройство, которое поддерживает или будет использоваться для одного формата (и PDF ради самоуспокоения, на всякий случай), то оказывается, что в современном мире нет особой разницы между форматами на пользовательском уровне.
Представьте устройство, например от Barnes & Noble, которое поддерживает только формат EPUB. Есть ли разница с устройством от Amazon, которое поддерживает только MOBI? Точно также отечественный рынок с удовольствием использует в большинстве случаев только FB2 и не чувствует себя при этом чем-то ущербным.
Разница заключается только в предполагаемом доступном количестве контента в определённом формате. Но сегодня, когда книги в формате MOBI доступны не только в Amazon и никто не отменял конверторы, особой разницы между форматами уже нет. Существует различие в технической подготовленности и осведомлённости потребителей. Уже неважно насколько форматы проприетарные или свободные. Форматы становятся рекламой книг, устройств и сервисов.
Когда на отечественный рынок выходят мировые гиганты с собственными устройствами и программным обеспечением с поддержкой EPUB, ибо другое им неведомо, формат FB2 уже чувствует мощное давление, даже беспомощность, а развитие отечественных устройств не гарантирует преимущество только отечественному формату и это ведёт к забвению или к необходимости развиваться формату куда-то дальше, хотя для этого нет опоры и необходимости.
«Проприетарность форматов» становится выгодным мифом для продвижения товаров и услуг с собственными качествами, или попросту заблуждением потребителей. Существует очень много пользователей электронных устройств, которые не могут справиться с форматом EPUB с поддержкой DRM, хотя сам формат является свободным и очень распространённым. У таких потребителей схема работы с форматом типична — получить, загрузить и читать, и в эту схему не вписывается что-то другое, дополнительные действия. По аналогии с устройством — купил, зарядил и читай! Что ещё нужно знать, чтобы воспользоваться контентом? Всё остальное воспринимается как «отвратительный сервис» со стороны агрегатора или его контент— и сервис-провайдеров. Но такова реальность — потребители сами создают ложные убеждения в том, как это всё работает, и после этого, что естественно, остаются разочарованными результатом.
Но DRM сам по себе не проблема, если его правильно преподнести как сервис. Если программа для чтения защищённых книг настолько хороша, что пользователи её применяют каждый день, то потребитель не сталкивается ни с какими проблемами и не видит разницы между простым и защищённым форматом. Поэтому, очень важно, чтобы и распространители контента не заблуждались о качестве своего сервиса.
Для выбора «предпочитаемого формата» нужно определиться с источником контента и убедиться в том, как его поддерживает устройство для чтения. Всё остальное в современном мире уже не так важно, или устарело в определениях.
Сервис начинается с правильного выбора.
Форматы электронных книг
Общие сведения
При выборе устройства для чтения, причём можно сказать умышленно — «неважно какого», специализированного или только адаптированного для чтения (планшет, смартфон и так далее), потребитель сталкивается с серьёзной проблемой выбора подходящего «формата книг». Это очень важная характеристика, но на самом деле — довольно простая тема. Разобраться в ней не сложно, если мой читатель понимает свои потребности и не преувеличивает значение «форматов» для этих целей. Основы таких знаний помогут разобраться с уже имеющейся стереотипной информацией и понять, что является реальностью, а что только воображением, благодаря самосозданным мифам.
Формат книг — это как заклинание. «Печатный текст» с типографской разметкой упакован внутри магической оболочки. Но это всё происходит после того, как книга написана.
При чтении в нашу голову попадает текст в виде образов или значений. Эмоции и интонации «рассказанного сюжета» создают визуальное представление. Восприятие можно усилить или ослабить. Поставить акцент на фразе или разделить текст на главы. Как бы писатель ни поступил, он хочет донести до читателя не только определённый сюжет, но и смысл каждой фразы — шёпота, крика или даже сарказма.
Электронное устройство для чтения — сундучок для книг. Для множества. Самая простая форма упаковки текста в единый блок — архивирование. Эта процедура экономит место на диске, но не вмешивается в разметку текста.
Чтобы сохранить структуру печатной книги требуется набор «тегов» в начале и конце выделенной фразы, абзаца или только одной буквы. Чтобы устройство понимало, какая фраза в тексте относится к «названию главы», этот набор слов также размечается тегами, как «кавычками» — в начале и в конце фразы.
Каждый отечественный потребитель, или почти каждый, хочет иметь устройство, которое поддерживает максимальное количество форматов. Теоретически — это ничем не подкреплено, кроме желания купить универсальное устройство. Также думает производитель, неважно в каком формате будет читать потребитель, устройство будет рассчитано на поддержку большого количества форматов и это «на всякий случай».
Зарубежный производитель электронных книг, прежде всего, продаёт контент, а устройство это инструмент для чтения, носитель информации. Поддерживаются обычно только два формата: для книг и формат PDF, как средство для чтения «частных» документов и способ для привлечения новых потребителей.
Бумажная книга печатается на отдельном листе с двух сторон, и вся получившаяся стопка брошюруется в единый блок. Понятие «страница» для электронной книги — это видимый на экране текст и не более того.
Разные производители придерживаются собственные стандарты для «нумерации» страниц. Кто-то считает текст «экранными страницами» и при изменении размера шрифта количество страниц пересчитывается устройством. Таким образом, страниц становится больше или меньше. Другой производитель может использовать универсальную форму подсчёта, например, в процентах от общего количества знаков. В данном случае изменение размера текста, который влияет на количество привычных страниц, в процентном соотношении не меняется, но найти нужную страницу крайне сложно и для этого читатель ищет текст глазами. И наконец, метод, который использовался Amazon изначально для своего устройства Kindle — это крошечный блок, стандартизированный по количеству знаков, где учитывается только количество знако-мест (в том числе пробелы и знаки препинания), а не только то, что помещается на экране. При таком подходе очень просто переходить от одного устройства к другому, читая одну и ту же книгу, введя необходимое цифровое значение на экране. Количество страниц не зависит от размера букв или текстового окна (место для текста с учётом отступов от края страницы/экрана).
Электронная страница, на самом деле — это не отдельные листы текста, а длинный рулон. Даже абзац текста — это длинная череда слов и предложений оформленная единым блоком, где в начале и конце стоят теги. Впоследствии устройство разбивает текст построчно и постранично, используя разметку. Конечный тег даёт команду на осуществление какого-либо последующего действия. Например, если интерпретатор видит «конец абзаца», то следующее действие «начало нового абзаца». В то же время, не существует тега «конец страницы», вместо него интерпретатор сам определяет, нужно ли начать новую страницу, если следующий тег «название главы».
Внутри любого формата находится структура документа. Именно незнание структуры приводит к непониманию важности и бесполезности форматов для определённых задач. Например, очень трудно прямо ответить на вопрос: «какой формат лучше, например, FB2 или EPUB»? Ответ на самом деле зависит от доступности книги в одном из этих форматов. Тот и другой формат довольно легко конвертируются. FB2 может быть преобразован в EPUB и наоборот. Если внутри файла нет специфических данных для другого формата, то преобразование происходит без потерь.
По статистике — 16 % читателей использует только формат PDF. Трудно представить, но именно такое количество читателей в какой-то промежуток времени ограничивает себя чтением специфической литературы. Статистика увеличится ещё более серьёзно, если представить, какая литература читается в этом формате. Найти журнал в формате PDF гораздо проще, чем в FB2 или EPUB. Но те, кто покупает журналы и делает это регулярно, чаще читают в узкоспециализированном формате, который даёт представление не только для графических элементов, но и может содержать скрытый текст. Подобный ZINIO формат используется для специальной программы.
Основное отличие FB2 от других форматов заключается в том, что он был изначально задуман как разметка текста и ничего более. Внешним видом текста на экране занимается программный интерпретатор.
FB2 создан на основе XML для разметки текста. Разработчик формата придумал простой ход — исследовал строение книги и воспроизвёл его в тегах. Со временем часть тегов оказалась ненужной, а другая часть, наоборот, была добавлена.
Если посмотреть книгу в формате FB2 с помощью текстового редактора, то, можно будет увидеть содержание обычного TXT файла, где абзац окружён тегами. Также — глава, название книги, формулы, таблицы и так далее.
Можно считать, что EPUB — это некий, более коммерческий аналог FB2, но, по сути, читателю должно быть безразлично — какой из этих форматов использовать. Главное — это доступность книг. И очень важно, чтобы формат поддерживала программа или устройство.
Форматы книг делятся на три типа: «простой», «текстовый», «графический».
Ярким представителем «простого» типа можно назвать формат TXT. Ничего кроме текста и маркера «конец строки» (раньше, когда ещё знали, что такое «пишущая машинка», говорили: «перевод каретки»). TXT может быть в одной из общепринятых кодировок. Современное представление о форматах рекомендует использование кодировки unicode (UTF8) для поддержки множества языков и совместимости между платформами.
«Текстовый» тип, к которым относятся FB2 и EPUB, содержит в себе не только текст, но и оформительскую разметку, графические иллюстрации, ссылки и так далее. В таких форматах выделяется жирный и наклонный текст, таблицы и стихи, сноски и заголовки. Основное преимущество — возможность масштабировать текст по размеру, изменять расстояние между строками или регулировать «текстовое поле», то есть расстояние от текста до края экрана. Можно сохранять типографику даже при разбиении страницы на несколько колонок. Лишь бы это поддерживал интерпретатор текста.
«Графический» формат проще всего представить в виде «факсимильного» издания, когда с полученным текстом ничего уже сделать нельзя, кроме как увеличить фрагмент на экране. Считайте, что каждый лист это отдельная фотография, отпечаток или лист из факса. И в данном случае неважно, содержит ли PDF текст, а не его графическое изображение единой страницей. Функция Reflow позволяет масштабировать текст, если он есть внутри файла, но в ущерб вёрстки. Если текст верстался в отдельных окнах или колонках, то ничего хорошего при Reflow не получится. Текст смешается в нечитаемое пятно. В данном случае увеличивать лучше с помощью «лупы» для изменения размера изображения всего листа, а не отдельного текста.
Основным и распространённым «обманом» при выборе устройства с множеством поддерживаемых форматов — является игнорирование разметки. В списке характеристик может быть перечислено огромное количество форматов, но не факт, что они поддерживаются на должном уровне. В данном случае существует три градации качества: полное или частичное игнорирование тегов разметки, а также наоборот, полная поддержка разметки текста. Бывает так, что в характеристиках значится формат FB2, а на экране вместо него «простой текст» без разметки. Был FB2, а стал TXT. Интерпретатор удалил теги, тем самым облегчив себе задачу по выводу текста на экран. Это наиболее распространённый способ игнорирования тегов, разница только в том, сколько и какие теги игнорируются.
Сказанное не относится к сервисным функциям устройств, они везде разные. Их может быть много, ради увеличения комфорта чтения, а может быть мало, ради использования слабого процессора или за счёт элементарной лени разработчика.
Также, не стоит путать сложный интерфейс с богатством функций и настроек. Есть устройства, которые визуально отличаются интерфейсом, но делают одно и то же. Сложный интерфейс не говорит о том, что устройство может гораздо лучше, чем устройство с простым и понятным интерфейсом. Разработчики умышленно могут создавать сложные интерфейсы, чтобы вводить в заблуждение. Проще всего определять возможности устройства с помощью подсчёта количества функций: делает ли типографскую разметку текста, можно ли изменить текстовое окно, или расстояние между строк и так далее.
При выборе устройства нужно заранее предполагать, какой текст будет читаться и из какого источника будет доставляться контент. Если файл книги подготовлен профессионалом, то для чтения художественной литературы достаточно одного из форматов: FB2 или EPUB. И неважно, какого из них. Эти форматы ничем особым не отличаются от AZW (MOBI), который используется в Kindle. Особой разницы для потребителя в форматах нет, кроме распространённости их на локальном рынке.
Для более сложно-оформленного текста, такого, как научная или техническая литература, европейским читателям лучше использовать PDF или DJVU. Не потому, что эти форматы лучше, а потому, что именно в них обычно распространяются в Интернет. Разница в том, что иностранные издательства оформляют такие книги в «текстовом» формате, а наши читатели используют факсимильные копии, то есть, кем-то отсканированные постранично, как было в бумажном оригинале.
DJVU отличается тем, что в его составе отдельные листы страниц, упакованные в единый блок. Сканируется каждая страница книги в высоком разрешении и с последующим сжатием для компактности общего размера файла. Далее, страницы собираются в едином блоке. Подобный трюк можно сделать и в формате PDF, но DJVU прижился лучше. Оглавлением, индексом и прочими особенностями графических форматов, забивать голову не стоит. В большинстве случаев — это дешёвый и быстрый вариант копии бумажной книги.
Также работает CBZ и CBR — форматы для комиксов. Каждая отдельная страница в одном из графических форматов, например JPG, именуется по правилу «трёх цифр» — 001, 002, 003, 004 и так далее. Все отсканированные файлы упаковываются архиватором ZIP или RAR. Именно последняя буква в названии формата Z или R говорит о том, каким архиватором упакованы страницы.
Из сложного «текстового» формата почти всегда можно сделать «простой текст». В истории была только одна программа — BookDesigner, которая из TXT могла интуитивно создать сложную разметку текста. Она пыталась определить название главы, окончание абзаца, преобразование в наклонный или жирный текст. Это делалось не по воле и задумке автора книги, а как бы предполагалось программой, что так может быть, раз в тексте написано: «Глава 1» или абзац начинается с нескольких звёздочек: «***» или «* * *», если со знака «*», «—» или «» и абзацы повторяются — следовательно, используется перечисление неких характеристик или условий.
Ранее были тексты, которые распространялись в модемную, доинтернетовскую эпоху. Например, фраза могла начинаться и заканчивать знаком подчёркивания «_», тогда BookDesigner интерпретировал это как наклонный текст. И так далее, если мой читатель заскучал от перечислений, и стало скучно. Добавлю только, что подобную разметку сейчас называют «Markdown».
Пропорции экрана влияют на просмотр «графических» форматов. Для «текстовых» это абсолютно неважно — как заполнить буквами поверхность электронной страницы. Обычно пропорции рассчитывались по ряду Фибоначчи, или «золотого ряда» чисел. Каждый член этого ряда равен сумме двух предыдущих: 3, 5, 8, 13, 21 и так далее. Зная, что первыми идут цифры 3 и 5, легко догадаться, что следующей будет 8. И соответственно пропорциями страницы могут быть соотношения 3:5, или 8:13. Но не стоит это путать с размерами страниц, как в полиграфии, где книги могут иметь физический размер — от сверхмалой до сверхбольшой формы издания.
Это может показаться лишним знанием, когда нельзя выбрать пропорции экрана. Практически все экраны E-Ink на 5, 6 и 9.7, а также 13,3 дюйма имеют пропорции близкие к печатному листу бумаги и они почти одинаковы. Разница только в физическом размере. Исключение составляет экран размером 7 дюймов. Подобные устройства можно пересчитать по пальцам. Раз, два и всё!
Типографика — очень важна. Она влияет на настроение и интонацию передаваемого в печатном виде текста. Форматы обязуются доносить первоначальный смысл автора до своего читателя. Им не обязательно поддерживать ударения в словах или переносы по слогам. В большинстве случаев — это поддержка на уровне буквенной разметки и относится к интерпретатору.
При выборе «подходящего» для чтения формата очень важно определить, чем можно пожертвовать. Не все программы или устройства могут корректно и точно отображать не только иллюстрации, таблицы, но и теги самого текста. Есть часть читателей, которым это и не нужно. Мало того, они не могут сравнить несколько устройств между собой, поэтому считают лучшим тот, которым уже владеют.
При выборе устройства важнее знать, что ограничение поддержки качества и количества форматов — является умышленной жертвой или обманом производителя? Во всех случаях, в списках характеристик будет «безкачественное» (анг. «Without Quality») определение «поддержки и количества форматов».
Можно задать ещё один и не последний вопрос — влияет ли выбранный для чтения формат на продолжительность автономной работы устройства?
Если не учитывать некачественные устройства, сами по себе, то ответить надо так — все зависит от того, как и что делает устройство во время чтения. Устройство может брать «чистый» формат и перестраивать его отображение для вывода на экран. Для этого необходимы ресурсы процессора.
Есть и был — другой способ, когда форматирование создавалось в компьютере, а устройство получало не структуру книги, а готовый машинный код для отображения на экране. Таким способом экономится не только время обработки формата устройством, но и можно создать значительно дешевле железную часть электронного аппарата за счёт «слабых» процессоров и программного обеспечения. Нагрузка ляжет на источник возникновения книги.
Формат действительно влияет на продолжительность работы устройства, но честно говоря, это стыдно слышать и сообщать в XXI веке.
Если пользователь устройства не обременён вопросом «как читать» и больше волнуется о том «что читать» — можно легко понять, что важнее качество, а не количество поддерживаемых форматов.
Производители могут искусственно придумать собственные форматы и вписать их в характеристики устройства. Сделать на этой основе красивую рекламу — «мировой рекорд по количеству поддерживаемых форматов»! Но будет ли читателю легче от той мысли, что любая книга, в любом формате — открывается в течение нескольких десятков секунд? Этого не происходит с бумажной книгой, и быть не должной с электронной. Достаточно просто представить время открытия бумажной книги на нужной странице и опираться на этот показатель, как на «стандарт де факто».
После полученной информации о небольшом количестве перечисленных форматов следует задать последний вопрос — годится ли устройство для планируемой задачи?
Поддержку форматов конкретным устройством можно проверить в магазине или у реальных владельцев. Можно стать тем самым «другом», который купит первое попавшееся устройство и расскажет всем о его «преимуществах». Другие, надеюсь, постараются лично убедиться в качестве отображения текста на экране, прежде чем решатся на покупку. Приходите на встречи клуба «The-eBook» во множестве мест на этой планете и поинтересуйтесь не только мнением владельцев устройств, но и сравните их эмоции со своими ощущениями. Они могут быть и будут разными.
Краткое описание форматов
Популярные текстовые форматы
EPUB
ePub (Electronic Publication) — изначально открытый формат электронных книг, разработанный Международным форумом по цифровым публикациям IDPF.
Файлы в этом формате имеют расширение EPUB.
Первоначальный вариант — Open eBook Publication Structure или «OEB» был задуман в 1999 году, релиз EPUB в 2007 году и с тех пор остаётся самым популярным и распространённым форматом во всем мире по количеству публикаций.
Формат ePub используется, если электронный текст является основной и главенствующей частью документа. Формат удобен для быстрой публикации в электронной форме из подготовленной заранее вёрстки для традиционной печатной книги.
В последнее время экспорт в формат EPUB используется в популярных текстовых редакторах и специализированных программах для писателей.
Компания Adobe создала много предпосылок для того, чтобы профессионалы отказались от ранее популярной программы Quark Express и перешли на Adobe InDesign. Немаловажную роль сыграла поддержка финального экспорта в формат EPUB, как способ цифровой публикации.
Adobe активно продвигает формат за счёт популяризации собственного движка для мобильных устройств и средств защиты DRM. Подобную активность не следует путать с проприетарностью формата EPUB, который не принадлежит компании, но наличие собственного движка теоретически позволяет внедрять в формат не утверждённые стандарты, как и форсирование коммерческого использование EPUB3, так как единый рабочий движок может поддерживать спецификации всех современных версий формата.
EPUB позволяет издателям производить и распространять цифровую публикацию в одном файле, обеспечивая совместимость между программным и аппаратным обеспечением, необходимым для воспроизведения цифровых книг и других публикаций с «плавающей вёрсткой». Финальное формирование изображения на экране отводится программному обеспечению компьютера или устройства.
Контейнер EPUB содержит электронные тексты в форматах xHTML, HTML, описание издания в XML. Графические элементы, включая векторную графику (SVG), размещаются в директориях входящих в состав единого контейнера. Поддерживаются встроенные шрифты, таблицы стилей и т. д.
Официальный сайт: www.idpf.org
MOBI, AZW, KINDLE 8
AZW (сокращение от Amazon) — формат, который получила Amazon в качестве «наследства» от приобретения компании Mobipocket, буквально за 3 года до появления первого устройства Kindle. Этот формат — образец того, как Amazon планомерно и точно начала захватывать и завоёвывать рынок электронных книг. Все что сделала компания Amazon с самим форматом — переименовала расширение MOBI в AZW. Впоследствии компания начала самостоятельную разработку формата «Kindle 8» для поддержки мультимедийных изданий. Поддержка сторонними устройствами формата MOBI не означает, что они поддерживают Kindle 8, так как это совершенно разные форматы.
Файлы в формате MOBI для устройств Kindle имеют расширение AZW.
Формат AZW, если учитывать историю MOBI — является наиболее старым, известным и хорошо продуманным книжным форматом. Пользователям не стоит его бояться и тем более недооценивать. AZW поддерживается не только компанией Amazon. Книги в этом формате можно приобрести в отечественных онлайн-магазинах. Разница только в том, что Amazon не продаёт файлы «на вынос», а доставляет книги непосредственно в устройство для чтения, даже если покупка сделана на сайте amazon.com с помощью браузера настольного или мобильного компьютера. При таком способе, читателям не интересно и не нужно знать «какой формат поддерживает их Kindle». Устройства поддерживают «книги», а не «файлы».
AZW ничем не хуже и не лучше EPUB или FB2. Формат относится к той же группе форматов текстового происхождения с книжной разметкой. Поддержка DRM не является приоритетной для читателей и это качество AZW могут оценить только издатели.
Официальный сайт: www.amazon.com
FB2, FB3
FB2 (Fiction Book ver.2) — полностью открытый формат электронных книг, свободный от каких-либо отчислений, изначально разработанный группой энтузиастов во главе с Дмитрием Грибовым, Михаилом Мацневым и Марком Липсманом на протяжении с 1999 по 2001 годы. В 2002 году, через 3 года после начала разработки формата, был представлен финальный вариант второй версии формата «Fiction Book», одновременно с открытием небольшой библиотеки fictionbook.ru.
Формат создаёт электронную версию книг в виде XML-документов, где каждый элемент структуры книги обрамляется тегами, как «кавычками», в начале и конце каждого элемента. В отличие от некоторых других форматов — FB2 на данный момент не поддерживает DRM.
Файлы в этом формате имеют расширение FB2 или FB2.ZIP, если в качестве контейнера используется архиватор ZIP.
Стандарт призван обеспечить совместимость с любыми устройствами и форматами для воспроизведения цифровых книг и других публикаций с «плавающей вёрсткой». Документы содержат структурную разметку основных элементов текста, анонс книги, а также могут содержать вложения с двоичными файлами, в которых могут храниться иллюстрации и обложка. Финальное формирование изображения на экране отводится устройству или программе.
Для популяризации формата, Дмитрий Грибов основал открытую библиотеку с элементами автоматической обработки поступающих публикаций. В FB2 имеется информация о книге в виде, пригодном для автоматической обработки, а также для конвертации в другие форматы.
FB2 является предпочитаемым форматом для Восточной Европы и Азии. Формат используется как основа, из которой, возможно конвертировать одну книгу в несколько форматов.
FB3 — следующее поколение, контейнерный вариант формата, удобен для распределённой сборки документов, где отдельные части могут обрабатываться параллельно несколькими участниками вёрстки. Этот формат предрасполагает использование DRM, но на момент написания книги не поддерживается различными устройствами или программами.
Дмитрий Грибов до сих пор поддерживает разработку формата FB2 и контейнерную версию FB3, которая применяется только для внутренних целей и задач компанией Литрес.
Информационное сообщество: www.fictionbook.org
Специализированные форматы
PDF (Portable Document Format) — кросс-платформенный формат электронных документов, созданный компанией Adobe Systems с использованием ряда возможностей языка PostScript. В большинстве случаев формат предназначен для представления в электронном виде полиграфической продукции, факсимильных документов и анкетных данных.
Изначально программное обеспечение Adobe для чтения и создания PDF было платным, что делало формат непопулярным. Первая версия появилась в 1993 году.
Файлы в этом формате имеют расширение PDF.
Традиционным способом создания PDF документов является виртуальный принтер — печать в файл для распространения в электронной форме.