Вторая редакция - январь 2003 г. Поскольку с момента
написания первого варианта многое изменилось, по просьбам пользователей
статья адаптируется под настоящий момент. К тому же, отдельные вебмастера,
считающие, что все, находящееся в Интернете или размещенное на пиратских CD,
может быть использовано на их вебсайтах без всякого зазрения совести, начали
размещать эту статью не ставя об этом в известность ни вебмастера СКР, ни
меня самого. Не стоит так делать, никто не собирается ложиться животом на
материалы СКР и кричать "Не дам!", но элементарная порядочность говорит о
необходимости хотя бы спросить формальное разрешение на публикацию у автора
или просто сделать ссылку на СКР, без перетаскивания материалов к себе на
сайт.
Дежавю, применительно к компьютерам,
представляет собой новый графический формат, весьма экономичный. Как и что в
нем устроено, вы можете подробно ознакомиться в нескольких статьях,
размещенных на странице
Ликбез по DjVu. Там же можно понять, почему djvu активно
используют на сайте СКР, в первую очередь из-за небольшого объема и хорошего
качества файлов. В мою задачу не входит его реклама или критика, а критика,
желательно аргументированная и не переходящая на персоны, будет от вас
самих, что уже было, но крайне редко, а в настоящее время уже не
встречается.
Аргументом критиков служит приблизительно такое
утверждение: "Мои знакомые попробовали и сказали что это SUXX, лучше бы вы
пользовались более привычными форматами, вот ... это RULEZZ!". Особенно
упирают на популярный jpg, в этом случае можно сказать только одно - авторы
этих писем никогда не занимались созданием черно-белых графических файлов,
куда девать "артефакты" после такой операции с jpg? Я мог бы привести
таблицу размеров различных форматов файлов для одного и того же изображения,
но в этом нет большой необходимости, жизнь уже взяла свое и djvu стал
использоваться шире, чем несколько лет назад. Многие сайты, не имеющие
отношения к радио и графике, начали публиковать статьи по djvu и выкладывать
материалы в этом формате. Если интересно, то наберите в Google или другом
поисковике одно слово "djvu" и читайте только ссылки на русскоязычные
ресурсы Интернета, станет ясным растущая популярность этого
формата..
Никто никогда не утверждал, что djvu - это альтернатива
всем существующим графическим форматам, отнюдь! Но в области создания и
хранения черно-белой, полутоновой и отчасти цветной документации, пока ему
нет равных. В первую очередь это касается отсканированных бумажных
документов или как модно говорить, носителей. Системы OCR, то есть
распознавания текста, конечно, замечательные вещи, но пока они еще не
настолько интеллектуальны, чтобы суметь распознать много страниц без единой
ошибки, различить, где рисунки, где текст, а где надписи на рисунках. Я сам
достаточно много работаю с FineReader 6, как одной из самых лучших программ
для этой цели и хорошо знаю его достоинства и недостатки. Поверьте мне - чем
тратить уйму времени на правку распознанного текста, во многих случаях проще
отсканировать эту же страницу с хорошим качеством, не ниже 300 dpi и
сохранить ее как файл djvu. Результат будет один и тот же, если не иметь в
виду редактирование текста и изображений, но затраты времени будут
неизмеримо меньше, при сопоставимом объеме файлов. Под результатом имеется в
виду получение информации о том, что напечатано на бумаге, ведь это главная
цель при такой задаче.
Давайте рассмотрим имеющиеся на сегодняшний
день программы, при помощи которых можно смотреть, создавать и
конвертировать файлы djvu.
Первые программы от творца этого формата,
всемирно известной фирмы AT&T, были консольные, что отнюдь не
вдохновляло, поскольку работать было попросту неудобно. Но это было
несколько лет назад, с тех пор утекло много воды, а права на коммерческое
использование djvu были проданы Lizard Tech. Нельзя сказать, чтобы после
покупки прав на djvu, появились небывало удобные и быстрые кодировщики и
конвертеры, но по крайней мере, работа в этом направлении идет, хотя
исчезновение DjVu Solo 3.1 с сайта Лизарда непонятно, взамен ничего не
появилось. Либо они обрадуют мир кое-чем новеньким, желательно бесплатным,
либо…? Ладно, не будем гадать, поживем - увидим. Чтобы не лишать народ
бесплатного кодера djvu и для создания многостраничных файлов, мой знакомый
программист быстренько слепил на скорую руку GUI для djvu кодера и для
многостраничника, работать стало намного удобнее, качество файлов, несмотря
на то, что исходная программа была написана несколько лет назад, весьма
хорошее, нужно только правильно прописать параметры в командной строке
интерфейса. Проблемы, связанные с истекшей лицензией устранены, за это
большое спасибо никогда не отказывающему в помощи AmaTeuR-у.
В
пользу популярности djvu можно привести пример известных вьюеров, типа
ACDSee (3,4,5), XNView, IrfanView и других, к которым имеются djvu плагины.
Для первых двух софтов они несколько кривоватые, имеется в виду, что
изображение при просмотре выглядит как отсканированное с очень низким
разрешением, хотя на самом деле это не так, djvu плагин к Ирфану был
доработан и смотрится несравненно быстрее и приличнее. Мало того, в
последней версии IrfanView 3.80 есть возможность смотреть многостраничные
файлы djvu, правда, только первую страницу, но тоже прогресс. При переписке
с автором, то есть, самим Ирфаном, я посетовал на отсутствие поддержки
многостраничности и невозможности создавать файлы djvu, на что автор
ответил, что подумает на эту тему.
Появился новый бесплатный вьюер
SlowView (http://www.slowview.at/), в
котором есть плагин кодера и декодера djvu, но увы, многостраничные файлы он
тоже не поддерживает, а кодер, скорее, способен дискредитировать саму идею,
ибо файл получается больше оригинала, надо бы попробовать пообщаться с ним
на эту тему. Русификация ко всем указанным выше вьюерам
есть.
Основным инструментом для просмотра djvu можно считать плагин к
Internet Explorer-у, лежащему на сайте самого Лизарда - http://www.lizardtech.com/. Работает
он прекрасно, поддерживает многостраничные файлы, чего никто из упомянутых
выше софтов не может. Существенно то, что плагин может разделить
многостраничный файл на составные части, это бывает нужно при конвертации в
другие форматы, например для распознавания текста и его перевода на другой
язык. После загрузки многостраничного файла нужно щелкнуть мышкой на "Save"
и при сохранении выбрать "Indirect". Конвертировать djvu файлы можно только
в bmp, но этого более, чем достаточно в большинстве случаев. Есть два
варианта по установке плагина - скачать дистрибутив или установить плагин
прямо в онлайне. Об этом я расскажу в самом конце статьи.
Имеются
плагины к другим браузерам и под другие ОС, но поскольку я пользуюсь только
Win98/IE6SR1, то ничего про них сказать не могу. Из программ, которые могут
создавать и просматривать djvu, следует упомянуть DjVuer (несколько версий)
от фирмы Feith - http://www.feith.com/.
Он работает лучше всех остальных, но имеющиеся версии не поддерживают
многостраничные файлы, что не может не вызвать удивления, причем это же
неумение сохранилось и по сей день!. Последняя, опробованная мной версия -
DjVuer PRO 2.04, хотя на сайте указана 1.7. Второй недостаток этого софта -
неумение работать с большими файлами, при размере в десятки мегабайт DjVuer
долго шуршит винтом, а потом, не говоря худого слова, прекращает работу.
Если же исходные файлы имеют умеренный размер, то проблем не возникает. В
плюс можно поставить возможность групповой или пакетной (batch) конвертации,
что позволяет обработать сразу много файлов, но бывают и вылеты при очень
большом (несколько сотен) количестве файлов.
Занятный факт - когда я
опробовал GUI для старого AT&T кодера, то выяснилось, что кодер работает
быстрее и безглючнее всех остальных, куда более новых программ, вроде бы они
должны базироваться именно на этом кодере, но разница заметная, особенно на
DjVu Solo.Файл с полноцветным bmp при 600 dpi,
размером в 200 Мб был сконверчен в djvu размером 700 кил с хвостом за 6
минут на не самом современном компе.
В защиту DjVuer-а можно сказать,
что вторая по счету разработка самой LizardTech под названием DjVu Solo не
может и этого, большие файлы ей явно противопоказаны, но зато она может
создавать многостраничные файлы и делать гиперссылки, что безусловно удобно,
учтите только, что добавлять страницы в пакет нужно с ПОСЛЕДНЕЙ, это уже ляп
разработчиков, впрочем запомнить эту особенность нетрудно. Судя по
консольному многостраничнику, для которого тоже есть GUI, ляп был заложен в
незапамятные времена, поскольку эта особенность присутствует и в консоли.
Работает DjVu Solo в остальном неплохо, остается надеяться, что ее создатели
устранят имеющиеся недостатки в этой бесплатной программе, хотя, судя по
исчезновению ее с сайта Лизарда, как уже указано выше, вряд ли ее будут
дорабатывать. Коммерческая версия позволяет использовать распознавание
графического текста, но это не есть проблема и без ее покупки, поскольку для
такой задачи хорошо подходит IrfanView, которым можно отконвертить djvu
файлы, кроме многостраничных, в любой другой формат для OCR, например tiff
или bmp. Поскольку преимущества djvu сказываются именно на графических
файлах, созданных с большим разрешением, то есть 300-600 dpi, то проблемы
при распознавании конвертированного файла не возникает, по крайней мере у
меня все проходит гладко и ошибок из-за конвертации практически нет.
Для конвертации pdf в djvu подходит пакет GhostScript + GhostView -
http://www.cs.wisc.edu/, который
позволяет преобразовать pdf в самые различные форматы, например в bmp с
разрешением 600 dpi. Файл djvu после такой операции получается прекрасного
качества, но раз в пять меньше оригинала. Кстати, для работы с pdf
упомянутый пакет очень удобен и полезен, поскольку другие софты сложны и
объемны. Но последний Акробат 5(полный), несмотря на свою объемность, очень
хорошо конвертит pdf в tif и работает лучше, чем предыдущая
версия.
Вторая возможность конвертации, и не только для pdf, это
FinePrint - http://www.fineprint.com/, при
просмотре страницы перед печатью достаточно щелкнуть правой мышкой,
появляется меню с экспортом изображения в bmp через клипборд. Очень хорошо
для этого подходит IrfanView, штатный Paint страшно тормозит, а PhotoShop
выдавал вообще непонятную картину, впрочем, возможно, я не разобрался до
конца в этой операции. Есть еще несколько виртуальных принтеров,
ознакомиться с советами по сканированию и созданию графических файлов можно
на сайте СКР.
Теперь об установке плагина для IE. У меня стоит Windows 98PE, оказалось,
что после инсталляции плагина, которая проходит несколько странно - не
выдается окно настройки, файлы djvu отказываются открываться, хотя в типах
файлов все прописано верно, при Windows 98SE такого вроде не было. После
некоторых мучений было принято решение установить плагин в онлайне, прямо с
сайта Лизарда и тогда все пошло как по маслу. Разница оказалась в разных
папках размещения плагина после инсталляции, с чем это связано, сказать
трудно, может быть старая версия Виндов, может быть еще что то. При неверной
инсталляции, папка плагина размещалась в папке самого IE, а при правильной -
в отдельной папке LizardTech - DjVuControl.
Итак, подведем
некоторые итоги djvu-шного софта:
Просмотр любых файлов
djvu: - плагин к IE, DjVu Solo. Просмотр одностраничных
файлов: - IrfanView, DjVuer(Feith) - хорошее качество; - XN View,
ACDSee - неважное качество; - SlowView - свои огромные djvu медленно,
остальные - плохо.
Распаковка многостраничных файлов; -
плагин к IE, DjVu Solo.
Создание одностраничных файлов djvu: - DjVuer (Feith), DjVu Solo, кодер от AT&T; - SlowView - пока
пародия на создание, djvu файл больше исходника.
Создание
многостраничных файлов: - DjVu Solo с гиперссылками; -
многостраничник от AT&T , только конвертация, без
гиперссылок;
Конвертация djvu в другие форматы: - плагин к
IE (только bmp); - IrfanView; - DjVuer от Feith (bmp, jpg, pnm); -
DjVu Solo (только bmp); - виртуальные принтеры FinePrint, SuperPrint,
ePrint, pdfFactory и другие.
Распечатка в большом масштабе после конвертации djvu: - Teulat, поддерживаются файлы ps, tif, jpg - http://www.femfum.com/ - плагин к
Акробату 5 (полному) CrackerJack 4.1, поддерживается pdf - http://www.lantanarips.com/
Печать djvu - категорически и настоятельно рекомендую применять
FinePrint -http://www.fineprint.com/, особенно для
многостраничных файлов, это поможет избежать многих ошибок при печати и
сэкономит вам время и бумагу.
Если были найдены другие программы для
работы с файлами djvu, сообщите, пожалуйста, об этом вебмастеру, мы будем
признательны за информацию. В настоящей статье не рассматривается
применение DjVuJoin, поскольку надобности в нем пока не возникало. На
сайтах, посвященных djvu есть упоминания о новых коммерческих программах, но
увы, они не доступны для скачивания и тестирования.
В конце концов,
если вам этот формат настолько не по сердцу и вас начинает бить нервная
дрожь при одном только упоминании djvu - нет проблем! Я даже не буду
советовать искать аналогичные не djvu-шные материалы на "более других"
сайтах, а предложу компромиссное решение, сохраняющее овец при насыщении
волков. Считайте djvu не графикой, а новым архивным форматом с возможностью
предварительного просмотра. Никто вам не мешает после закачки файла djvu
отконвертить его в услаждающий ваше сердце, родной с детства и радующий глаз
bmp, jpg, tif, gif, pdf или другой, вам еще более милый, формат. Если
исходный файл был с разрешением 300-600 dpi и был правильно отсканирован и
сконверчен в djvu, то никаких неудобств вы не испытаете, чего нельзя сказать
о черно-белых файлах, изувеченных jpg-ом или цветным gif-ом.
1. Скопировать файл DJVU.ini в папку WINDOWS 2. Создать папку C:/DJVU,
скопировать в нее остальные файлы. 3. Запустить TASKER.exe и указать путь
к файлу DjVuEncode.exe 4. Прописать в командной строке необходимые
параметры, например: -b -d300 -1 -l -q100, можно сохранить их в файл xxx.par
для дальнейшего использования при смене параметров конвертации файлов -
черно-белые, полутона, цветные. 5. Указать расширение выходных файлов
djvu 6. Нажать Start и выделить файлы для конвертирования, которые ДОЛЖНЫ
быть в папке C:/DJVU, нажать Открыть. Видимость задачи можно не
задействовать. В нижней строке таскера будет виден процесс конвертирования,
когда Осталось будет равно 0, то процесс закончен. Если возникли проблемы,
то скачайте новый файл DjvuEncode.exeи замените имеющийся.
Выяснилось, что ACDsee 4.0.2 создает какие то странные tif-ы, они не
конвертируются в djvu, после открытия Ирфаном и сохранения в тот же формат
повторная операция проходит без проблем.
1. Создать папку C:/DJVU_BUN, скопировать в нее остальные файлы. 2.
Запустить TASKER.exe и указать путь к файлу DjVuBundle.exe 3. Прописать в
командной строке необходимые параметры, только если это нужно, обычно ничего
не указывается. 4. Указать имя и расширение выходного файла, например
123.djvu 5. Нажать Start и выделить файлы для конвертирования, начиная с
ПОСЛЕДНЕГО, тогда он будет ПЕРВЫМ в многостраничном файле. Файлы для
конвертации ДОЛЖНЫ быть в папке C:/DJVU_BUN. 6. Нажать Открыть. Видимость
задачи можно задействовать для индикации, когда окно закроется, то процесс
закончен.
Про эту проблему знают все, а вот ее решение известно, увы, немногим. Сам
много раз просил совета у разных людей, но ничего внятного и практически
пригодного для работы не подсказали. Советы были такие - использовать Эксел.
Сказано - сделано, действительно Эксел вроде может такую штуку, за дело
взялся человек, очень прилично знающий эту программу. Файл был загружен в
Эксел, поделен на листы и отправлен на печать. Эксел проделал все операции с
радостой улыбкой идиота, постоянно кивая головой и... выдал только первый
лист с изображением, остальные были пустые, как голова с похмелья. Все
попытки уговорить его на этот подвиг в полном объеме успеха не имели, кому
удалось - делитесь, это еще Христос велел :-), но при дележке распишите
последовательность действий, чтобы понял даже не очень сведущий человек,
уровень подготовки посетителей СКР самый разный. Второй совет был уже
покруче - использовать Короля дров, то бишь Corel Draw достаточно высокой
версии. Оный софт был установлен (к счастью не не моей машине!), но его
объем и сложность освоения совершенно ненужной мне для других целей
программы, свели на нет все усилия, а искомый результат так и не был
достигнут, может руки кривые, а может еще что... Надеюсь, что предложение
использовать для подобной цели разного рода грабилки экрана, может
рассматриваться только как проявление юмора. Для маленькой схемы это еще
туда-сюда, а для большой будет оцениваться только как разновидность
мазохизма. Но это все присказка, а сказка вот какая. Печатать увеличенное
изображение в растре вряд ли целесообразно по понятным причинам, из
векторных наибольшую популярность имеет pdf, он стал практически стандартом
для разного рода документации, поэтому именно ему и было уделено внимание в
первую очередь. Были просмотрены почти все возможные программы и плагины для
Акробата, кстати, рекомендую переходить на 5-ю версию, она значительно лучше
и возможностей больше, чем у предшественников. Выбор остановился на двух
софтах - плагин с забавным названием CrackerJack от Lantana --
http://www.lantanarips.com, для его работы нужен полный Акробат (не Ридер!),
а при его установке не забудьте поставить Акробат Дистиллер из пакета
полного Акробата, иначе ничего не получится. Для длительной и бесперебойной
работы плагина нужно сами знаете что и сами знаете где :-), а кто не
догадался где, обращайтесь мылом. Все достаточно просто - не забудьте только
поставить крыжик на печать в файл в меню Target, иначе можете испортить кучу
бумаги. Самое нужно находится в меню Media - выбрать формат А4(если только у
вас не более навороченный принтер А3, не говоря о больших форматах, тогда
зачем вам эта метода?), подобрать нужную ориентацию листа при печати для
более удобного расположения изображения, поставить крыжик на Tile Output,
это и есть то самое деление всего изображения на куски выбранного формата,
ну и не забыть про Overlap, то есть запас на нахлест при склейке, 10мм
обычно хватает за глаза. В меню Options выбирается масштаб, это уже по
ситуации, а меню Marks позволяет напечатать ориентиры на каждом листе. В
новой, 4-й версии есть неплохой предпросмотр файла, поэтому можно поиграть
масштабом, чтобы на искомом количестве листов получилось максимально большое
изображение. Смена дюймов на миллиметры сидит в Акробате - Edit -
Preferences - CrackerJack 4.
Мой настоятельный совет - не
торопиться, иначе будет изведено без толку масса бумаги, а на мою голову
обрушатся проклятия за идиотские советы читателям. Поэтому после создания
pdf файла нажмите Page Setup в Акробате и убедитесь, что выбрана нужная
ориентация листа и его формат. Если была выбрана книжная ориентация листа в
Теулате или CrackerJack-е, то и на печать отправляйте такую же, а при
альбомной - альбомную, иначе сломаете голову при попытке состыковать лист с
листом.
Не пожалейте времени, не отправляйте файл сразу на принтер, а
сначала пропустите его через FinePrint - http://www.fineprint.com/, это поможет
избежать расхода бумаги, тонера и сэкономит ресурс принтера. И только после
того, как убедитесь что все именно так как нужно, можно нажимать кнопку
Print.
Вторая софтина, уже автономная, не плагин, но тоже
нуждающаяся в Дистиллере, была найдена на сайте по pdf софтам от других
производителей, называется она Tеулат и позволяет работать с файлами ps, jpg
и tif, что довольно удобно. Триальная версия будет лепить лэйбаки "Демо" на
каждом листе, но ограничений по времени использования не имеет. Лежит эта
полезность на http://www.femfum.com/bin/iteulat.zip,
недостатки - небольшая сырость в плане эргономики и полное отсутствие хелпа,
хотя там есть некоторые неясные моменты, разберемся со временем и надеюсь,
вашей помощью. После инсталла нужно прописать пути к Акробату и Дистиллеру в
конфигурации, больше никаких проблем с установкой нет, если при запуске
Теулата выскочит ошибка с текстом на непонятном языке, то не паникуйте, а
перегрузите комп. Х2Y2 - это размеры самого файла, что такое X1Y1 и почему
они бывают с минусом, я пока не понял, кто дойдет - поделитесь. Формат
выходного файла выбирается Teulat, для чего нужен PPD, я тоже не знаю.
Overlap - то же самое, что и описано выше, то есть запас на нахлест, после
определения масштаба нужно нажать кнопку Calculate, после этого софт выдаст
результат о необходимом количестве листов выбранного формата. Вот только не
всегда выбирается их минимально необходимое количество, бывает, что целый
ряд, а то и два, пустые, это легко исправляется в Акробате при просмотре
перед печатью, просто удалите пустые листы. На каждом листе печается его ряд
и колонка, чтобы легче ориентироваться при склейке большого количества
листов, первый лист с общим видом раскладки печатать не стоит. Рекомендации
по поводу применения ФайнПринта остаются в силе. Остальное особых
комментариев не требует, софт достаточно простой и безальтернативный, разве
что вы сами подскажете лучший вариант, ну а пока обойдемся и тем, что есть.
"Лекарство" уже имеется, за что большущая благодарность AmaTeuR-у, если
понадобится - пишите мылом.
Теперь самый больной вопрос - а что
делать со столь любимыми мной файлами djvu? Ответ простой - теперь можно их
печатать в любом масштабе при помощи Теулата после конвертации в tif или pdf
через pdfFactory (http://www.fineprint.com/) и
CrackerJack, а также через другие виртуальные принтеры, eРrint (http://www.leadtools.com/) имеет 140
выходных форматов!
P.S. Все вышеописанное было проверено мной
лично и особых проблем не вызвало, за исключением непонятных файлов pdf,
созданных в последнее время сынами Страны восходящего солнца, то есть
японцами. Что они с ними делали - вопрос всех времен и народов, но эти файлы
открываются только в Акробате, а GhostScript выдает ошибку, хотя на всех
других pdf файлах работает как часы. То ли японских фонтов насовали, то ли
еще что, но пришлось повозиться для достижения искомого результата, который
тем не менее, был достигнут. Так что и это не есть проблема, было бы
желание...