WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     || 2 | 3 | 4 |

eBook / По мотивам: Как почистить сканы книг? Только для ленивых!!!

По мотивам: Как почистить сканы книг? Только для ленивых!!!

Написал: vadimir

eBook

35 комментариев

Дата: 06112005, 12:33

версия для печати

Три способа получить, нужную тебе научнотехническую книгу в электронном виде, с минимальными затратами

Этот блок могут видеть только авторизованные пользователи.

Зарегистрироваться | Напомнить пароль Уважаемый IvanStorogev написал две части (народ ждет продолжение), о том, как чистить сканы, для подготовки книги перед переводом ее в электронный вид.

Часть 1 и Часть 2 Помимо технологии, там были и философские отступления. Можете почитать. Ну а моя философия проста, минимум телодвижений, с по возможности удовлетворительным результатом.

Способ Раз Вам по учебе или работе нужна книжка, Вы знаете какая (это важно). Тогда идем по известному многим адресу Поиск книг вводим запрос, получаем ответ, качаем. Всё. Правда, за качество я не отвечаю.

Если Вы любитель математики, то неплохо бы посетить электронную библиотеку мехмата МГУ, с вероятностью 90%, Ваша книга там уже есть.

Существуют ещё места, так что не ленимся, ищем.

Способ Два Мы сами не местные... (далее по тексту). Идем и просим добрую, отзывчивую душу сделать, нужную нам книжку, желательно с высоким качеством (ну там, сканирование в 600 дпи, качественная обработка рисунков и пр.). Так что, за качество, все претензии к доброй душе.

Способ Три Ну, если уж Вам ничего не помогло, то придется идти в библиотеку и читать книгу там. Или взять ее домой на пару дней и сделать доброе дело, а результатом поделиться с тружениками полей, известных также как колхозники.

И так, в путь.

все ниже написанное относится строго к чернобелым книжкам, без полутоновых иллюстраций 1. Этот пункт самый муторный. Это сам процесс сканирования. Как я заметил, по технологии процесса многих разногласий нет. Берется книга, кладется разворотом на стекло, так чтобы поместились обе страницы, и сканируем с разрешением 300 дпи в градациях серого. Современные сканеры позволяют это делать довольно быстро. Книгу кладем по возможности ровнее, прижимая ее чем либо тяжелым, возможно рукой. На выходе получаем tiffы, размером порядка 8 метров на разворот. Что бы не было скучно, смотрим футбол или слушаем музыку. У меня получается примерно 7080 (140160 страниц) разворотов за час. Т.е. реально, отсканировать среднего размера книгу за 23 часа. Я думаю не сложно найти на это время.

2. Тут на сцену выходит инструмент. Знакомьтесь – ScanKromsator от многоуважаемого bolega. Да, знаю, сейчас понабегут кромсаторы, начнут бурчать, мол народу это не надо, народ этого не понимает, руки прочь от их Кромсатора, мол чтоб Кромсатором пользоваться три года учиться надо. Ну да и фиг с ними, пускай ворчат. Но в одном они правы, ScanKromsator мощный инструмент, со многими полезными и не очевидными для новичка функциями. Сам я в нем тоже, мягко говоря не силен, но не бойтесь, это не должно нам помешать. Саму программу можно взять здесь, несколько доков по ней тут. Хоть программа и бесплатна, но не забываем перед каждым ее запуском говорить спасибо.

a) Запускаем программу и загружаем в нее наши файлы.

b) Выбираем путь для вывода результатов (закладка Files), тут же можно назначить способ нумерации выходных файлов, и что Очень Важно, назначить выходное разрешение 600 dpi.

c) Находим левее кнопки с надписью Process кнопочку с ножницами (Draft kromsate), появляется окно диалога ставим галочки на Split pages и safe top/bottom, ну и жмем кнопку OK. Теперь можно идти попить чай.

d) Через 10 минут.

Обратите внимание на синенькие полосочки, это резаки, за их пределами все будет безжалостно отрезано, а данная страница будет разрезана на две (центральные резаки). Посмотрите на то, что рядом с названиями страниц появились зеленые галочки! e) Расставляем опции. Для этого пройдемся по закладочкам (в окне слева).

Первая Pages. На ней выставляем способ центрирования. По умолчанию стоит автомат, это значит поместить изображение в верхний левый угол. Но, как правило (это у меня так) горизонтальное выравнивание ставиться по центру (Page h.align) C, вертикальное в низ (Page v.align) B.



Despeckle это убирание мелкого мусора. Deskew – выравнивание наклона страницы, если страница получится криво выровненной, для нее можно включить метод Art.

Опять важно, чтобы опция была применена ко всем страницам, при выборе опции удерживаем Ctrl. Аналогично при выборе остальных опций, которые применяются ко всем страницам сразу.

На закладке Book выставляем размеры выходных страниц, оставляем Page width и height в Auto. Тут я немного не понимаю, как это работает при изменении дпи, но экспериментально я ставлю H.Gap value в 250(300) pixels.

В закладке Files, как было сказано выше, ставим выходное дпи 600, это архи важно. От этого зависит весь окончательный результат.

Во вкладке Options, можно оставить как есть. Или выбрать для Despeckle метод Fine, это уникальноинтеллектуальный метод очистки. Например, он не вычищает точки над i и j.

Options 2 пропускаем.

Вкладка Convert – выставляем порог для преобразования из градаций серого в чернобелый. Я обычно выбираю между 170 и 200, надо попробовать, что лучше в конкретном случае. Не забываем удерживать Ctrl при выборе опции, предназначенной для всех страниц.

Ну наконец последняя, но очень важная вкладка Quality В Enhance image я ничего не понимаю, знатоки фотошопа и так поймут, что делать, лично я делаю как на иллюстрации. Хотя хотелось бы услышать, про оптимальный набор этих параметров.

И опять очень важно, если у вас исходник это разворот книги, то жмем на Gray enhance и появляется диалог Gray image enhance, в нем ставим cleaner passes в 1. По этой опции происходит выравнивание освещенности в центре разворота. Незаменимая штука.

f) Тут опять придется попотеть, но к счастью не много. Надо пройтись по всем страницам, с целью проверки правильности расстановки резаков. Если Вы увидите, что автоматически, для какой либо страницы резаки усыновлены не правильно, то их надо поправить. Для этого надо снять зеленую галочку, еще раз повторяю снять зеленую галочку, перед вносимыми изменениями. Иначе они будут проигнорированы. Передвигаем резаки, возможно меняем способ центрирования для данной страницы, возвращаем зеленую галку и идем дальше, к следующей странице.

g) Уфф! (Кстати, знаете ли Вы, чтобы все не делать заново, задание можно сохранить) e) Жмем большую кнопку Process. Тут появляется предупреждения, в здравом ли мы уме, что меняем разрешение, но нам уже все равно, мы все уже сделали.

Все, идем играть в футбол, или спать. Дело сделано, пусть компьютер теперь думает.

На моем компьютере (Pentium M 1400 MHz), этот блин процесс занимает порядка полуторы минуты на разворот (если не менять разрешение, то около 15 сек, но мы все же будем удваивать разрешение).

Часа через три, в указанной ранее папке, нас ждет результат, смотрим его внимательно, иногда могут быть несколько неправильно выровненных страниц. Их переделываем отдельно.

Особо дотошные, могут почистить остатки в ручную, так называемая тонкая очистка. Лично я это не делаю, за исключением убирания библиотечных штампов, и записей на полях типа: «а это батенька архиважно». Как правило, и так все замечательно.

В итоге получились примерно такие результаты: исходный скан (градации серого 300 dpi), результаты после кромсатора 600 dpi, и тоже 300 dpi. Бумажный исходник макулатурная бумага.

Не заметить разницу сложно. И это с использованием всего около 10% возможностей этой замечательной бесплатной программы.

Раньше, когда я встречал, мол книга сделана в 600 дпи, я пожимал плечами и шел дальше, мол у богатых свои причуды. Но оказывается все гораздо проще. 600 dpi это ж после обработки! Ну раз так, то грешно теперь портить свой труд, когда можно получить заметно лучший результат, без особых мышечных усилий. Если Вы скачаете эту книгу и результат Вас удовлетворит, то смело можете повторить этот процесс.

Мне кажется, сделать данную работу со много меньшими затратами человеческого ресурса, вряд ли возможно. Естественно возможны и другие рецепты. Есть BookRestorer, есть RasterID, некоторые пропускают сканы для сглаживания текста через CPCTools. Пусть ктонибудь расскажет и покажет. Но еще раз спасибо bolega за его программу, ее и одной достаточно для многого.





Что делать дальше? А что Вам хочется. Можете распознать, можете собрать pdf, но для научнотехнической литературы принято жать в djvu. Да, в этом, я тоже не эксперт. В djvu жму самым позорным способом в DjVuEditorPro 4.1.

З.Ы. Асы кромсания, не поленитесь, может тут, надо чтонибудь добавить или поправить. Но только если это принесет заметный глазу эффект, без титанических усилий.

Комментарии:

Великолепно! Огромное спасибо!!! +500!!!! BabaNata Дата: 06112005 / 15: Спасибо за подробный рассказ! Ingvar16 Дата: 06112005 / 15: Спасибо! За новизну, полезность, подробность и доступное изложение.

ThomasAquinas Дата: 06112005 / 16: vadimir: Спасибо за отличную публикациюинструкцию! Сохранил в chm для личных нужд.

KroMvEL Дата: 06112005 / 16: cool сохранил в *.mht :) stress Дата: 06112005 / 17: Спасибо!!! olegb Дата: 06112005 / 17: Спасибо, сохранил (пока) в хтмл :) Ramil Дата: 06112005 / 18: Супер! Тоже сохранил в.mht, но это ведь только начало... ;)) Cпасибо, vadimir! Успехов.

serviceman Дата: 06112005 / 21: Статья нормальная, я тоже хотел такую месяц назад сделать,но догадался сначала спросить разрешения у bolega, в результате чего статья так и не увидела свет.

Что ж, что сделано, то сделано... У меня только большая просьба не доставать автора претензиями к ошибкам программы и трудностям ее освоения.

Теперь по существу:

1.Последняя версия 5,52beta 2.Если во время кромсания отрезаются номера страниц,то можно на каладке Options2 увеличить чувствительность текста (text sensitivity) 3. Для порога преобразования существуют предопределенные значения, в большинстве случаев их хватает, лично я чаще всего использую Middle Dark.

4. Для того, чтобы переделать отдельную страницу надо нажать на панели инструментов кнопку :

process current file разворот process left page левая страница process right page правая страница 5. Окно просмотра результата. После его закрытия повторный вызов осуществляется командой меню Result>View All.

Кроме того, окно просмотра результа является также редактором постобработки, обладающим уникальными инструментами, главный из них чистка мусора.

Для того, чтобы наиболее эффективно его использовать надо сделать следующее:

1. Правый клик, включаем опции AutoSave, AutoClear.

2. ClearOptions настраиваем как на рисунке:

В результате:

1. Весь мусор, размер которого меньше 15 пикселей подсвечивается красным.

2. Прямоугольное выделение удаляет весь подсвеченный мусор, не трогая все остальное.

Выделение с клавишей Shift стирает область.

3. Результат чистки сохраняется при переходе к след/пред. файлу.

Alexx_S Дата: 06112005 / 22: 2 Alexx_S Спасибо за ценное дополнение. Зря Вы не написали статью, она бы была б более глубокая. А так мне непонятен подход кромсаторов со стажем зажимать свои знания. Если б они несли свет людям, может и доставали бы bolega поменьше :)? vadimir Дата: 06112005 / 22: Alexx_S:

Огромное спасибо за дополнение! И, имхо, уважаемый bolega, наверное, слегка заинтересован в тестировании его программы... А то, что она может быть сыровата, так на то она и бета :):):) Всем огромное спасибо! BabaNata Дата: 06112005 / 22: Лихо, молодец! Albertych Дата: 06112005 / 23: vadimir BabaNata “ “ Скажи, а ты не будешь против, если я напишу о твоей программе на kpnemo.ru? ” В принципе я не могу кому бы то ни было чтото запрещать.

Но я категорически против публикаций, по крайней мере до того момента, как будет готова документация.

А то после статьи на аvax ко мне идут уже гневные письма из Польши, Германии, Китая.

” Alexx_S Дата: 06112005 / 23: Alexx_S:

Да, неприятно это все для уважаемого bolega. Имхо, выходит, он и прав... Только я не понимаю людей, которые получили бету, бесплатно, а хотят, чтобы она работала как полноценная версия долларов за 1000...

BabaNata Дата: 06112005 / 23: Молодцы все!! Большое спасибо.

очкарик Дата: 07112005 / 07: Спасибо! sir39 Дата: 07112005 / 12: Очень интересно, надо попробовать.

Спасибо.

Sergey Smith Дата: 07112005 / 17: Попробовал, интересно, НО при сканировании в градациях серого в середине разворота по вертикали образуется серая полоса, после обработки и перевода в 2 цвета она стала черной.

Pages:     || 2 | 3 | 4 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.