Форум » Кают-кампания » OCR от keu » Ответить

OCR от keu

keu: Решил я продукты своей жизнедеятельности как-то организовать. А то они разбросаны по нескольким веткам. Дальнейшие продукты буду выкладывать сюда же. Монографии: - Грибовский. Российский флот Тихого океана gribovsky.rar - 10.01MB Оно же без фотографий gribovsky-light.rar - 2.15MB - Мельников. Броненосцы типа Пересвет peresvet.zip - 10.63MB Источник: Гангут ##11, 12, 12-бис, 15, 16 За помощь со сканами спасибо kronma Статьи: - Б.Г.МАСЛЕННИКОВ. Авария крейсера Витязь vityaz.zip - 2.03MB Источник: Гангут ##12-бис, 15 - ЯПОНСКИЕ И КИТАЙСКИЕ ФЛОТЫ В ПОСЛЕДНЮЮ КИТАЙСКО-ЯПОНСКУЮ ВОЙНУ. (Статья капитана 1-го ранга В.К.Витгефта) - того самого Витгефта vitgeft.zip - 1.09MB Источник: Бриз 1995-06 - Дело парохода Malacca. П.А.СТЕЖКО malacca.zip - 0.80MB Источник: Гангут #12-бис - Андреевский флаг на рейде Сан-Франциско. В.С.Соболев (про "американскую экспедицию"), 0.45MB san-francisco.zip - 0.45MB Источник: Гангут #31 - Крейсер Аврора в Великом сражении Японского моря. Л. Л. ПОЛЕНОВ aurora.zip - 0.49MB Источник: Гангут #2 - Император Николай I. Р.М.Мельников nik_1.rar - 2.12MB Источник: Гангут #8 За сканы спасибо kronma - Император Николай I - звездные 1890-е. Р.М.Мельников nik_1_2.zip - 1.17MB Источник: Гангут #28 За сканы спасибо kronma - Почему Потемкин не участвовал в Цусимском сражении? В.Л.ПЕТРОВ potemkin.rar - 0.56MB Источник: Гангут #10 - ПТИЦЫ, ГОРЫ И СТИХИИ: НАЗВАНИЯ КОРАБЛЕЙ ЯПОНСКОГО ИМПЕРАТОРСКОГО ФЛОТА. Георгий БРЫЛЕВСКИЙ ijn_names.zip - 1.34MB Источник: Флотомастер 2005-05 - Крейсер «Новик» А. А. АЛЛИЛУЕВ novik.zip - 1.14MB Источник - Гангут №№2-3 За помощь со сканами спасибо velbot-067

Ответов - 222, стр: 1 2 3 4 5 6 All

Mamay: Duron пишет: Мыло давайте. Кинул свое мыло Вам в личку. Заранее СПАСИБО.

Duron: кинул вам на мыло троим кто прислал. Проверяйте я еще минут 20-25 дома буду. Если не дошло еще раз скину.

keu: вот оно. Чтение этого отрывка вызвало интерес ко всей книге. Если снабдите 300-дэпэёвыми сканами - сделаю OCR.


Duron: в субботу предварительно соберу себе новый комп, постараюсь по сканить в ближайшее время.

Mamay: Duron пишет: кинул вам на мыло троим кто прислал. Спасибо еще раз. Я считаю, что этот отрывок многое проясняет в теме "Нефть и уголь". Кто разместит? keu пишет: Чтение этого отрывка вызвало интерес ко всей книге. Книга весьма любопытная. На заре перестройки частенько такие попадались. В бумажных переплетах, но с ценным содержанием. keu пишет: Если снабдите 300-дэпэёвыми сканами - сделаю OCR. Не знаю как у Вас, но мой FR распознал около 3% содержания. Возможно нужны "серые" фото, режим Line Art дает какое-то эхо в изображении букв.

keu: Mamay пишет: Кто разместит? Дык уже. Mamay пишет: На заре перестройки частенько такие попадались. В бумажных переплетах, но с ценным содержанием. У меня была Шапиро, "самые быстрые корабли" (т.е. она и щас есть, но весьма далеко). И щас есть Залесский, "Краб" - по возможности отсканю. Mamay пишет: Не знаю как у Вас, но мой FR распознал около 3% содержания. На этом скане - неудивительно. Потому и уточняю насчет 300 дэпэёв. Плохой скан иногда удается при помощи напильника привести в удобваримое для ФР состояние. Но лучше чтоб был хороший. Попробовал после напильника - распознал всё, но ошибок много. Mamay пишет: Возможно нужны "серые" фото Не возможно, а АДНАЗНАЧНА :)

Duron: Пардон , а "серые" можно уточнить что это такое? По подробнее плиз растолкуйте как лучше и чем сканить. ФР я так понял это Файн Риадер?

keu: Duron пишет: Пардон , а "серые" можно уточнить что это такое? Это значит, что на картинке более двух цветов. Не только черный и белый, но и полутона. Однако и 16M цветов не повредит. Каждая тулза правда называет эти режимы по-своему. У меня (HP 3400c) что-то типа "черно-белая фотография", "лучшая цветная фотография" и т.д. Duron пишет: По подробнее плиз растолкуйте как лучше и чем сканить. Тулзой от сканера. И 300 dpi. Duron пишет: ФР я так понял это Файн Риадер? Да.

Mamay: В принципе, если использовать режим градаций серого, то можно снизить разрешение до 150 dpi, чтобы файлы были поменьше размером. Но это если FR потом схавает. Вообщем эмпирически, методом "проб и находок", можно подобрать правильное сочетание цветности и разрешения. Кстати цветность у меня иногда давала более худшей результат, чем градации серого. (наверное FR начинает хавать структуру бумаги?).

Mamay: keu пишет: У меня была Шапиро, "самые быстрые корабли" Слышал о сей книге очень неплохие отзывы. К сожалению физически не юзал, а в Inet, можно только за деньги купить.

keu: Mamay пишет: В принципе, если использовать режим градаций серого, то можно снизить разрешение до 150 dpi, чтобы файлы были поменьше размером. Но это если FR потом схавает. Не схавает. Если я просил 300, то наверное есть основания? За последнее время я довольно много ocr-ов понаделал, и прошу 300 dpi. В ряде случаев делал и с более мелкого разрешения (т.к. какое есть), но желания повторять этот онанизм - нет. Mamay пишет: Кстати цветность у меня иногда давала более худшей результат, чем градации серого. (наверное FR начинает хавать структуру бумаги?). FR переводит скан в ч/б. Другое дело, что в изначально ч/б скане уже потеряны детали. Градация серого пожалуй тут оптимум. Но цветные тож годятся. Главное - разрешение.

Naumov: Может я чего не так сканирую, но у меня в грейскале получилось ужатыми 350 метров.... Сейчас попробую конвертнуть в другой формат.

Mamay: keu пишет: Не схавает. Если я просил 300, то наверное есть основания? Да я в общем-то не ставлю под сомнение Ваш опыт в этом вопросе. По своему небольшому опыту сканирования могу подтвердить Gray и 300 dpi это залог успешного сканирования в 98% случаев. А цветные, по-моему, несколько больше серых по размеру.

keu: Naumov пишет: Может я чего не так сканирую, но у меня в грейскале получилось ужатыми 350 метров.... jpeg? 300 dpi? сканеры часто tiff делают, он хуже жмется. Но jpeg пожалуйста сильнее 7 не жмите. А то артефакты лезут.

keu: Mamay пишет: А цветные, по-моему, несколько больше серых по размеру. Сравнил на одном файле, получилось 493 830 и 461 180. Разница не принципиальна, но приятна. Но про цветные я говорил в смысле - что уж лучше цветные, чем ч/б.

Naumov: Запаковал в стометровый архив. jpeg, grayscale, 300 dpi... там 140 страниц, фа1лов 77 сканил разворот кое-где может вылез за границы области сканирования. Куда залить и какими кусками.

keu: Naumov пишет: Запаковал в стометровый архив. jpeg, grayscale, 300 dpi... там 140 страниц, фа1лов 77 сканил разворот кое-где может вылез за границы области сканирования. спасибо! Naumov пишет: Куда залить и какими кусками. Желательно на зетшару кусками метров по 30. Если Вам сложно так крупно заливать, то режьте мельче, как Вам удобно.

pun: Где?

Naumov: http://www.zshare.net/download/10571082107210851099-part1-rar.html - парт1 http://www.zshare.net/download/10571082107210851099-part2-rar.html - парт2 http://www.zshare.net/download/10571082107210851099-part3-rar.html -парт3 http://www.zshare.net/download/10571082107210851099-part4-rar.html -парт4 http://www.zshare.net/download/10571082107210851099-part5-rar.html -парт5 Какие страницы нужно пересканить, пишите.

keu: Naumov пишет: http://www.zshare.net/download/10571082107210851099-part1-rar.html ОК, спасибо! Закончу Ушакова и примусь за нее.

Mamay: Naumov пишет: Может я чего не так сканирую, но у меня в грейскале получилось ужатыми 350 метров.... У меня встречался похожий глюк (крупный JPG после сканирования). Боролся следующим образом: со сканера сохранял как BMP, затем грузил его в Paint, а из него сохранял как JPG. Получался очень плотненький файл (разница в размере разы, при том же качестве). Извините сразу не предложил, а протупил до того момента пока Вы сосканировали, просто не понял, что ситуации подобны.

keu: Mamay пишет: У меня встречался похожий глюк (крупный JPG после сканирования) У jpg есть такая характеристика, как коэффициент сжатия. С малым сжатием он большой и будет. Mamay пишет: грузил его в Paint брррррр. Бросьте каку. Возьмите лучше IrfanView. Заодно, если не бояться командной строки, можно целые кучи файлов одним движением охомячивать.

Mamay: keu пишет: Возьмите лучше IrfanView. Заодно, если не бояться командной строки, можно целые кучи файлов одним движением охомячивать. Пакетное преобразование у многих программ обработки изображения есть (и без командной строки можно найти XnView, ACDsee, например), но в подавляющем большинстве коэффициент сжатия для JPG вещь зашитая и не подлежащая настройки (в ACDsee 8.0 и выше вроде настраивать можно, не разбирался).

keu: Mamay пишет: но в подавляющем большинстве коэффициент сжатия для JPG вещь зашитая и не подлежащая настройки Какие-то не такие программы у Вас. Если у сканерной тулзы такое еще можно терпеть (т.к. заменить нечем), то все остальное с этим закидоном должно идти прямо фтопку.

Mamay: keu пишет: Если у сканерной тулзы такое еще можно терпеть (т.к. заменить нечем), то все остальное с этим закидоном должно идти прямо фтопку. Издержки лицензионного ПО на работе (XnView, например, бесплатный), а дома руки все не доходят, поставить, что-нибудь серьезное.

Naumov: Сканируйте сразу в ФШ и там делайте с изображением чего хотите :-) Но когда файлов для сканирования много с ФШ долго получается...

Anton: Naumov пишет: Сканируйте сразу в ФШ и там делайте с изображением чего хотите :-) Но когда файлов для сканирования много с ФШ долго получается... Я в ACDSee сканирую (причем 6.0)- работает легко, пакетное преобразование есть (если надо)

keu: Mamay пишет: Издержки лицензионного ПО на работе (XnView, например, бесплатный) irfanView не менее бесплатный. Ну еще gimp есть.

keu: Знатная книжка. Большая только. В.Ю. ГРИБОВСКИЙ И.И. ЧЕРНИКОВ БРОНЕНОСЕЦ "АДМИРАЛ УШАКОВ" ushakov.zip - 5.85MB

Duron: у меня есть книжка из этой серии "Замечательные корабли" "Гвардейский крейсер "Красный Кавказ"

Борис, Х-Мерлин: keu - ТВОЙ ТЕКСТ ПО ДИАНАМ СТАЛ ОСНОВОЙ ДЛЯ ВУНДЕРА :) ПОЗДРАВЛЯЕМ ... ЁХОХО... НА СУНДУК МЕРТВЕЦА... ПИАААСТРРРРРЫ!! ПИАААСТРРРРРЫ!!

keu: Борис, Х-Мерлин пишет: keu - ТВОЙ ТЕКСТ ПО ДИАНАМ СТАЛ ОСНОВОЙ ДЛЯ ВУНДЕРА :) Я видел. У меня в фидо робот за вундером смотрит и мне докладывает. Борис, Х-Мерлин пишет: ПОЗДРАВЛЯЕМ ... ЁХОХО... НА СУНДУК МЕРТВЕЦА... А вёрстку пошто испохабил?

keu: Duron пишет: у меня есть книжка из этой серии "Замечательные корабли" "Гвардейский крейсер "Красный Кавказ" У меня тоже. Только далеко она :( Вместе с "Рюрик был первым" - это вообще моя первая серьезная книжка.

realswat: keu пишет: У меня тоже. А у меня нет. Я специально раньше записывался в библиотеку на другом конце Зеленограда (библиотекарша еще докапывалась - чего не в своем районе?), чтоб ее прочитать. Надо было украсть - да я честный:-) (в отличие от других - "Танковые сражения" Гота кто-то увел:-(( )Так что надежда теперь только на Вас:-))

keu: realswat пишет: Так что надежда теперь только на Вас:-)) Я в Перми, книжка во Владикавказе. Поеду только летом... Кстати, "сердце корабля" откладывается на неопределенный срок. Больше половины страниц срезаны. Даже составить список довольно долго.

Naumov: keu пишет: Кстати, "сердце корабля" откладывается на неопределенный срок. Больше половины страниц срезаны. Даже составить список довольно долго. Я пересканю сегодня постранично :-) Могу и "Красный Кавказ" пересканить, если уж ни у кого не найдется...

keu: Naumov пишет: Я пересканю сегодня постранично :-) Я в субботу сосканил "Краб", и пришел к выводу, что книжки такого формата надо сканить постранично. А если по две, то каждую тщательно прицеливать - быстрее выйдет вслепую постранично.

Naumov: keu пишет: быстрее выйдет вслепую постранично. Это точно, я некоторые проверял и поправлял, но видимо многие все же съехали. Прошу прощения за зря потраченный трафик

keu: Naumov пишет: Прошу прощения за зря потраченный трафик Это мне скорее перед Вами неудобно за лишнюю работу.

Борис, Х-Мерлин: keu пишет: А вёрстку пошто испохабил? - её привели в соотвествие к вундеровским стандартам ... ничего личного ...



полная версия страницы