Re: DjVu
On 2011.10.19 at 19:11:26 +0400, Иван Лох wrote:
> On Wed, Oct 19, 2011 at 06:45:46PM +0400, Victor Wagner wrote:
> > Правда, пока что попытки совместить это дело с дистрибутивном
> > cuneiform-ом у меня к хорошим результатам не привели.
>
> ocrodjvu --engine cuneiform --language rus -o bookocr.djvu book.djvu
В теории нет разницы между теорией и практикой.
А на практике - есть.
Ну попробуй, например вот это http://freebsd.over.ru/oppel_1917.djvu
черед ocrodjvu пропустить. Ни у меня (под Debian-ом) ни у Поволоцкого
(под freebsd) добиться чтобы cuneiform на этом тексте не падал в кору,
не получилось.
Если получится, можно отправить файл tarkhil-у, и все историки военной
медицины скажут за это большое человеческое спасибо.
Особенно если удастся проделать то же самое с остальными редкостями,
которые Поволцкий в djvu сосканировал.
> $ djvutxt book.djvu |wc -l
> 0
> $ djvutxt bookocr.djvu |wc -l
> 11522
>
>
> $ apt-cache policy cuneiform ocrodjvu
>
> cuneiform:
> Установлен: 1.1.0+dfsg-1
> Кандидат: 1.1.0+dfsg-1
> Таблица версий:
> *** 1.1.0+dfsg-1 0
> 500 http://ftp.fi.debian.org/debian/ sid/non-free i386 Packages
> 100 /var/lib/dpkg/status
>
> ocrodjvu:
> Установлен: 0.4.6-4
> Кандидат: 0.4.6-4
> Таблица версий:
> 0.6.1-1 0
> 101 ftp://ftp.fi.debian.org/debian/ experimental/main i386 Packages
> *** 0.4.6-4 0
> 500 http://ftp.fi.debian.org/debian/ sid/main i386 Packages
> 100 /var/lib/dpkg/status
>
>
> --
> To UNSUBSCRIBE, email to debian-russian-REQUEST@lists.debian.org
> with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
> Archive: 20111019151126.GB14869@nano.ioffe.rssi.ru">http://lists.debian.org/20111019151126.GB14869@nano.ioffe.rssi.ru
>
Reply to:
- Follow-Ups:
- Re: DjVu
- From: Dmitry Nezhevenko <dion@inhex.net>
- Re: DjVu
- From: Иван Лох <loh@1917.com>