On Wed, Dec 16, 2009 at 11:51:49AM +0000, Nicholas wrote: > На каждом листе в PDF содержиться "разворот" книги. > pdftohtml переводит их построчно - получается одна строчка из левой > страницы, следующая из правой. > > Как можно переконвертировать из pdf в текст правильно? Использовать оригинальный pdftotext из пакета xpdf-utils. Может быть поиграться с -layout и -raw.