[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Конвертация "разворота" страницы PDF



Иван Лох wrote:
Использовать оригинальный pdftotext из пакета xpdf-utils. Может быть
поиграться с -layout и -raw.

Спасибо. Действительно лучше работает.

pdftotext 1.pdf  -nopgbrk -raw -htmlmeta 1.html

Правда пока не поборол 4 вещи:
0. название главы перед началом каждой страницы - хотелось бы убрать.
1. номера страниц (они не нужны, тем более отстающие на 1)
2. сноски конвертируются как "номер+новая строка+точка" - "новая строка" немного мешается.
3. Error: Illegal entry in bfchar block in ToUnicode CMap
--
Sincerely,
	Nicholas


Reply to: