[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: пп╬п╦яп╨ п╡ PDF



On 2002.11.25 at 15:19:41 +0400, Vlad Harchev wrote:

> 
>  Перегнать все pdf в текст и искать в тексте grep'ом.
>  Правда с русским языком могут быть проблемы (с его кодировкой).
> 
>  Для этого можно пользовать pdftotext из пакета xpdf и pdf2ps и затем
> ps2ascii из ghostscript.

А ps2ascii уже научился работать не с ascii, а с 8-битными символами?

Или кто-то уже написал хреновину, которая подбирает в постскрипте вектор
кодировки и пишет в выходной файл glyph names (перегнать потом эти
glyph names в unicode или другую полезную кодировку - не проблема)


-- 
Victor Wagner			vitus@ice.ru
Chief Technical Officer		Office:7-(095)-748-53-88
Communiware.Net 		Home: 7-(095)-135-46-61
http://www.communiware.net      http://www.ice.ru/~vitus



Reply to: