Re: пп╬п╦яп╨ п╡ PDF
On 2002.11.25 at 15:19:41 +0400, Vlad Harchev wrote:
>
> Перегнать все pdf в текст и искать в тексте grep'ом.
> Правда с русским языком могут быть проблемы (с его кодировкой).
>
> Для этого можно пользовать pdftotext из пакета xpdf и pdf2ps и затем
> ps2ascii из ghostscript.
А ps2ascii уже научился работать не с ascii, а с 8-битными символами?
Или кто-то уже написал хреновину, которая подбирает в постскрипте вектор
кодировки и пишет в выходной файл glyph names (перегнать потом эти
glyph names в unicode или другую полезную кодировку - не проблема)
--
Victor Wagner vitus@ice.ru
Chief Technical Officer Office:7-(095)-748-53-88
Communiware.Net Home: 7-(095)-135-46-61
http://www.communiware.net http://www.ice.ru/~vitus
Reply to: