Re: wayback machine - Git&httrack?
On Fri, Jun 10, 2011 at 02:05:03PM +0000, Константин wrote:
> Приветствую.
>
> Появилась необходимость в сабже - качать и сохранять некие сайты, с
> отслеживанием изменений. (все ниже написанное - пока в проекте, не
> реализовано)
> Для закачки - httrack
> Для отслеживания изменений смотрю в сторону Git.
>
> Как примерно вижу схему на данный момент:
> а) основной репозиторий - на отдельном сервере.
> б) httrack - запущен на другой машине. Там же делается локальный
> репозиторий (вероятно, для каждого сайта отдельно.... или?), который
> периодически по ssh мержится в основной, после (вероятно?)
> пересоздаваясь заново (ибо полная копия основного репо там точно не
> нужна), или (скорее всего) удаляя устаревшие "срезы" (напр. оставляя
> 2-3 последних).
>
> Возникают вопросы касательно:
> а) правильного выбора системы версий - Git или другое?
Я бы использовал WebDAV хранилище c поддержкой версий.
Как-нибудь цинично-тупо. Вполне возможно, что можно просто взять какой-нибудь
lftp и mirror с MOVE из http в webDAV http. Так-как копироваться будут только
различающиеся файлы, то, будут появляться версии где-нужно.
Reply to: