wayback machine - Git&httrack?

To: debian-russian <debian-russian@lists.debian.org>
Subject: wayback machine - Git&httrack?
From: Константин <shuvalov@datakon.info>
Date: Fri, 10 Jun 2011 14:05:03 +0000
Message-id: <[🔎] 4DF2248F.8090302@datakon.info>
Reply-to: shuvalov@datakon.info

Приветствую.

Появилась необходимость в сабже - качать и сохранять некие сайты, сотслеживанием изменений. (все ниже написанное - пока в проекте, нереализовано)

Для закачки - httrack
Для отслеживания изменений смотрю в сторону Git.

Как примерно вижу схему на данный момент:
а) основной репозиторий - на отдельном сервере.

б) httrack - запущен на другой машине. Там же делается локальныйрепозиторий (вероятно, для каждого сайта отдельно.... или?), которыйпериодически по ssh мержится в основной, после (вероятно?)пересоздаваясь заново (ибо полная копия основного репо там точно ненужна), или (скорее всего) удаляя устаревшие "срезы" (напр. оставляя 2-3последних).


Возникают вопросы касательно:
а) правильного выбора системы версий - Git или другое?

б) как целесообразнее организовывать репозиторий для свежих данных -один репо на все сайты или для каждого httrack-проекта отдельно? т.к. -нет желания всегда создавать заново и перекачивать весь сайт полностью,- httrack может проверять наличие измененного файла и лишь тогдазакачивать снова. + как понимаю, в "свежем" репозитории можно хранитьлишь два последних "среза", удаляя старые.в) при такой системе хранения - в основном репо будет видна историяизменений каждого файла (исходя из его хеша), или все завязано на времядобавления очередного обновления (т.е. по датам мержа из "свежего"репозитория, соотв. возможно наличие разных версий файла с идентичнымсодержимым? что было бы странно...)?

Все вышенаписанное - пока в проекте и не реализовано, хочется предв.разобраться в верности подхода и реализации. Жду тапков от уважаемогосообщества. Критика, предложения, замечания, поправки?

!!! вариант парсинга и забивания в некую бд не рассматривается и необсуждается. Вообще.


--
С уважением,
Константин Шувалов

Reply to:

Follow-Ups:
- Re: wayback machine - Git&httrack?
  - From: Иван Лох <loh@1917.com>
- Re: wayback machine - Git&httrack?
  - From: Pavel Ammosov <apavel@wapper.ru>

Prev by Date: testing amd64: dbus "ест" процессор
Next by Date: Re: wayback machine - Git&httrack?
Previous by thread: Re: testing amd64: dbus "ест" процессор
Next by thread: Re: wayback machine - Git&httrack?
Index(es):
- Date
- Thread