Re: анализ файлов
У сб, 2007-09-22 у 02:56 +0400, Artem V. Andreev пише:
> Vadym Kurylovych <vadym@obmin.com> writes:
>
> > У пт, 2007-09-21 у 11:16 +0400, Victor Wagner пише:
> >> On 2007.09.21 at 09:14:34 +0300, Vadym Kurylovych wrote:
> >>
> >> > имеется файлопомойка на 1 ТБ
> >> > надо собрать статистику по файлах, точнее какой тип файлов сколько
> >> > занимает
> >> > может есть готовое решение?
> >>
> >> Задачка из серии "дешевле решить заново, чем искать куда положил
> >> решение, сделанное в прошлый раз".
> >>
> >> Особенно если учесть что с "прошлого раза" определение "типа файлов"
> >> могло поменяться. Что такое "тип" - это то, что выдает команда file
> >> или расширение?
> >>
> >
> > расширение
> Эээ. Строго говоря, в *nix нет такого понятия -- "расширение",
> есть понятие "суффикса", которых может быть более одного.
> Поэтому задача поставлена не совсем корректно: .tar.gz -- это
> тот же "тип" что и .tar или все файлы "*.gz" принадлежат к одному
> типу? и так далее, не говоря уж о том что файл может вовсе не иметь
> какого-то осмысленного суффикса.
>
> А так:
>
> ls -lR /path-to-files | awk '/^-/ {
> if ($NF ~ /\./)
> sub(/^.*\./, "", $NF);
> else
> $NF = "<undefined>";
> typesize[$NF] += $5
> }
> END {
> for (i in typesize)
> print i, typesize[i];
> }'
пасиба, то что надо
просто помойка то самбовская, вот и о расширениях речь :)
--
Vadym Kurylovych <vadym@obmin.com>
Reply to: