[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: анализ файлов



У сб, 2007-09-22 у 02:56 +0400, Artem V. Andreev пише:
> Vadym Kurylovych <vadym@obmin.com> writes:
> 
> > У пт, 2007-09-21 у 11:16 +0400, Victor Wagner пише:
> >> On 2007.09.21 at 09:14:34 +0300, Vadym Kurylovych wrote:
> >> 
> >> > имеется файлопомойка на 1 ТБ
> >> > надо собрать статистику по файлах, точнее какой тип файлов сколько
> >> > занимает
> >> > может есть готовое решение?
> >> 
> >> Задачка из серии "дешевле решить заново, чем искать куда положил
> >> решение, сделанное в прошлый раз".
> >> 
> >> Особенно если учесть что с "прошлого раза" определение "типа файлов"
> >> могло поменяться. Что такое "тип" - это то, что выдает команда file
> >> или расширение?
> >> 
> >
> > расширение
> Эээ. Строго говоря, в *nix нет такого понятия -- "расширение",
> есть понятие "суффикса", которых может быть более одного. 
> Поэтому задача поставлена не совсем корректно: .tar.gz -- это
> тот же "тип" что и .tar или все файлы "*.gz" принадлежат к одному
> типу? и так далее, не говоря уж о том что файл может вовсе не иметь
> какого-то осмысленного суффикса.
> 
> А так: 
> 
> ls -lR /path-to-files | awk '/^-/ { 
>    if ($NF ~ /\./) 
>       sub(/^.*\./, "", $NF); 
>    else 
>       $NF = "<undefined>"; 
>    typesize[$NF] += $5 
> }
> END {
>     for (i in typesize) 
>         print i, typesize[i];
> }'

пасиба, то что надо

просто помойка то самбовская, вот и о расширениях речь :)


-- 
Vadym Kurylovych <vadym@obmin.com>



Reply to: