[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: анализ файлов



Vadym Kurylovych <vadym@obmin.com> writes:

> У пт, 2007-09-21 у 11:16 +0400, Victor Wagner пише:
>> On 2007.09.21 at 09:14:34 +0300, Vadym Kurylovych wrote:
>> 
>> > имеется файлопомойка на 1 ТБ
>> > надо собрать статистику по файлах, точнее какой тип файлов сколько
>> > занимает
>> > может есть готовое решение?
>> 
>> Задачка из серии "дешевле решить заново, чем искать куда положил
>> решение, сделанное в прошлый раз".
>> 
>> Особенно если учесть что с "прошлого раза" определение "типа файлов"
>> могло поменяться. Что такое "тип" - это то, что выдает команда file
>> или расширение?
>> 
>
> расширение
Эээ. Строго говоря, в *nix нет такого понятия -- "расширение",
есть понятие "суффикса", которых может быть более одного. 
Поэтому задача поставлена не совсем корректно: .tar.gz -- это
тот же "тип" что и .tar или все файлы "*.gz" принадлежат к одному
типу? и так далее, не говоря уж о том что файл может вовсе не иметь
какого-то осмысленного суффикса.

А так: 

ls -lR /path-to-files | awk '/^-/ { 
   if ($NF ~ /\./) 
      sub(/^.*\./, "", $NF); 
   else 
      $NF = "<undefined>"; 
   typesize[$NF] += $5 
}
END {
    for (i in typesize) 
        print i, typesize[i];
}'

-- 

					S. Y. A(R). A.

Reply to: