Re: анализ файлов
Vadym Kurylovych <vadym@obmin.com> writes:
> У пт, 2007-09-21 у 11:16 +0400, Victor Wagner пише:
>> On 2007.09.21 at 09:14:34 +0300, Vadym Kurylovych wrote:
>>
>> > имеется файлопомойка на 1 ТБ
>> > надо собрать статистику по файлах, точнее какой тип файлов сколько
>> > занимает
>> > может есть готовое решение?
>>
>> Задачка из серии "дешевле решить заново, чем искать куда положил
>> решение, сделанное в прошлый раз".
>>
>> Особенно если учесть что с "прошлого раза" определение "типа файлов"
>> могло поменяться. Что такое "тип" - это то, что выдает команда file
>> или расширение?
>>
>
> расширение
Эээ. Строго говоря, в *nix нет такого понятия -- "расширение",
есть понятие "суффикса", которых может быть более одного.
Поэтому задача поставлена не совсем корректно: .tar.gz -- это
тот же "тип" что и .tar или все файлы "*.gz" принадлежат к одному
типу? и так далее, не говоря уж о том что файл может вовсе не иметь
какого-то осмысленного суффикса.
А так:
ls -lR /path-to-files | awk '/^-/ {
if ($NF ~ /\./)
sub(/^.*\./, "", $NF);
else
$NF = "<undefined>";
typesize[$NF] += $5
}
END {
for (i in typesize)
print i, typesize[i];
}'
--
S. Y. A(R). A.
Reply to: