[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: md5 hashes zu kurz (zu viele collisionen)



Hi,

Michelle Konzack wrote:
> Moin Leute,
> 
> Ich habe einen FileServer auf dem derzeit 130 millionen Dateien von
> wenigen Bytes bis zu hunderten von MBytes gespeichert sind.

Lächerlich.

> Alle Dateien haben md5 hashes und bei der eintragung in meine
> PostgreSQL sind Fehler aufgetaucht...  (die md5 hashes sind die
> primary keys)
> 
> Ich habe weit über 2000 collisionen!
> Was somit über 2000 zuviel sind.

Theoretisch kann es durchaus zu einer Kollision zwischen den Hashes
zweier Dateien kommen.
In diesem Universum sind 2000 Kollisionen jedoch unmöglich weil das
so unglaublich unwahrscheinlich ist, dass es nur aufgrund einer
falschen Implementation oder eben bei Dir auftreten kann.

> Gut, nachdem diverse Filesharing Firmen (Napster?, Kaaza?) miliarden
> von Dateien handhaben müssen, - und es bereits 64 Byte md5sums gibt,

Was sollen denn 64Byte md5sums sein?
Du möchtest bestimmt mal im RFC 1321 blättern.
Md5 ist erzeugt einen 128-bit fingerprint und sonst nix.

nea:~# cat /proc/crypto
name         : md5
module       : kernel
type         : digest
blocksize    : 64
digestsize   : 16
--< cut >--

Falls Dir das nicht reicht, es gibt auch andere Hash-Algorithmen.

-Jörg



Reply to: