[bglug] md5sum e file

Marco Morosini linux@marcomorosini.it
Gio 22 Apr 2010 09:46:01 CEST


Il 22/04/2010 9.26, Alberto Bonacina ha scritto:
> Ciao a tutti, oggi stavo pensando al funzionamento del md5sum e la sua
> applicazione per controllare se due file sono uguali. Leggendo su
> wikipedia trovo che:
>
> "It is extremely unlikely that any two non-identical files existing in
> the real world will have the same MD5 hash " (so bene che essendo un
> procedimento di hashing ci saranno delle collissioni ma che queste
> sono "poco probabili")
>
> "Because almost any change to a file will cause its MD5 hash to also
> change, the MD5 hash is commonly used to verify the integrity of files
> (i.e., to verify that a file has not changed as a result of file
> transfer, disk error, meddling, etc.)"
>
> Quindi pensavo di utilizzare md5sum per controllare se un determinato
> file è già presente in una determinata cartella. Questo potrebbe
> essere applicato per esempio alle collezioni di musica in cui un
> utente mi passa delle canzoni e io gli prendo solo quei file che non
> ho già; nella mia idea c'è di creare una versione un po' più "potente"
> del semplice copia perchè in quel caso due file identici che hanno
> nome diverso vengono tenuti mentre nella mia idea solo uno deve essere
> tenuto (per esempio quello già presente).
> Probabilmente ci sarà già un programma che lo fa ma per sfizio volevo
> crearlo io (così ho una scusa per studiare Java visto che sto seguendo
> il corso).
>
> Pensate che possa funzionare?
>
> Ciao Alberto
>    
l'idea è carina ma calcolare l'md5sum è un processo lento e impegnativo 
per la cpu
quindi secondo me dovresti creare un database che contiene i nomi e le 
relative md5sum dei tuoi file
solo che quando ti passano dei file dovresti far calcolare al programma 
l'hash e confrontarlo con tutti quelli presenti nel db - solo in questo 
caso andrà copiato perchè nuovo
buon lavoro,
Marco


Maggiori informazioni sulla lista bglug