Re: [++++SPAM++++] Re: [Tech] velocità del disco diverse tra NTFS e ReiserFS

Marco Ermini markoer@markoer.org
Ven 27 Apr 2007 20:30:15 CEST


On 4/27/07, Pietro Poggi <pietro.poggi@unifi.it> wrote:
[...]
> Io parlavo del transfer rate interno, cioe' di dati che non
> sono in cache, se quando vado a leggere un dato ho la fortuna
> che sia in cache bene, se non c'e' dovra' andare fisicamente
> a leggerlo sul disco, non capisco bene la tua obiezione.

L'obiezione è molto semplice: NON PUOI SAPERE quanto ci metterà il
disco a prendere il tuo dato.


> Riguardo a hdparm io no ho mica sostenuto che e' il migliore
> test da fare, davo solo una spiegazione alla domanda che ha iniziato
> il thread che riguardava la differenza tra le velocita' di accesso
> ad un filesystem NTFS e uno ReiserFS e dicevo che i filesystem
> non c'entravano ma era solo una cosa riguardante la posizione fisica
> dei dati sul disco, e continuo a pensare che quella era la spiegazione,
> e mi sembra anche una spiegazione semplice.

Ed è una spiegazione che confonde l'accesso FISICO con il LOGICO al
disco, semplice.

hdparm non è un pessimo tool, è il tool sbagliato. Lo stai usando per
testare una partizione, quando lui testa solo dischi. Non è difficile
da capire :-)


> Comunque dobbiamo intenderci di cosa parliamo perche' tu mi parli
> di ambienti con risorse elevate (array di dischi ecc.), io mi riferivo
> a desktop casalingo o usato come workstation personale, in poche
> parole mi riferivo a un singolo disco, senza far entrare in gioco
> scenari piu' complicati. Parlando del range di cilindri del disco
> dove sta una partizione e' chiaro che parlavo di un singolo disco,
> se mettiamo di mezzo un raid con striping ecc. allora stiamo
> cambiando argomento e certamente e' molto piu' complicato di quello che
> dicevo io.

Ho risposto a quello che hai detto tu, ovvero che è "poco noto" che ci
sono grosse differenze nell'accesso a settori diversi dei dischi e che
"bisognerebbe tenerne di conto". Io ti rispondo che è poco noto perché
è praticamente inutile saperlo e ti ho dato una giustificazione.

E il volume manager è installato di default in qualsiasi installazione
di Ubuntu casalinga del cavolo... senza dischi RAID o altro...


> Magari hdparm non e' la cosa migliore, ma appunto se parliamo di singolo
> disco, una partizione fisicamente sta tra un raggio
> minimo ed uno massimo (a meno che non ci sia un remapping logico dei settori
> nell'elettronica di controllo del disco, ma non sembra comune).
> Senza pretendere di essere uno specialista, ho letto un po' su queste
> cose e questo e' quello che ho sempre trovato, se mi sai indicare
> una fonte che mi spiega perche' non e' cosi', sono sempre
> contento di imparare.

Sono talmente stanco di ripeterlo :-) non capisco cosa ci sia di così
complesso... si sta confondendo il test di un filesystem con quello di
un accesso fisico a un disco con quello di una partizione... quando si
legge qualcosa bisogna contestualizzarlo e capirlo, non dico altro :-)


[...]
> Ok, dicevo sopra che parliamo di cose diverse, io parlavo di 1 disco
> sul proprio computer, di una singola persona che non ha mucchi
> di dischi che vanno e vengono, mica sostenevo che uno puo' mettersi
> a calcolare dove stanno fisicamente i dati in un array.
[...]
> d'accordo, parlavo data transfer interno, quindi di dati non cachati.
[...]
> Ma bisogna intenderci di cosa parliamo, allora saro' piu' preciso:
> con linux intendevo linux su architettura x86 e dischi partizionati
> nel modo tradizionale (Dos-style). Va bene ora ?
> Se mi generalizzi tutto rispetto al contesto a cui mi riferisco
> e' chiaro che c'e' sempre qualcosa che non va bene in quel che dico ...
> Ma e' normale che uno quando parla non dica tutto esplicitamente
> ad es. se parlo del tempo che ci mette un oggetto a cadere
> da una certa altezza, non mi metto a dire "sul pianeta Terra"
> e a precisare la latitudine perche' l'accelerazione di gravita'
> varia da un posto ad un altro ecc. :-)
[...]

Se uno delimita arbitrariamente l'ambito della discussione può
facilmente avere ragione su qualsiasi argomento :-)

Su questo non mi esprimo, lo ritengo inutile :-)


> Ma i filesyestem stanno dentro una partizione, se la partizione
> occupa una certa zona del disco, li' stanno i dati; ok i blocchi
> che appartengono ad un file stanno dove vogliono dentro allo
> spazio allocato per quella partizione, ma non e' che
> stanno fuori da li'.

Hai mai visto lo spazio disco occupato fisicamente da un filesystem
come ext2, per esempio, con un tool tipo Partition Magic? i dati sono
completamente sparsi dall'inizio alla fine della partizione - il
filesystem segue la sua logica, esattamente come uno scheduler di un
kernel alloca la memoria, ovvero seguendo un algoritmo, non in modo
sequenziale.

Sono d'accordo che non uscirà dai suoi "confini" - a meno che non usi
un Logical Volume Manager (ripeto, installazione di default della
Fedora, RedHat, Ubuntu, ecc.), in questo caso potresti non essere
nemmeno sicuro di come sia fisicamente organizzata la partizione, o
comunque potresti ritrovarti a spostarla se cambiano le tue esigenze.

Per capirci e ricapitolare: l'argomento che stavo sostenendo era
l'inutilità pratica, per tutta una serie di motivi che non ripeto più
:-) di fare tanti calcoli circa la formattazione del tuo disco con
Linux.

Se hai un sistema di fascia bassa, hai comunque

1) la cache del disco
2) la cache del controller
3) possibilmente un LVM
4) probabilmente hai fatto una unica grande partizione :-)
5) il tuo filesystem astrae logicamente "on top" a tutte queste cose
6) è poco probabile che comunque tu avverta alcuna differenza :-)

Se hai un sistema di fascia più alta, hai innumerevoli altri layer di
astrazione.

[...]
> Si' io parlavo di un sistema "casalingo", che poi non e' cosi'
> riduttivo, nella mia esperienza si riferisce anche nei sistemi
> normalmente usati  per il calcolo scientifico ad es. da fisici
> e ingegneri, che a parte centri di calcolo particolarmente evoluti,
> sono piu' o meno sistemi casalinghi.

Spero e mi auguro che non impieghino il loro tempo calcolando
l'opportunità del partizionamento dei dischi dei loro sistemi...
comunque, o sono casalinghi o non lo sono :-)

Per il resto è solo una ripetizione quindi mi sono già espresso :-)


[...]
> Io non sostengo che si DEVONO fare queste considerazioni
> (sulla velocita' di accesso alle varie partizioni) partizionando
> un disco, dico solo che se uno ha voglia di farle sta facendo
> una cosa che ha un senso !

No, non ce l'ha.


> E volevo solo dare una spiegazione
> ai risultati di hdparm del mail che ha iniziato il thread
> e credo che la mia spiegazione sia azzeccata, tutto qui.

Io credo che sia chiaro come il sole che se usi uno strumento
concepito per accedere fisicamente al disco per misurare la velocità
di un filesystem, stai cannando completamente lo strumento di
misurazione e confondendo l'oggetto realmente misurato.

Ti puoi mettere a leggiucchiare tutte le spiegazioni astruse che vuoi
su Internet, ma stai comunque usando un tool che probabilmente IGNORA
la differenza tra hda1 e hda2 dal momento che sono lo stesso disco,
per misurare la velocità di un filesystem, fregandotene del fatto che
per misurare le performance di un filesystem devi considerare se stai
facendo una lettura o una scrittura, che tipo di dato stai accedendo,
se esistono dei conflitti sul locking, ecc. ecc.

Anche, ammesso e non concesso che ad hdparm gliene freghi qualcosa del
filesystem che stai leggendo, ti sembra un grande metodo per giudicare
un filesystem? ammettiamo pure che Linux ci metta il doppio del tempo
a fare una lettura "raw" da ReiserFS che da NTFS - questo secondo te,
ci dice qualcosa sul come sarà performante il filesystem in un uso
reale, con applicazioni che leggono, scrivono, aprono pipe, fanno hard
e soft lynk, fanno lock sui file, ecc. ecc.?

Quello che ha fatto Valerio all'inizio è paragonabile a un grafico che
stesse cercando di misurare la differenza di performance di un plugin
di Photoshop su un Mac e su un PC, partendo da una discussione
accademica sul numero dei context switch che un sistema RISC fa contro
un sistema Intel nell'esecuzione di un "medio" programma software... è
una discussione accademica e che misura pere contro mele, argomentando
circa quale mela sia più rossa in paragone a una pera...


> Comunque si fa per chiacchierare :-)
> (ed ho chiacchierato tanto, direi, speriamo che qualcuno resista
> a leggere fino a qui...)

Si fa per chiaccherare ma è una questione di metodo e di capire cosa
si sta facendo :-)


> ciao
> Pietro

Ciao
-- 
Marco Ermini
Dubium sapientiae initium. (Descartes)
root@human # mount -t life -o ro /dev/dna /genetic/research
http://www.markoer.org/ - https://www.linkedin.com/in/marcoermini



Maggiori informazioni sulla lista flug-tech