50% din hard disk-uri crapa in primul an de functionare si adeseori in primele 30 de zile.
Deci, ~50% din hard disc-urile crapate au 1 an vechime.
Un exemplu clasic de confuzie intre un indicator de incidenta si unul de structura. Un exemplu mai putin clasic de propozitie ce nu contine nici o informatie (a doua, ca prima e gresita).
Sa explic: incidenta ar fi prima propozitie. 50% dintre HDD crapa [...]. Evident altero a remarcat exagerarea. Nu mai explic ca intelege toata lumea.
Propozitia a doua, care formulata cat de cat corect ar fi “50% dintr HDD crapate au maxim un an vechime” ridica probleme interesante. E evident o apreciere a structurii aparitiei defectelor la HDDuri in functie de timpul de aparitie. Mi s-au aprins beculetele si m-am gandit ce-mi spune mie propozitia asta? NIMIC. Sa detaliez.
Daca durata medie de viata a unui HDD e de 2 ani, propozitia imi zice ca distributia defectelor in timp e relativ egala: 50% in prima jumatate a vietii, 50% (adica 1-50%) in cea de a doua. Daca trebuie sa prezic cand se va strica un HDD, adica sa planific mai bine resursele, pot foarte bine sa dau cu banul. Fie in primul an fie in al doilea, probabilitati egale. Dupa cum observati, “prezicerea” e oarba. N-am nici o informatie, n-am nici un cuvant de spus. Informatia e nula.
Eh, daca timpul de viata ar fi 20 de ani, si daca fishbone cu experieta lui de 500-2000 de computere de supravegheat ne-ar fi spus asa ceva (orice numar), am fi avut o informatie utila. Macar una.
Pentru usurinta calculelor presupun ca:
1. timpul mediu de viata e de 20 de ani
2. stricaciunile apar cu o frecventa constanta in timp (fischbone a explicat ca nu e asa, dar facem calculul asa, putem introduce si densitati de incidenta in calcule, dar o sa va pierd repede, daca n-am facut-o deja).
3. Aceasta frecventa e mica (tot fishbone spune ceva de 30/500=6% pentru primii 4 ani)
3. toate rezultatele se iau cu un graunte de sare, adica sigur e atunci cand esti sigur minim 95%, altfel spus ce e sub 5% nu exista sau nu ne intereseaza. Aici nu vorbesc de incidente, ci doar de siguranta ca cea ce spunem noi e adevarat sau nu, in limitele unui interval ce il calculam (ca la sondajele INSOMAR plus si minus X) numit si interval de incredere.
Q1: Care e probabilitatea medie ca un HDD sa se strice in primul an? 1 an/20=5%, daca 1 si 2. Pana aici la mintea cocosului.
Q2: Care este probabilitatea ca 50 din 100 HDDuri sa se strice in primul an? Eh, asta e mai complicat de calculat, dar evident ca stiu si raspunsul.
Evident, intebarea corecta ar fi: care este probabilitatea ca sa se strice mai mult de 50% din HDD in primul an cand stim ca 1,2 si 3. Adica, daca fishbone asteapta sa se strice 5 dintr-o suta in primul an, care e probabilitatea ca lui altero sa i se strice 50?
Pentru calcul folosim distributia binomiala (cumulativa in cazul asta, pentru ca vrem 50% sau mai mult, sa calculam exact 50% ar fi sa calculam care e probabilitatea ca fishbone sa minta si nu vrem sa facem asta). (in excel functia se cheama BINOMDIST, am atasat formula din carti pentru calculul exact)
rezultat: = 3,3 ori 10 la puterea -15 adica 3 si ceva dintr-un miliard de milioane de cazuri. Nu ne mai miram de ce a sarit asa altero, nu?
Q3: Care e probabilitatea sa ii se strice lui nevrozel HDDul in primul an. Pai am calculat la Q1: 5%, il ajuta cu ceva? nu prea. Doar ca acum stim cat de ghinionist e, ca stiam dinainte ca e. Nesansa de la producator i-a pus 5% in carca, dar de restul de 95% pana la evenimentul sigur (HDD stricat) e numai vina ghinionului lui nevrozel!!!
Q4: Care e probabilitatea ca sa ii se strice lui fishbone 5% (sau mai multe) din HDD in primul an? Distributia binomiala to the rescue: 38,4% we’re getting somewhere.
Q5: care e probabilitatea ca sa nu ii se strice lui fishbone nici un HDD in primul an? 6 la mie. Eu zic ca ar trebui sa se pregateasca totusi cu ceva HDD de rezerva.
Q5: care e probabilitatea ca sa ii se strice lui fishbone 9% (sau mai multe) din HDD in primul an? 2,8 la suta. Opa! Deci neglijabil. Hmm… fishbone ca un service grijuliu ce este, stie acum ca 8 hardiscuri de rezerva la fiecare 100 intretinute ar trebui (cu o incredere de 95% evident) sa-l faca sa nu se faca de ras in fata clientilor. Now that’s something to know!
So, iata cu niste propozitii care spun ceva, putem afla mult mai multe. Pana atunci cele 2 propozitii de mai sus valoreaza juma de potcoava de cal mort.
P.S. Pentru incidenta defectelor HDDurilor variabila se pot face tabele de mortalitate, speranta de viata la iesirea din fabrica, probabilitatea de deces pe ani, directa si cumulativa, si cu ajutorul analizei de supravietuire Kaplan Meier putem calcula probabilitati.
P.P.S. Analiza critica a ceea ce spun savantii, cercetatorii, sau cei care cred ca spun adevarul, este ceea ce fac eu “for a living”. Daca am incurcat ceva, e de la oboseala, apropos a mai fost cineva la concertul Omarei din seara asta?