Categorie
Blog

Lo sventurato rispose

A T T E N Z I O N E ! Questo post ha piu' di sei mesi. Le informazioni contenute potrebbero non essere aggiornate.

Post chilometrico, abbiate pazienza. Se siete sistemisti apprezzerete meglio le sfumature, per gli altri: accozzaglia di sfighe varie ed eventuali.

Sabato mattina, ore 10. Dormo della grossa, la sera prima ho fatto le 2:30. Squilla il mio cellulare e rispondo senza prestare troppa attenzione: “Ahhh server! Server! Il server non si accende, non funziona nulla! Martedì dobbiamo consegnare le dichiarazioni, ieri abbiamo lavorato fino all’una! Ahhh vieni subito!” Trattasi di mio cliente storico (ecco perché ha il mio cellulare), studio di commercialisti”. Balbetto qualcosa tipo “Vi richiamo.” e tento di svegliarmi.

Sono solo con Bibi, Nives lavora. La nostra reperibilità è solo per interventi remoti sui server nostri e dei clienti in housing o hosting presso la nostra sala macchine; di interventi non ne facciamo, e comunque il cliente non ha neppure un contratto che lo preveda, quindi è inutile che io chiami il mio collega di turno questo fine settimana.

Diviso tra il diavoletto (“Spegni il cellulare! Fregatene! Non sei tenuto a andare oggi! Hai sonno e inoltre vuoi stare con Bibi.”) e l’angioletto (“Li conosci da tanto tempo. Sono veramente nei casini. Rischiano di rimetterci una barca di soldi. Pensa se fossi tu al loro posto. E poi lo sai che i sensi di colpa ti annienterebbero.”), decido di accumulare altro Karma positivo, e scelgo di andare. Che poi se scopro che ‘sta cosa del Karma è una stronzata… qualcuno ne dovrà rendere conto. Non so bene chi, ma qualcuno da prendere a calci nel sedere lo trovo.

Mi lavo, convinco Bibi a lavarsi, mi vesto, vesto Bibi, convinco Ginger che no, anche se è sabato non può uscire con noi, prendo la macchina e vado verso il centro sperando che sia una roba tipo un floppy dimenticato nel drive o comunque una stronzata: prima avevo troppo sonno per suggerire soluzioni. Nel frattempo avverto il mio capo: va bene il Karma, ma almeno l’azienda sappia che vado a lavorare.

Dopo un caffè per schiarirmi le idee, salgo dal cliente. Affido Bibi a due volenterose impiegate, e capisco subito che sarà una lunga giornata. Tanto per darmi il benvenuto, il controller IBM ServeRaid 5i mi dice: “Logical Unit: 0”; per forza non parte: ‘sto server manco lo sa, di avere dei dischi. Maledetto. Faccio melina, tanto per scambiare due battute con il titolare, e intanto riavvio un paio di volte dopo aver staccato tutto lo staccabile. Nisba.

A questo punto faccio la Prima Mossa Del Sistemista Ninja™: dal BIOS del controller utilizzo la pratica opzione “Copia configurazione RAID dai dischi al controller”. Soddisfatto della mia sagacia, riavvio baldanzoso e la sorte sembra arridermi: uno dei tre dischi (è un server piccolo, ho dimenticato di dirvelo) è in stato DEAD, morto, kaputt, ma gli altri due fungono. “Logical Unit:1”, sia mai che…. e infatti! Il menu di avvio dell’MBR di Windows 2000 Server mi sorride dallo schermo. Premo invio per far effettivamente partire il sistema, ma…. “NTOSKRNL.EXE is missing or corrupt”. Per i non addetti, uno degli errori più temibili nonché rognosi che si possano incontrare. L’ultima cfg “sicuramente funzionante” non va, la console di ripristino neppure. Pessimismo e fastidio.

Mi armo di pazienza, rovisto dentro un po’ di scatole e trovo il CD del sistema operativo, lo caccio nel drive, e. E. Il CD non funziona. Ora che mi ricordo, lo staccai anni fa perché mandava in palla il server. Mai rimpiazzato, le poche volte che è servito ne ho condiviso uno di un client. Smonto un PC decrepito trovato in archivio, bestemmiando perché 10 anni fa HP fissava le meccaniche con 10 viti di 3 tipi diversi, e monto un vecchio CD sul server. Faccio il boot, ma so già che non servirà a nulla: il S.O. non ha i driver per il controller RAID e quindi non vede una beata fava.

Rovisto nuovamente nelle scatole, trovo il CD con i driver, trovo un floppy e ci copio i file. Torno dal mio amico, e secondo voi il floppy funge? Esatto. Torno alla carcassa nell’archivio, e altre 10 viti dopo, ritorno con una vecchia baracca di meccanica floppy che sembra più o meno funzionare. Rifaccio il boot, gli passo i driver, e finalmente vede l’unità logica. Windows 2000 Server non ha grandi tool per riparare una installazione corrotta, l’unica cosa che c’è, il recovery, non mi degna neppure di una flebile speranza: mi fa una pernacchia e mi dice di arrangiarmi nel suo simpatico technichese.

OK. E’ giunto il momento di pronunciare la parola che finora ho fatto finta di ignorare. “Ehm, come stiamo a backup?”. E qui faccio partire il flashback, che a me JJ.Abrams mi fa una pippa.

<flashback>Il giorno precedente, un collega è intervenuto in seguito ad una chiamata: “I Backup non funzionano”.  Questa azienda usa un netdisk per i backup, un disco esterno ethernet Acer Easystore da 1TB in RAID5, con un po’ di script Robocopy che fanno un backup al giorno, uno alla settimana, ed uno al mese; gli ho fatto adottare questa soluzione dopo il secondo tape rotto, e tanto non cambiavano mai le cassette. Almeno così gli arriva la mail e si accorgono se il backup ha funzionato. Improvvisamente gli script hanno smesso di funzionare; il collega venerdì mi chiama e mi dice che tutti i client raggiungono il disco, ma il server no. Pare abbia risolto riavviando il server. Per fortuna ha avuto la presenza di spirito di lanciare a mano un backup dopo che l’accesso si è ripristinato. Comunque, un po’ di salvataggi ci sono, e se siamo fortunati l’ultimo è di ieri; perderanno qualche ora di lavoro, ma pazienza: “piuttosto che nulla, meglio piuttosto”, diciamo a Genova.</flashback>

LA configurazione del NAS Acer si fa via browser, quindi come prima cosa devo rattoppare un minimo la rete, visto che il caro estinto ci elargiva i suoi servigi di DHCP e DNS. Tiro il firewall per la giacchetta e configuro lì sopra un DHCP di fortuna che distribuisca IP e passi i server di Telecom come DNS, oltre che sé stesso in qualità di gateway. Riavvio un po’ di client qua e là e tutto (tutto? cioè, partono) sembra funzionare. Scarico uno scanner di rete perché non so l’indirizzo del NAS, visto che tutta la documentazione era sul desktop del coso in coma di là, lo trovo e ci punto il browser. Voi ve la ricordate la password? Io no. Per fortuna ho la vivida impressione di aver lasciato le credenziali di default; rovisto nuovamente nelle scatole e trovo il manuale in cui cui sono indicati user e password di fabbrica. Li provo e mi faccio mentalmente i complimenti per non essere troppo paranoico quando non serve.

Comunque, guardo un po’ la configurazione e comincio a capire che la giornata non è ancora finita: questa bella scatoletta sembrava incredibilmente comoda un anno fa, quando l’avevo installata: “Hei! Che figata! Importa gli utenti da Active Directory, non devo neppure crearli!”

Che. Enorme. Fregatura.

In mancanza di Domain Controller, morto di fianco a lui, questo pezzo di scatola non ti fa accedere ai dati salvati, perché non autentica l’utente. Le credenziali di amministrazione non consentono comunque di accedere ai dati sui volumi condivisi. I dati ci sono, ma sono blindati perché io ho la chiave, pecccato che manchi la serratura. Non mi perdo d’animo, e consulto Google e le pieghe del menu di configurazione: c’è una voce che recita orgogliosa: “Change Authentication Method”, cioè passare alla gestione con utenti locali. Peccato che un avviso terroristico subito sopra avverta che utilizzando questa opzione si perderanno tutti gli “shared folder assignments”, e passi, ma anche gli “user data”. Opporcammerda!

“User data” si riferirà ai dati relativi agli account utente o ai dati che gli utenti hanno salvato sul NAS? Mistero. Personalmente propenderei per la prima potesi, ma non voglio rischiare. Facciamo il punto: tutti i dati sono su un server che non parte e i cui dischi hanno gravi problemi, i backup non sono accessibili senza fare una scommessa rischiosa. Che vita schifosa. Cinque anni di lavoro, una intera azienda, tutti i dati, tutto. Tutto a rischio di essere annientato; c’è qualche backup sparso in giro su alcuni client, ma roba vecchia e largamente incompleta, e un po’ di nastri fermi all’anno scorso. Urgono un coniglio e un cappello.

A questo punto faccio la Seconda Mossa Del Sistemista Ninja™: estraggo dallo zaino un CD di Acronis True Image Enterprise che ho casualmente trovato a terra poco prima (mica è mia, avevo giusto in previsione di portare questo CD all’ufficio oggetti smarriti. Non è mia. Io non ho la licenza di quel robo lì). Questo sopraffino pezzo di software permette di fare immagini di dischi e partizioni anche via rete o su dischi esterni, permettendo anche di scegliere i dati da includere. La versione Enterprise è sufficientemente furba da riconoscere i controller RAID più comuni di HP, IBM e altri vendor. Sbatto il CD nel drive, riaccendo il cadavere e con mia grande gioia vedo controller, dischi, partizioni, dati. Sembra ci sia tutto, peccato che alcune cartelle non siano selezionabili, pena un crash irrimediabile che porta al riavvio immediato del server. Con pazienza certosina seleziono tutto quello che posso e, assegnato un IP alla scheda di rete, tento di raggiungere un client. 🙁 Niente, nisba, non vede nessun host, non sfoglia la rete, non permette di inserire a mano l’IP dell’host di destinazione del backup. Una decina di riavvii dopo, estraggo dallo zaino un disco esterno USB da 80 GB, più che sufficienti per il salvataggio, che pesa 36 miseri giga. Lo attacco, ATIE lo vede e finalmente (dopo solo un paio di crash, ecchevvuoichessia?) il programma inizia a creare l’immagine.

So che sarà lunga, nel frattempo torno a cercare di capire cosa succederà al NAS; mentre passo in corridoio mi rendo conto che Bibi, della quale nel frattempo avevo perso le tracce, ha exploitato l’ufficio. Su quasi ogni scrivania ci sono pennarelli suoi, alcuni suoi disegni campeggiano su un monitor, e lei sta giocando a un-due-tre-stella con un paio di impegate amministrative. “Sai, papà, prima abbiamo giocato a nascondino”. Le tipe sono visibilmente provate, ma mai quanto me, quindi le lascio alla loro sorte senza il minimo rimorso.

Improvvisamente mi rendo conto che è ora di pranzo, e saltare non è un’opzione praticabile: Bibi mangia come una squadra di rugby. Devo comunque attendere l’esito dell’immagine su disco, quindi torno a liberare le due malcapitate, che mi guardano tra lo sconvolto e il riconoscente, e porto la prole affamata al più vicino self-service.

Qualche cotoletta, un po’ di patate al forno e un ghiacciolo alla menta dopo, torniamo all’ufficio da cui nel frattempo le due impiegate martiri sono sparite. Convinco Bibi a fare qualche disegno mentre aspetta Nives che sta venendo a prenderla. Acronis mi attende con buone notizie: diversi errori irreversibili di lettura, che, non visto, decido di ignorare bellamente, un errore di scrittura, che porcavacca non mi dirai che il mio HD sta andando, e per far buon peso ci tiene a farmi sapere che ne avrà per almeno altre 4 ore. Simpatico come una cacca nella federa del cuscino.

OK, è ora di reagire. Prendo il titolare, gli spiego cosa sta succedendo il più dettagliatamente possibile, gli faccio presente che non abbiamo altre opzioni poiché la partizione del server è sicuramente troppo danneggiata, e gli spiego la cosa dell’autenticazione sul NAS. Mi accerto che abbia capito il dubbio sulla cancellazione degli “user data”, e gli chiedo l’autorizzazione a procedere.

Lancio il browser, lo punto al NAS e senza indugi clicco su “Change Authentication Method”. Il coso se la prende comoda, mi dice che ci può mettere anche 10 minuti. Il titolare suda, io penso che è sabato, sono stanco, non ne ho più voglia. Qualunque cosa, pur di uscire di qui.

Finalmente il responso: i dati ci sono ancora. Più tardi scopriremo che risalgono a venerdì alle 20; poteva andare molto peggio.

Da qui in poi è solo noia e ordinaria amministrazione: rimappo i client per usare il NAS per i documenti e copio i db su un client Vista Home, frutto di una sciagurata incursione al centro commerciale. E’ l’unico che ha abbastanza spazio su disco e può stare sempre acceso, bello eh? Faccio fare due test e cerco di rappezzare le stampanti, che ormai voglio solo andare via.

Nel frattempo Nives e Bibi hanno fatto un giretto al Porto Antico, io faccio firmare un rapportino da 7 ore festive e mi fiondo a prenderle. Spero che l’intervento venga fatturato con tariffe da idraulico notturno d’urgenza.

Il cliente adesso può lavorare e presumibilmente onorerà le sue scadenze.

<flashforward>E’ martedì. Ho chiamato lo studio, lavorano, son contenti. Per festeggiare gli ho appena consigliato di comprare un altro server per fare il grosso del lavoro, e affiancarvi il vecchio dopo aver buttato un po’ di frattaglie; da RAID5 passerà al mirroring (RAID1), che tanto i ricambi costan troppo, in proporzione.</flashforward>

72 risposte su “Lo sventurato rispose”

tutto ciò mi ricorda perché nel 1997 ho smesso di fare il sistemista (per di più in ina finanziaria, tutta as/400 e con un subserver os/2 pre-warp su cui andavo a tentoni. Aggiungi che i dipendenti della finanziaria erano tutti gay e temevo ad inchinarmi per aprire i case dei terminali e che il supporto dalla sede centrale era gestito da un misantropo che rispondeva a grugniti e comprenderai il mix di gioie che affrontavo quotidianamente. Con in più l’ansia che questi, facendo credito al consumo, perdevano soldi per ogni minuto di down. E non è facile ragionare col fiato altrui sul collo. Quindi, complimenti per la perseveranza: io li avrei mandati a stendere al primo giro di valzer 🙂

Quindi, morali varie della favola:
– sempre avere DUE controller di dominio
– il RAID5 è una fregatura. Non è vero che sei in una botte di ferro
– salvare i dati su dischi USB esterni con il backup di Windows (li riattacchi dove vuoi e son pronti)
– la Console di Ripristino è la dea suprema dell’inutilità
– comprate sempre almeno un pc al centro commerciale

che ricordi, si ti capisco mi è successa una cosa simile..
il sabato mattina era proprio bello…quandi mailserver che si sputtanavano tra il venerdì e il sabato ( cosa tra l’altro che non ho mai capito )

come disse murphy..coraggio domani andrà peggio! hehe
complimenti cmq…

Altro che film triller!

Mi son rivisto qualche mese fa: cliente con server windows 2000, sistema di backup non funzionante (lettore esausto), butto su un serverino di emergenza per avere i dati salvati almeno da qualche parte (con quella bellissima cosa che è backuppc), avviso il cliente che _è_temporaneo_ … Il cliente ignora i miei consigli, si trova dopo 3 mesi e con continue mie sollecitazioni a sistemare il driver di backpup… crolla il disco del serverino linux. Mi muore il disco nuovo da 250Gb Samsung (altro che sfiga)!
Conclusione: il cliente si inca$$a, e mi caccia via. Minaccia azioni legali. Allego via email le mie considerazioni e consigli dei passati 3 mesi.

Sono in attesa di comunicazioni.

Ebbene si’, ho passato anche io delle giornate e nottate tremende da clienti commercialisti DISPERATI e come al solito senza backup recenti!

E poi una regola d’oro: SCRIVERE TUTTO IL NECESSARIO (IP, password, configurazioni) su un file da mandare alla propria email in rete o comunque in un posto accessibile anche dopo un bombardamento di neutrini 🙂

Senza l’esperienza diretta sono pero’ tutte parole al vento… Grazie per aver diffuso ESPERIENZA!!!

Che dire Andre, mi unisco al tuo dolore.
L’esperienza fa il paio con la mia giornata persa nel vano tentativo di installare XP (che crashava in fase di setup), mentre l’enorme cane lupo del Cliente vomitava a profusione.


Giu

Ue’ ma che roba. Stavo leggendo e borbottando tra me e me: “Ma insomma, e Acronis?” immaginando di scriverti un commento affinché lo raccomandassi al cliente e che includesse il disclaimer “attenzione: lo raccomando perché lo vendo”, quando eccoti usarlo! Ottimissimo… 🙂

Comunque nel flashforward mi aspettavo che gli dicessi che gli raccomandavi anche Acronis True Image. (Disclaimer: lo vendo.)

Cavolo che sabato da incubo! Purtroppo cose come queste capitano prima o poi ad ogni sistemista, non si scappa, ed in questi casi bisogna sperare che il cliente non abbia crisi isteriche… 😀 Comunque complimenti!

nella mia breve carriera domestica di casa il lavoro più difficile è stato riavviare un computer di cui conoscevo solo la marca, senza modello, driver ne niente del genere, con un controller video da buttare e metà delle schede che non andava; niente di tutto questo largamente paragonabile al tuo lavoro. Rispetto Totale

Mi sono rivisto in alcune scene di vita vissuta… e mi vengono in mente due cose a proposito di RAID:
La barzelletta dello storpio che chiede al genio della lampada tutte due le mani uguali (per chi non la sa non si può raccontare senza i gesti) e RAID: li ammazza stecchiti! e non è pubblicità!

Beh l’autenticazione della NAS è una negligenza in sede di installazione non da poco, un errore evitabile.
Potevi pure ripristinare un vecchio backup su cassetta, giusto per avere il dominio funzionante per garantirti l’accesso alla NAS, io non avrei rischiato quell’operazione.

Ciao

… e senza queste fragili macchine il mondo andrebbe a rotoli ormai . . . e pochi ne sono coscienti …
w l’agriturismo
firmato
uno che lavora coi piccì

… perchè siamo così: non riusciamo a lasciare i clienti a piedi anche se lo meriterebbero.
Per fortuna che ci sono i sistemisti appassionati del loro lavoro.
Mi sa che cambierò lavoro
@flaz: vista la situazione, chi non risica non rosica.
Bravo Andrea.

Eheheh… Queste sono le “belle favole” che un poveraccio come me ha piacere di leggere prima di andare a letto. Grazie per aver condiviso la tua esilerante avventura Andrea! Di notevole spessore tecnico… E ancora di più notevole spessore umano, direi.

ps.. lo studio ha ripreso fiato, il lavoro va avanti e tutti sono contenti, a te non cambierà la vita per le sette ore di sabato che ti hanno sconvolto l’intera giornata (leggasi: più ti sbatti, solitamente, e come dipendente poco cambia), il tuo capo si frega le mani, Bibi ha giocato a nascondino e un-due-tre stella e ha colorato, la tua donna ti avrà o poco o tanto fatto pesare la tua “dedizione al lavoro” (se non l’ha ancora fatto, non ci credo che non lo farà mai in futuro… Le donne non dimenticano mai NULLA!)… MA LE DUE IMPIEGATE AMMINISTRATIVE??? Hai avuto loro notizie? Come stanno? Ahahah…

Buona notte Andrea e grazie ancora per il tuo piacevole sfogo. :p

Oh mamma, ho avuto il tempo di leggerlo tutto solo adesso.
Sono stato in ansia fino alla fine.
Solo una cosa è rimasta in sospeso: qualcuno ha patchato l’exploit lanciato da Bibi?! 😉
Ciao,
Emanuele

Non c’è niente da fare, anche se replicassimo ogni cosa all’interno di una rete, qualcosa può sempre andare storto, e sicuramente in un modo che non abbiamo mai affrontato prima.
Sennò perché sulla porta della sala macchine abbiamo messo un post-it con scritto “all’interno vige la legge di murphy” , sapete quando entrerete ma non quando ne uscirete.

Alla prossima blogfest ti candidi come blog letterario?

Sottoscrivo il commento di Suzukimaruti, senonchè operando nello small business ogni tanto vedevo alcune impiegate carine 😉
Ma ho mollato comunque il settore perchè lo stress personale dovuto all’apprensione dei clienti era insostenibile.
Diventare Sistemista Senior significa che ti chiamano per problemi più gravi, che i sistemisti junior non sono riusciti a risolvere, è il controsenso del lavoro come sistemista: più sali, più amari sono i cassi.
E dopo una certa età si ambisce ad un maggior distacco tra lavoro e vita normale 🙂

(oppure si rende il lavoro come una passione e allora non ci si lamenta piu’)

Chapeau comunque!

I commenti sono chiusi