La PNL tra server ridondanti

Si il titolo sembra proprio strano, ma l’argomento è sicuramente interessante, sembrerà una chiacchiera tra colleghi. Mi spiego meglio…..
Un paio di settimane fa, ho deciso di testare con il nostro sistemista la ridondanza dei server che gestiscono, siti, posta, filtri, ecccc……
In questo momento ci sono 2 server + 1 SAN (una macchina che gestisce i dischi fissi), la San di per se è ridontata, cioè se si rompe un disco è in grado di continuare il funzionamento senza alcuna perdita di dati. Per i server invece è stato studiato un meccanismo che permette loro di distribuirsi i servizi in base alle risorse disponibili.
Cosa vuol dire, se ci sono 2 server funzionanti il 50% va ad uno e il 50% va all’altro, se uno dei 2 smette automaticamente il rimanente si prende in carico il 100% del lavoro, ma andiamo a vedere come funziona tradotto in parole

I due server li chiameremo per semplicità con due nomi di persone, Alessandro e Federica, all’interno di Alessandro e Federica ci sono due Ipervisori che hanno il compito appunto di gestire i due server.

Si comincia
Situazione Normale:
Alessandro:Ciao
Federica:Ciao

Alessandro:Che fai?

Federica:Gestisco la posta il filtro antispam e antivirus, tu che fai?

Alessandro:Io gestisco il db del sito, il db delle newsletter, Tway, per me è tutto ok, e per te?
Federica :Guarda in questo momento c’è l’antispam che mi appesantisce un pò, ma non mi lamento tutto procede bene, tu invece come vanno i tuoi processi di lavoro?

Alessandro: Ma qui tutto molto bene, c’è Riccardo Vettore che ogni tanto mi lancia script senza prima provarli in locale e quindi lo stronco subito, ma a parte questo va tutto ok.
Ecco questo genere di informazioni si ripete ogni circa 2 secondi

Situazione Critica, stacco la spina a FEDERICA

 

Alessandro:Ciao
………………
Alessandro:Hei ti ho salutato, tutto bene?
………………
Alessandro:Devo dedurre che hai qualche problema?
……………..
Alessandro:Hai ancora 2,5 minuti per rispondermi altrimenti mi prendo carico delle cose che dovresti fare tu!!

…………….
Alessandro:Hai ancora poco poi mi prendo io le tue responsabilità se non sei in grado di continuare
…………….

Continua a chiedere per i minuti rimanenti dopo di che…..
Alessandro:dichiarazione di morte (WARN: node Federica: is dead…mach_down[26824])

Alessandro:ok, da adesso prendo io le tue funzioni, se ti dovessi riprendere questo messaggio ti verrà consegnato e non ti autorizzo a riprendere la tua funzionalità in quanto la gestirò io finchè i sistemisti non capiranno cosa ti è successo.
Alessandro:Avvio procedure di emergenza

Alessandro:Ipervisore…fai partire i server virtuali latenti
Alessandro:Ipervisore…Prendi possesso delle partizioni di Federica sulla SAN
Alessandro:Ipervisore…Avvia i controlli di coerenza dei dati
Alessandro:Ipervisore…Manda gli avvisi a tutti i sistemisti che siamo in stato di emergenza

Ipervisore : Server virtuali x y z in partenza
Ipervisore :
Ipervisore : Server virtuali avviati, prendiamo controllo delle partizioni logiche della San

Ipervisore: Siamo al 50% di funzionalità
Ipervisore:Partizioni logiche in gestione facciamo partire i servizi
Ipervisore:Siamo al 75% di funzionalità
Ipervisore:Servizi ok, dati ok, sistema funzionante al 100% tutto è nuovamente operativo
Alessandro:Sistemi operativi avviso i sistemisti
…………………
………………..

Federica Si riprende
Federica: Ciao
Alessandro:Hei ciao tutto bene?
Federica: Si, mi hanno staccato la spina da entrambi gli alimentatori, dopo il primo alimentatore ho resistito ma poi hanno tolto alimentazione anche al secondo e mi sono spenta.

Alessandro:Ho capito, non preoccuparti vedrai che adesso Max ti rimette in sesto
Federica: Si ma sto bene, riprendo il mio lavoro che dici?

 

Alessandro:Assolutamente no non sono autorizzato a ripassarti tutto devo attendere il permesso.

Federica:Ok allora aspetto
Alessandro:Si ciao, ti lascio che adesso ho da fare

Comunicazione interrotta

Ecco questo è tradotto in parole quello che è successo durante il test di ridondanza, è quasi incredibile vedere le due macchine che comunicano tra loro come due persone, spero di essere riuscito a trasmettervi l’entusiasmo che avevo mentre succedeva tutto questo

Ciao a tutti e alla prossima

Massimo Romanello
Web Engineer
Resp. Tecnologia e Sviluppo