Pentru a începe cu, termenul nu se aplică un failover la soluții de cluster, acesta este rezultatul unei traduceri incorecte a cluster-ului pe termen failover. Traducerea corectă - cu failover. deși acum utilizate din ce în ce un alt termen - disponibilitate ridicată (disponibilitate ridicată). care, în opinia noastră, reflectă cel mai fidel esența lucrurilor.
Pentru a înțelege de ce clusterul nu este vina tolerant, vom explica mai în detaliu structura și schema activității sale. precizează imediat că clusterele sunt utilizate nu numai pentru a furniza toleranță la erori, de asemenea, circuite de cluster utilizate pentru echilibrarea încărcării sau creșterea puterii de calcul. Cu toate acestea, ca parte a acestui material, vom vorbi despre clustere de înaltă disponibilitate.
Circuitele de cluster clasic cuprinde cel puțin două noduri și stocarea partajată interconectate mai multe conexiuni de rețea.
În primul rând este o rețea de grup de servicii pentru a transmite semnalul „puls“ (ritm cardiac). în care cluster monitorizează starea de sănătate a nodurilor sale (se arată în roșu în diagramă), o rețea zona de stocare (SAN, albastru) într-o soluție de low-cost este adesea iSCSI printr-o Ethernet-rețea separată, dar poate fi, de asemenea FibreChanell sau alte tehnologii. Pentru client service de cluster este inclus în rețeaua existentă.În conformitate cu schema de unități de lucru pot fi operate în modul de activ-pasiv sau activ-activ. În primul caz, toate cererile clientului sunt deservite de unul dintre nodurile, al doilea nod vine numai în funcțiune atunci când sa defectat. Al doilea exemplu de realizare asigură procesarea cererilor clienților de către ambele noduri, astfel, de asemenea, posibil să se pună în aplicare echilibrarea încărcării, și creșterea resurselor de calcul, prin adăugarea de noi noduri în cluster. În cazul defectării unuia dintre nodurile client tratate cere nodurile rămase.
Un punct important - fiecare cerere client este deservit de doar unul dintre nodurile clusterului, iar în caz de eșec al clienților conectate vor primi o negare a serviciului, dar ele sunt acolo trece, de asemenea, la nodurile rămase disponibile. Acesta este motivul pentru care un astfel de sistem nu este tolerant la erori, eșec nod va provoca o negare a serviciului, dar clientul se poate conecta întotdeauna la un alt nod de lucru care pune în aplicare schema de serviciu disponibilitate doar de mare.
Cititorul atent trebuie să acorde o atenție la existența în diagrama de mai sus, punctul de eșec - magazia. Într-adevăr, pentru depozitare disponibilitate ridicată trebuie să fie, de asemenea, tolerant la erori și foarte disponibile. Acesta poate fi pus în aplicare ca de cumpărare modele speciale de hardware și software, inclusiv cele bazate pe software open source.
Dacă magaziei folosind iSCSI, utilitatea rețelei zona rețelei de cluster și de stocare pot fi combinate. Dar acest lucru ne lasă cu un punct de eșec - a rețelei, astfel încât ar trebui să utilizați pentru a accesa SAN în sistemul de răspundere a cel puțin două rețele. Pe lângă îmbunătățirea fiabilității acestei abordări îmbunătățește tranzitată, care este de asemenea important.
Nu trebuie să uităm despre soluțiile software pentru a crea un cluster failover pe doar două nodah folosind ca mediu de stocare virtuale SAN. De exemplu, StarWind Virtual SAN, iSCSI care creează o stocare virtuală bazată pe discul local al fiecărui nod. Acest lucru reduce costurile de creare și plasarea depozit failover, dar în același timp crește cerințele privind performanța rețelei între nodurile clusterului, ca atunci când scrierea pe disc toate schimbările există, de asemenea, sincronizate între nodurile. În prezent, cluster sunt tot mai folosite pentru virtualizare, în acest caz, administratorul mașinii virtuale pentru a distribuite manual între noduri, ținând cont de resursele de calcul. Pentru fiecare specificate nodurile virtualke disponibile în ordinea descrescătoare a priorității. Acest lucru elimină pericolul de a cere mașini virtuale pe unități slabe. În cazul în care o închidere grațioasă a unuia dintre nodurile clusterului toate mașinile virtuale care rulează pe ea, prin utilizarea unor mecanisme de migrare vii sunt transmise către alte noduri fără a întrerupe munca sau pauze lor.Atunci când un nod nu toate mașinile virtuale care rulează pe ea repornite pe alte noduri, în funcție de prioritatea expusă.
Pentru a evita sarcina excesiv pe stocare și rețea zona de stocare în setările mașinii virtuale, puteți seta întârzierea de recuperare virtualke atât de critică poate fi repornit imediat, minor - după un anumit timp.
În următorul nostru articol vom uita la punerea în practică a unui cluster failover Hyper-V-based.