Cum de a construi un vmware ha de cluster v-grad

1. Informații generale

Înaltă disponibilitate - tehnologie clustering proiectat pentru a crește disponibilitatea sistemului și să permită, în cazul defectării unuia dintre gazdele ESXi, reporni automat mașinile virtuale de pe alte gazde ESXi, fără intervenția administratorului.

Pentru a crea un cluster HA, avem nevoie de la toate mașinile virtuale din cluster este stocat pe un suport de date *. Mai mult decât atât, dacă nu îndeplinește una dintre gazdele ESXi, mașinile virtuale sunt toate de pe acest site va fi lansat pe sloturi libere (alimentare) alte noduri de cluster ESXi.

* Magazin general de date pot fi nu numai „de fier“ de depozitare, dar să fie, de asemenea, un software. VMware are în acest scop au produs vSAN (storage area network virtuală). Avem GlusterFS RedHat, etc.

2. Glosar

De înaltă disponibilitate (HA) - tehnologie de accesibilitate noduri mari ESXi;

Izolarea răspuns (IR) - parametrul definește acțiunea ESXi-gazdă când încetează să recepționeze semnale de disponibilitate de cluster. La crearea unui cluster pentru fiecare set ESXi-gazdă HA agent, care va comunica semnalele de disponibilitate (Heartbeat);

Rezervare - parametru se calculează pe baza maximă a tuturor caracteristicilor individuale ale BM în cluster și, ulterior, folosite pentru a calcula Failover capacității;

Capacitate failover (FCap) - parametru determină toleranța reală de eroare. Măsurată în numere întregi, și indică numărul maxim de servere din cluster poate da greș, atunci toate clusterului s-ar continua să funcționeze;

Numărul de eșecuri gazdă permise (FNO) - parametrul stabilit de către administrator. Stabilește nivelul țintă de toleranță la erori. Aceste noduri cantitate ESXi poate eșua simultan;

Starea Admission Control (ADC de stat) - se calculează automat ca un raport față de failover Capacitatea numărul de defecțiuni gazdă permise;

Controlul admisiei Parametru (ADC) - Administratorul este numit. Stabilește comportamentul mașinii virtuale la eșec sloturi pentru a le rula;

Restart prioritare (RP) - mașini rula prioritate după căderea unuia dintre nodurile ESXi din cluster.

3. Secvența de creare a unui cluster HA

Se determină numărul și dimensiunea fantelor pe noduri ESXi (rezervare);

Setați valoarea numărul de defecțiuni gazdă permise (FNO);

Ne așteptăm ca parametru failover Capacitate (FCap);

FNO și comparați FCap. Dacă FNO mai FCap. avem nevoie de:

Sau achiziționați un server;

Sau o valoare mai mică FNO;

Sau optimiza Rezervatiei;

ADC sau setați parametrul care să permită mașinii virtuale să fie pornit, chiar dacă acestea încalcă constrângerile de disponibilitate;

Set de control al admisiei parametru într-unul din statele;

Noi determina comportamentul gazdă pentru a primi rezilierea semnal disponibilitatea celorlalte noduri (răspuns de izolare);

Atribuirea mașini virtuale Reporniți prioritate;

Răspuns 4. Izolarea

Acțiuni la încetarea de a primi semnale de disponibilitate de cluster HA Răspuns valoare determinată de izolare, determinarea efectului nodului ESXi atunci când ele încetează produc semnale de disponibilitate de cluster (Heartbeat). semnalul de terminare a primit disponibilitatea se datorează „izolarea» ESXi, de exemplu, în caz de eșec al plăcii de rețea.

Există mai multe scenarii prospective:

Imposibilitatea de a trimite / primi semnale de disponibilitate, dar rețeaua în sine continuă să funcționeze;

M-am oprit rețeaua de lucru între cluster ESXi nod și alte noduri, dar ESXi continuă să funcționeze;

În primul caz, ar trebui să alegeți răspunsul de izolare valoarea - Lăsați pornit, atunci toate mașinile vor continua munca lor, în ciuda faptului că primesc disponibilitatea de mai semnale.

În al doilea caz, trebuie să selectați răspunsul de izolare - Oprire sau oprire (implicit) în cazul în care ESXi semnalele oprit-gazdă care primesc disponibile, HA va transporta un total de stocare VM, stocate pe acea gazda ESXi, pentru a elibera ESXi-gazde. ESXi-gazdă ar trebui să fie pornit automat pentru a evita orice conflict de două gazde identice.

5. Rezervare de resurse (Rezervare)

La calcularea parametrului failover cluster-ul Capacitate HA creează mai întâi sloturi definite parametru de rezervare. Acest parametru este calculat în funcție de mărimea maximă a mașinilor virtuale care rulează pe nodurile cluster.

6. Setarea Failover Capacitate

După calcularea fantelor determinate de parametrul însuși Failover Capacitate. Se măsoară în numere întregi și indică numărul maxim de noduri din cluster poate eșua simultan. În acest caz, toate mașinile trebuie să continue să funcționeze.

Ilustrarea parametrul Failover Capacitate. Luăm două cazuri (verticale: 1 st caz - un nod eșec ESXi, 2 caz II - refuz 2 noduri ESXi).


Primul caz 3 nod ESXi, 4 la fiecare fantă, 6 VMs.
În acest caz, la defectarea unui nod (de exemplu, №3), 4,5,6 VM va fi pornit pe alte noduri (în acest caz №2, indicate prin săgeți), dar, în cazul defectării unui alt nod, sloturi libere VM nu rămâne sub start.

Al doilea caz 3 nod ESXi, 4 la fiecare fantă, 4 SMN.
În acest caz, sloturile libere va fi suficient, chiar dacă acestea se încadrează doar 2 noduri ESXi (în cazul nostru, VM migrat la gazdă №1).

Capacitatea tehnică Parametrul failover se calculează după cum urmează: numărul de toate nodurile din cluster, scădem raportul dintre numărul de mașini virtuale în cluster la numărul de sloturi pe o gazdă ESXi. Dacă se dovedește că nu este un număr întreg, rotunjească în jos.

Pentru primul caz: 3-6 / 4 = 1,5 rotunjit la 1;
Pentru al doilea caz: 3-4 / 4 = 2 Deci 2 rămâne;

Controlul 7. Admiterea

Controlul Admiterea am împărțit starea de control al admisiei (statusul ADC) și de control al parametrilor de admitere (parametrul ADC).

condiție ADC determinată de raportul dintre nivelul real al reziliență (FCap) și stabilit de către administrator (FNO). Dacă FCap mai mare FNO. cluster este configurat corect și ar trebui să fie de așteptat problemele. Dacă, din contră, trebuie să setați parametrul ADC.

ADC parametru este determinat de către administrator și poate avea două stări:

Nu puterea pe mașinile virtuale în cazul în care încalcă constrângerile de disponibilitate - să nu includă mașini virtuale, în cazul în care nu sunt suficient de sloturi pentru a se asigura că nivelul țintă de reziliență;

Permiteți mașini virtuale să fie pornit, chiar dacă încalcă constrângerile de disponibilitate - permit rularea mașini virtuale, în ciuda lipsei de resurse posibile pentru a le rula;

Dacă selectați ADC amabilitate înțelege modul în care clusterul va fi construit și în ce scop este necesar:

În cazul în care obiectivul nostru principal - este fiabilitatea clusterului, chiar dacă unele mașini virtuale pentru a fi incluse, trebuie să se stabilească o stare de control al admisiei nu face puterea pe ...;.

În cazul în care, cu toate acestea, este important să se lucreze toate SMN în cluster, trebuie să se stabilească de control al admisiei în stare Permite VM să fie început ....;

În al doilea caz, comportamentul clusterului poate fi imprevizibil (în cel mai rău caz poate ajunge astfel încât VM va reduce valoarea ADC la zero, făcând astfel inutilă tehnologia HA)

8. Recomandări pentru crearea HA Cluster

Noi oferim sfaturi generale cu privire la crearea de clustere HA.

Pentru un cluster cu serviciul activat HA impune ca toate mașinile virtuale și datele lor sunt pe un depozit de date partajate (Fibre Channel SAN. SAN iSCSI. Sau SAN ISCI NAS). Este necesar să se includă VM pe oricare dintre gazdele de cluster. Acest lucru înseamnă, de asemenea, că nodurile trebuie să fie configurat pentru a avea acces la aceleași rețele virtuale de mașini, memorie partajată, și alte resurse;

Fiecare server de cluster ESXi HA monitorizează nodurile de rețea pentru a detecta defecțiuni ale serverelor. Pentru a avea acces la semnalele nu sunt întrerupte, se recomandă să se instaleze căi de rețea redundante. În cazul în care primul nod conexiune la rețea a încetat să funcționeze, semnalele de disponibilitate (bătăi ale inimii) vor fi transmise prin a doua conexiune. Pentru a crește toleranța la erori, se recomandă să se utilizeze două sau mai multe adaptoare de rețea fizice pe fiecare nod;

Dacă doriți să utilizați serviciul DRS în asociere cu HA pentru distribuția sarcinii pe nodurile nodurile de cluster trebuie să facă parte dintr-o rețea vMotion. În cazul în care nodurile nu sunt incluse în vMotion, DRS poate distribui apoi în mod greșit sarcina pe nodurile;

articole similare