Problema asigurării unei serii de alimentare neîntreruptă a serverelor este destul de acută în orice organizație - fie că este un birou sau un centru de date cu sute de suporturi. Dacă în cel de-al doilea caz în situații de urgență cu furnizarea de energie electrică din surse externe, generatoarele sunt incluse în lucrare. care poate asigura, în unele cazuri, mai multe zile de viață a bateriei (în funcție de alimentarea cu combustibil) fără interferențe din exterior, apoi în prima variantă, toată încărcătura în caz de întrerupere a alimentării cade pe surse de alimentare neîntreruptibile. Toate acestea nu ar fi nimic, dar aici sunt doar sarcinile principale ale UPS-ului de egalizare a tensiunii și furnizarea de viață a bateriei într-o reprezentare minimă un pic mai mult timp pentru a dezactiva cel mai lent server. Cineva poate argumenta, dar UPS-ul nu este proiectat să ofere o funcționare pe termen lung (mai multe ore sau mai mult) a serverului într-o situație de lipsă de energie electrică, pentru că a venit cu generatoare. Cu toate acestea, cumpărarea unui generator, echiparea acestuia cu un sit separat, stabilirea rețelei de alimentare pentru majoritatea organizațiilor este un scenariu insuportabil și, desigur, absolut inutil.
În acest caz, devine necesar să închideți automat serverele până când bateriile UPS sunt complet descărcate. Teoretic se poate face manual, dar chiar dacă aveți doar câteva servere, nu va fi foarte convenabil și rapid. Situația va deveni o problemă gravă, dacă aveți o mulțime de servere sau UPS încărcate la un nivel apropiat de maxim (în acest caz, de obicei, acestea nu au avut mai mult de 5-7 minute, dacă luați în considerare media UPS, fără pachete suplimentare de baterii). Da, și cu închiderea manuală, cineva trebuie să monitorizeze situația 24/7, ceea ce este, de asemenea, nerealist.
Ajutorul vine de la PowerChute Network Shutdown1 de la APC (denumit în continuare PCNS). Acest utilitar este proiectat pentru a efectua diverse scenarii (de obicei, oprirea obișnuită a serverelor) în cazul oricăror evenimente din lanțul de alimentare. Acesta funcționează împreună cu UPS Network Management Card 22 (denumit în continuare UPS NMC), care este în esență o placă de extensie pentru diferite UPS-uri. Soluția, desigur, este aplicabilă numai pentru UPS de la APC.
În articol, intenționez să vorbesc despre experiența mea personală atunci când lucrez cu echipamentul descris mai sus. Cele mai multe dintre aspectele referitoare la instalarea și configurarea echipamentelor, am omite, deoarece cred că acestea lipsesc descriere - pe rețea o mulțime de instrucțiuni detaliate de amatori, în plus, literatura de specialitate care însoțește la toate produsele APC este disponibil în întregime și toate momentele de exploatare sunt pictate foarte detaliate.
Deci, în momentul în care am configurat oprirea automată a serverului, am avut următoarea hardware:
2) Cardul de administrare a rețelei instalat și configurat la UPS: AP9630 4;
3) Rețeaua locală în care se află cardul de gestionare a rețelei și serverele țintă.
Principala dificultate de instalare este că trebuie să știți exact cum va funcționa sistemul. Majoritatea întrebărilor apar în scriptul de închidere a serverului, ghidul oficial discută diverse opțiuni de oprire și în cele din urmă sunt prezentate ca diagrame frumoase. După ce am citit aceste exemple de mai multe ori, am dezvoltat următorul algoritm pentru setarea întregului sistem:
1) Determinați durata maximă de funcționare a UPS atunci când alimentarea este oprită și încărcarea completă. Am avut 12-14 minute, deoarece încărcătura a fost incompletă;
2) Împărțiți toate serverele din cele două liste (poate fi de 3, dar cel puțin 10, dar acest lucru ar complica configurația) - critice pentru serverele organizației (cel puțin un controler de domeniu, server de e-mail, de stocare de fișiere, etc) și servere , care pot fi deconectate în siguranță (serverele care rulează, WSUS, controlorii de domeniu suplimentari etc. fiecare are propriile sale);
3) Pentru fiecare grup de servere, determinați timpul de funcționare după deconectarea puterii de intrare a UPS-ului. Pentru serverele importante, încercați să maximizați timpul de lucru, adică opriți-le la ultima întoarcere (am 5 minute). Acest lucru se poate realiza numai prin închiderea serverelor neimportante cât mai curând posibil (am oprit timp de 30 de secunde).
Apoi, trebuie doar să accesați setările agenților PCNS instalați. Pentru serverele fizice și gazdele de virtualizare, setările vor fi ușor diferite - pe gazdele de virtualizare, trebuie să setați timpul de întârziere pentru închiderea sau migrarea mașinilor virtuale:
În rest, totul este identic, restul setărilor l-am lăsat implicit.
Accesați meniul Configurați evenimente. avem nevoie pentru primul eveniment - UPS pe baterie (UPS funcționează pe baza bateriei, care este, tensiunea de intrare sau a scăzut la zero sau prea mică pentru funcționarea normală), imediat la dreapta acestuia în coloana de Închidere, faceți clic pe pictograma roată (am afișat o capusa, așa cum am deja setați acțiunea atunci când rulează cu baterie). Setați valoarea dorită în câteva secunde. Pentru mine, l-am determinat în 300 de secunde. Asta este, după acest timp, sistemul începe să se închidă, dar mașinile virtuale vor primi mai mult timp pentru a finaliza lucrarea (am specificat-o în setările Setărilor de închidere).
După aceea, este timpul să testați cum funcționează totul în situația reală. Pentru a face acest lucru, am batut de putere separat - pur și simplu tras cablul de alimentare de la UPS. După 30 de secunde, am început pentru a opri virtualizarea gazde secundare și servere fizice, la 5 minute a început să copleșească mașinile virtuale pe servere importante de infrastructură atunci când acestea sunt oprite, gazdele virtualizare și putrede în tăcere de server ...
În prezent, pot oferi câteva recomandări pentru personalizare. Ele pot părea evidente, dar le voi descrie. Cine știe, poate că după un timp vor fi înlocuiți de alte informații, iar experiența este încă utilă.
1) Planificați instalarea CPNS pe serverele dvs.: nu este acceptat niciun sistem de operare. De asemenea, trebuie să decideți ce să faceți cu mașinile virtuale bazate pe sistemele unix, este posibil să trebuiască să scrieți manual scripturi, pentru a le îneca în mod corect. Cu distribuții rare și, de exemplu, sisteme pentru NAS (același Openfiler), pot apărea probleme serioase, având în vedere lipsa totală a sprijinului acestora;
2) Mai mult timp pentru a opri mașinile virtuale. Trebuie să înțelegeți că atunci când toate dispozitivele virtuale încep să acceseze hard disk-urile, performanța acestora va scădea dramatic, iar timpul de finalizare va crește în mod semnificativ;
3) Nu încercați să stoarceți pe deplin vechiul UPS. Lăsați mașinile virtuale și serverele să se închidă puțin înainte ca UPS-ul să fie complet descărcat. Da, chiar dacă este descărcat de doar 50%, ce e în neregulă cu asta? Sarcina dvs. principală nu este să mențineți serverele incluse cât mai mult timp posibil, dar să vă terminați în mod corespunzător munca, la urma urmei. De asemenea, rețineți că, în timp, UPS-urile de pe baterii vor funcționa tot mai puțin din cauza uzurii, ceea ce reprezintă un motiv serios de a lăsa în timp o "marjă de siguranță" suficientă;
4) Asigurați-vă că ați testa scriptul de închidere. Nu ratați un weekend și testați deconectarea serverelor și a mașinilor virtuale cu o întrerupere a alimentării reale. Am petrecut această dimineață devreme sâmbătă cu cronometrele în mână;
Asta e tot. Poți da vina pe mine pentru o mulțime de „apă“, dar în acest articol am încercat să descrie în detaliu cele mai gândirea și logica de luare a deciziilor, deoarece manualele pot citi orice, și experiența personală pe drum nu minte.