Creșterea productivității sistemelor de calcul presupune, în primul rând, realizarea unei viteze ridicate de execuție a programelor. Acest obiectiv îndeplinește atât cerințele utilizatorilor interesați de cea mai rapidă primire a rezultatelor contului, cât și faptul că viteza determină cantitatea totală de lucrări de calcul pe care sistemul o poate realiza pentru o anumită perioadă de timp.
Într-o serie de domenii de aplicare, creșterea vitezei de calcul joacă un rol important, deoarece timpul pentru rezolvarea problemelor pe computerele standard se dovedește de obicei prea mare în ceea ce privește utilizarea practică a rezultatelor. Desigur, factorii de cost sunt importanți și în acest caz, însă este mai important să se asigure posibilitatea de a obține rezultate într-un timp acceptabil, cu un minim (în măsura posibilului) a costului calculului.
În astfel de domenii de aplicare sunt necesare supercomputerele.
Principalii factori care determină costul ridicat al VM-urilor super sunt:
1. Costuri mari de construcție, datorită complexității echipamentului și a producției de serie relativ mici.
2. Costul ridicat al echipamentelor, pentru crearea căruia sunt necesare noi tehnologii care să ofere maximum pentru nivelul actual al indicatorilor de dezvoltare tehnologică. Costul echipamentului este, de asemenea, afectat de creșterea numărului de elemente logice, cantitatea de căldură eliberată pe unitate de volum și alți factori similari.
3. Software scump, inclusiv instrumente speciale care vă permit să realizați sisteme potențial de mare viteză.
Domeniul de metode de aplicare pentru a atinge un nivel înalt de performanță acoperă toate sistemele de construcție.
La cel mai mic nivel este tehnologia avansată de proiectare și fabricare a elementelor de mare viteză și a plăcilor cu densitate mare de instalare. În această sferă există cea mai directă modalitate de a crește viteza, deoarece, de exemplu, dacă toate întârzierile din mașină au fost reduse cu K ori, acest lucru ar duce la o creștere a performanței cu același număr de ori. În ultimii ani, s-au înregistrat progrese enorme în crearea unei baze de elemente de mare viteză și a unor metode adecvate de montare, fiind de așteptat progrese suplimentare, bazate pe utilizarea noilor tehnologii și reducerea dimensiunilor dispozitivelor. În acest fel, însă, există o serie de limitări:
1. Pentru un anumit nivel de tehnologie, este furnizat un anumit nivel de performanță al bazei elementare: o dată ce a fost atins, o creștere suplimentară a performanței este însoțită de costuri imense, până la atingerea pragului dincolo de care nu există tehnologii care să ofere performanțe mai rapide.
2. Elementele O acțiune rapidă au de obicei o densitate de ambalare mai mici care, la rândul său, necesită un cablu de conectare lung între plăcile și, în consecință, conduce la întârzierea crescută (compuși datorate) și reducerea câștig în performanță.
3. Elementele mai repede disipa mai multă căldură. Prin urmare, sunt necesare măsuri speciale pentru radiator, ceea ce reduce în continuare densitatea de montare și, în consecință, viteza. Pentru a evita costurile suplimentare, întârzierile datorate conexiunilor și disiparea crescută a căldurii, pare rezonabilă utilizarea elementelor cu acțiune rapidă nu peste tot, ci numai în acele părți care corespund <узким местам>. De exemplu, pentru a crește rata de adăugare, puteți aplica circuite de mare viteză numai în lanțul de transport. Cu toate acestea, modul de creștere a vitezei elementelor are limitările sale și poate să apară o perioadă în care devine necesar sau mai adecvat să se utilizeze alte metode pentru implementarea operației de adăugare.
Următorul pas în direcția creșterii vitezei de performanță implică reducerea numărului de niveluri logice la implementarea schemelor combinaționale. Este bine cunoscut faptul că orice funcție poate fi implementată utilizând un circuit cu două nivele logice. Cu toate acestea, în sistemele complexe acest lucru conduce la apariția unor dispozitive greoaie care conțin un număr foarte mare de porți cu coeficienți excesivi de intrare și ieșire. De aceea, în această etapă, sarcina de proiectare este de a crea circuite cu un număr mic de nivele logice care să satisfacă restricțiile privind numărul de porți și coeficienții lor de cuplare pentru intrare și ieșire. În prezent, au fost dezvoltate principiile de construire a circuitelor care necesită mai puține porți și mai puține întârzieri și au fost propuse metode de creare a acestora. Datorită limitărilor inerente, numai aceasta, de regulă, nu poate da creșterea necesară a productivității.
În plus, viteza sistemelor de calcul poate fi mărită prin implementarea unor comenzi complexe hardware sau software și hardware, în funcție de anumite funcții care apar în multe calcule practice. Aceste funcții includ, de exemplu, rădăcina pătrată, adăugarea de vectori, multiplicarea matricelor și transformarea rapidă Fourier. Aceste instrumente vă permit să reduceți numărul de comenzi în programe și să creați premisele pentru o utilizare mai eficientă a resurselor mașinilor (de exemplu, dispozitive aritmetice prin pipeline). În rezolvarea unor probleme, câștigul rezultat poate fi foarte semnificativ, ceea ce este foarte bine văzut în exemplul computerelor vectoriale considerate mai jos, în care rolul principal este jucat de echipele vectoriale. Pe de altă parte, nu este ușor să definiți astfel de comenzi complexe care ar fi folosite destul de des într-o clasă largă de programe de aplicații. În același timp, studiile asupra proceselor de executare a unui număr mare de programe din diferite domenii de aplicare arată că există o schimbare evidentă a frecvenței utilizării către un set restrâns de comenzi simple. Acest fapt a servit drept bază pentru dezvoltarea abordării, în care un mic subset de comenzi simple și frecvent utilizate care urmează să fie optimizate este alocată dintr-un set de comenzi. În prezent, au fost elaborate o serie de eșantioane experimentale și industriale de procesoare care utilizează principiul optimizării unui set redus de instrucțiuni. Trebuie evaluat impactul acestei abordări asupra progresului în calculul de mare viteză.
O altă rezervă, utilizată pentru a îmbunătăți eficiența procesorului, este de a reduce timpul petrecut în accesarea memoriei. Abordările uzuale aici constau, în primul rând, în extinderea căilor de acces prin divizarea memoriei în module care pot fi accesate
În sfârșit, ajungem la structura algoritmului prin care funcționează sistemul. La acest nivel, abordarea de bază pentru îmbunătățirea performanței este de a executa mai multe comenzi în același timp. Această abordare diferă de cea realizată în mașina obișnuită von Neumann, când comenzile sunt executate strict unul după altul. Abordarea paralelă duce la diferite variante de arhitectură, în funcție de modul în care este atribuită secvența de comenzi și de controlul execuției lor. Paralelizarea permite creșterea semnificativă a performanței sistemelor atunci când se rezolvă o clasă largă de probleme aplicate.
Aceste abordări privesc hardware-ul, organizarea logică și arhitectura sistemului. Eforturile în aceste domenii sunt menite să asigure accelerarea necesară a calculelor la nivel de program-algoritm. La acest nivel, ar trebui utilizate fie limbile de programare specială care furnizează mijloace pentru descrierea explicită a concurenței, fie metodele de detectare a concurenței în programele secvențiale. În plus, algoritmul trebuie să aibă un paralelism intern, corespunzător caracteristicilor acestei arhitecturi. Utilizarea algoritmilor și limbajelor inadecvate poate anula practic posibilitățile de implementare a computerelor de mare viteză, încorporate în arhitectură.
Sisteme informatice multi-computerizate și multiprocesoare (complexe). Definiția, tipurile de legături și organizarea structurală. Caracteristicile software-ului. Exemple de sisteme informatice interne și externe.
Tehnologia de calcul în dezvoltarea sa de-a lungul drumului de creștere a vitezei calculatorului sa apropiat de limitele fizice. circuite electronice de comutare fracții de timp atinse de o nanosecundă și viteza de propagare a semnalelor în liniile de legătură între elementele și părți ale mașinii, este limitată la 30 cm / ns (viteza luminii). Prin urmare, o reducere suplimentară a timpului de comutare a circuitelor electronice nu va permite o creștere semnificativă a performanței calculatorului. În aceste condiții, cerințele practicii (calcule fizice și tehnice complexe, modele economice și matematice multidimensionale și alte obiecte) pentru a spori și mai mult performanțele computerului pot fi îndeplinite numai prin extinderea principiului paralelismului de a face dispozitive de prelucrare a informațiilor și crearea de sisteme informatice multiprocesor (multiprocesor) multicalculator și. Astfel de sisteme permit executarea paralelă a timpului de execuție a programului sau executarea paralelă a mai multor programe.
În prezent, problema asigurării unei fiabilități ridicate și a disponibilității sistemelor informatice care funcționează în diferite sisteme automate de control și sisteme de control al procesului, în special atunci când lucrează în timp real, a devenit extrem de importantă. Această problemă este rezolvată pe baza utilizării principiului redundanței, care se concentrează, de asemenea, pe construirea de sisteme multi-mașini sau multiprocesoare (complexe). Apariția microprocesoarelor ieftine și a microprocesoarelor mici și micro-calculatoare a facilitat construirea și a extins domeniul de aplicare al multiprocesor și multi-
Diferența dintre conceptele de aeronave multi-mașină și multiprocesoare este explicată în figura 6.1. O aeronavă multi-mașină (MMS) conține mai multe computere, fiecare având propriul OP și operează sub sistemul său de operare, precum și mijloace de schimb de informații între mașini. Implementarea schimbului de informații are loc, în cele din urmă, prin interacțiunea sistemelor de operare a mașinilor între ele. Aceasta degradează caracteristicile dinamice ale proceselor de schimb de date între mașini. Utilizarea sistemelor multi-mașină face posibilă creșterea fiabilității sistemelor informatice. Dacă mașina nu reușește într-o singură mașină, prelucrarea datelor poate fi continuată de o altă mașină din complex. Cu toate acestea, se poate observa că echipamentul complexului nu este utilizat în mod eficient în acest scop. Este suficient în sistemul prezentat în Figura 6.1 și în fiecare computer să eșueze pe un singur dispozitiv (chiar și pe diferite tipuri), deoarece întregul sistem devine inoperabil.
Sistemul multiprocesor Aceste dezavantaje sunt lipsite (MPS). În astfel de sisteme (fig. 6.1, b) procesatorii dobândesc statutul de agregate sistem computerizat obișnuit, care, la fel ca celelalte unități, cum ar fi module de memorie, canalele, dispozitivele periferice incluse în sistemul în cantitatea necesară.
Un sistem de calcul se numește un sistem multiprocesor dacă conține mai multe procesoare care funcționează cu un OO comun (câmp comun RAM) și este controlat de un sistem de operare comun. Adesea, un domeniu comun de memorie externă este organizat în IPS.
Prin câmp comun se înțelege echiprobabilitatea dispozitivelor. De exemplu, un câmp comun de memorie înseamnă că toate modulele OP sunt accesibile tuturor procesoarelor și canalelor I / O (sau tuturor dispozitivelor periferice în cazul unei interfețe comune); domeniul general al VLCD înseamnă că dispozitivele care îl formează sunt accesibile oricărui procesor și canal.
In MPS comparativ cu MMC se realizează un schimb mai rapid de informații între procesoare și productivitate, prin urmare, mai mare poate fi obținut, un răspuns mai rapid la situații întâlnite în cadrul sistemului și mediul său extern și fiabilitate mai mare și capacitatea de supraviețuire, deoarece sistemul rămâne operațional, dar viabil pentru cel puțin un modul al fiecărui tip de dispozitiv.
Sistemele multiprocesor sunt principala cale de a construi performanță ultrahigh soare. Stabilirea unei astfel de soare ridică mai multe probleme dificile, care în primul rând ar trebui să includă paralelizare a procesului de calcul (software) pentru procesoare de sistem eficient de încărcare depășirea conflictelor atunci când se încearcă o serie de procesoare de a utiliza resursa același sistem (de exemplu, unele modul de memorie) și reducerea impactul conflictului asupra performanței sistemului, punerea în aplicare a cheltuielilor de hardware de mare viteză rentabile pentru comunicații inter-module. Aceste aspecte trebuie luate în considerare la alegerea structurii MPS.
Pe baza multiprocesării și a principiului modular de construire a altor dispozitive ale sistemului, este posibil să se creeze sisteme tolerante la erori sau, cu alte cuvinte, sisteme de supraviețuire sporită.
Cu toate acestea, construirea de sisteme multi-mașină de la calculatoarele disponibile comercial cu sistemele lor de operare standard este mult mai ușor decât construirea IPU necesită depășirea anumitor dificultăți întâmpinate în punerea în aplicare a domeniului general al memoriei, și, cel mai important, consumatoare de timp de dezvoltare a sistemului de operare speciale.
Sistemele multicalculator și multiprocesor pot fi omogene și eterogene. Sistemele omogeni conțin același tip de computere sau procesoare. Eterogena MMS este format din diferite tipuri de calculatoare, la fel ca în AMM eterogene folosind diferite procesoare specializate, cum ar fi procesoare pentru operațiunile cu virgulă mobilă, pentru procesarea numerelor zecimale, un procesor, implementează funcțiile sistemului de operare, procesorul pentru problemele de matrice și altele.
sistem multiprocesor și MMC pot avea un singur nivel ierarhic sau de structură (stratificat). De obicei, mașină mai puțin puternic (machine-to-satelit) preia informațiile de intrare de la diferite terminale și tratarea prealabilă a acestora, descărcarea acestor proceduri în vrac relativ simple, un computer mai puternic decât creșterea realizată în performanța generală (lățimea de bandă) a unui complex. Deoarece mașinile prin satelit folosesc mici sau micro-calculator.
O caracteristică structurală importantă a aeronavei în cauză este modul de organizare a conexiunilor dintre dispozitivele (modulele) sistemului. Aceasta afectează în mod direct viteza de schimb de informații între module și, în consecință, performanța sistemului. viteza răspunsului său la cererile primite, adaptabilitatea la schimbările de configurație și, în final, mărimea costurilor hardware pentru comunicațiile intermodule. În special, frecvența conflictelor care apar atunci când procesatorii sunt accesați la aceleași resurse (în primul rând modulele de memorie) și pierderea performanțelor datorate conflictelor depind de organizarea comunicațiilor intermodul.
Sunt utilizate următoarele metode de organizare a conexiunilor intermodulare (inter-construcție):
· Comunicarea regulată între module;
· Legături pe mai multe niveluri, corespunzătoare ierarhiei interfețelor de calculator;
· Module cu intrări multiple (în special module de memorie);
· Comutator al legăturilor intermodulare ("Elbrus" Fig.6.2);
· Magistrala generală ("SM COMPUTER" Fig.6.3).
Principiile organizării MPS și MMC diferă semnificativ în funcție de scopul lor. Prin urmare, este oportun să se facă distincția:
· VS, axat în primul rând pe obținerea performanțelor ultra-înalte;
· VS, axat în principal pe îmbunătățirea fiabilității și a supraviețuirii.