Sistem de testare:
Așa că sa dovedit că situația de pe piață nu este în favoarea canadienilor. Jucătorii din „ieftin“ și „integrate“ nișe solide în ceea ce privește cifra de afaceri, dar, din păcate, nu aduce un profit foarte mare, cel mai „delicios“, segmente de înaltă performanță, până de curând dominat aici ATI pierdut. Ca rezultat, trimestrul eșuat și pierderile de 104 milioane de dolari.
Caracteristicile tehnice ale elementelor noi
ingineri ATI a mers alte mijloace, „procesor“, fără a deveni un duplicat transportoare, astfel cum aranjate de GPU procesor superscalar tip cu un singur transportor, în cazul în care câțiva pixeli pot fi procesate simultan. În loc de „chestii“ la pixeli pentru diverse transportoare, The R520 le acumulează (împreună cu instrucțiunile de shader corespunzătoare) într-un planificator imens special care ATI numește Ultra-Threading Dispatch procesorului. De ce Ultra? Deoarece planificatorul operează în același timp luând număr enorm de operațiuni (512 quad 2x2 pixeli în High-End, și mai modeste quad 128 - în mai puțin costisitoare și Orientul Mijlociu-End grafice low-end chips-uri). Toate cuarte sunt stocate într-o coadă lungă, și ca resursele de calcul sunt eliberate, trimise la dispozitivul adecvat, fie că este vorba de calcul, bloc textura sau un grafic Back-end'a (înregistrarea rezultatelor într-un amestec frame-tampon, z-testul antialiasing etc.). Aceasta este o abordare mai complexă decât mai multe conducte similare, dar și mai flexibilă și mai eficientă. De exemplu, putem flexa în mod arbitrar raportul dintre numărul de module de calcul și textura, deoarece acestea nu se mai conectează unul pe celălalt, formând un singur întreg, dar sunt separate de operațiile pe care le efectuează
Apropo, o optimizare similară poate fi văzut în miezul R530 - inima accelerator Middle-End Radeon X1600. Acesta va fi de trei procesoare quad (3x4 = 12 pixeli transportoare), dar numai unul texturi procesor (1x4 = 4 TMU). Pentru shader moderne, care sunt implicate în calcule, mai degrabă decât datele preluate din memoria RAM, această abordare este justificată deoarece permite rațional să consume zona cip, creșterea numărului de conducte de pixeli prin reducerea numărului TMU]. Este vorba despre operațiunile de textură, care anterior ar putea bloca conducta, atâta timp cât nu există nici o probă completă de funcționare a următoarei Texel [conducta traditionale GPU este aranjat conducta CPU mult mai simplu, astfel încât reordonarea instrucțiuni care ar depăși instrucțiunile blocate în conducta alte independente din acesta, - în procesoarele grafice acolo.
În același timp, problema tranzițiilor condiționale dinamice în shadere este rezolvată. Ce este? Permiteți-mi să explic: de dragul de aceeași simplitate a conductelor de pixeli, care au nevoie pentru a se potrivi mai mult pe o bucată limitată de siliciu, aceste transportoare sunt îndeplinite, astfel încât acestea la început, deoarece stabilit pentru acest lucru sau că operațiunea special pe pixelii (adunare, scădere, înmulțire) și se aplică atunci de mai multe ori în succesiune de pixeli diferiți; apoi reconstruit în următoarea procedură, și din nou, folosit de multe ori la același pixel, și așa mai departe. d. De la aceeași shader necesară, de obicei, să se aplice pentru un număr de-suflare mintea de pixeli, o astfel de schemă de obicei funcționează bine. Cu toate acestea, în cazul în care comuna shader, care are o salturi condiționate dinamice (care nu pot fi prezise în avans), este posibil ca unul dintre pixeli, „rulează în cercuri“ în conducta, se aplică unele operații este necesară, iar pentru celălalt - nr. Și este o problemă atât de gravă încât grafica ATI chips-uri pentru o lungă perioadă de timp nu a sprijinit tranziții dinamice (și, prin urmare Shader 2.0A și 3.0).
Cu toate acestea, decizia nVidia într-adevăr prea frumos, de asemenea, nu poate fi numit: în versiunea sa de „prost“ cerc pe banda rulanta se ocupă toate pixelii, dar la momentul crucial, pe unele dintre ele efectuează o operație, iar unele - ignorările (un mod similar cu executarea ramurilor condiționale pot fi găsite în procesoare ARM ). ATI a găsit o cale mult mai bine out: pentru că în loc de câteva „stupide“ și doar plimbări are doar una, ci „inteligente“ și complexe, nu necesită Quads procesarea pixelilor la servomotoarele pur și simplu nu primesc, dând cale de a quads, care într-adevăr trebuie să faci ceva. Ca urmare, conducta deși are în continuare aceeași operațiune pe diferite pixeli, refăcute încet de la unul la altul, dar nu-i place intelectual și nu irosirea irosirea resurselor lor. Și, în același timp, seria Radeon X1000 devine practic suport „liber“ pentru shader treia versiune. Sincer, o astfel de soluție genial, ucide un întreg stol de păsări dintr-o dată, poate invidie numai! Nu este încă o arhitectură shader unificată, în cazul în care un singur transportor (sau, mai degrabă, un set de ele) se poate ocupa orice shader - atat pixel si vertex, dar faptul că o jumătate de pas spre ea făcut - fără îndoială.
controlere mici (sau mai degrabă, interfețe pentru conectarea modulelor de memorie) inel interior împreună foarte rapid autobuz bidirecțional (lățime de 256 de linii în fiecare direcție pentru modelele cu un autobuz 256-biți și memoria principală 128 linii - pentru mai ieftin). Pe inel există patru "opriri" - puncte de conectare la dispozitivele externe. De exemplu, pentru partea de sus a R520 fiecare astfel de „stop“ este conectat prin două module de memorie (memorie bus 2x32 biți) și unele dintre dispozitivele procesor interne situate în apropiere. Care dintre ele? Și nu contează: ce a fost convenabil să te conectezi în acest loc, așa și legat. În plus, un ușor special pentru a gestiona anvelopele (care este instrucțiuni transmise numai), fiecare astfel de „stop“ este conectat la „manager“ - foarte același centralizat de memorie controler, care nu este implicat în furnizarea de date către elementele de acționare, ci doar „da ordine“ și „căutarea după „pentru a se asigura că datele corecte citite au nevoie de un pic de controler și le-a trimis în jurul inelului de dorit“ oprire“, în cazul în care acestea vor fi în măsură să elimine dispozitivul de acționare în sine.
De asemenea, include suport îmbunătățit pentru numere cu puncte în virgulă, în special - suport complet pentru tampon de cadre într-un format plutitor (inclusiv posibilitatea de antialiasing). Pentru ce este? Reprezentarea exponențială a culorii este mai natural pentru ochiul uman și poate implementa cu ușurință și eficient o scenă cu un raport de contrast foarte ridicat (HDR, High Dynamic Range), rezultând adesea în jocuri și viața reală (de exemplu, atunci când ne uităm din întuneric în lumină, care luminează doar o mică parte a camerei)
Într-un cuvânt, cardurile ATI s-au dovedit destul de bune. Nu este prea târziu?
- Din revista Computerra. Mulțumim ATI pentru furnizarea eșantionului de testare ATI X1800XT și AMD pentru platforma de testare Athlon 64 FX-57.