În contextul evoluției rapide a tehnologiilor bazate pe inteligență artificială, AMD a lansat recent noile modele de acceleratoare, MI350X și MI355X. Aceste dispozitive sunt concepute pentru a răspunde nevoilor tot mai complexe ale companiilor de tehnologie mari, cum ar fi Google și Microsoft.
Centrele de date din întreaga lume sunt constant actualizate pentru a optimiza costurile asociate cu procesarea întrebărilor adresate sistemelor AI, cum ar fi ChatGPT. Aceste îmbunătățiri sunt esențiale nu doar pentru reducerea costurilor, ci și pentru sprijinirea cercetătorilor în găsirea soluțiilor pentru provocări globale, cum ar fi tratarea cancerului sau combaterea încălzirii globale.
Evenimentul de lansare a avut loc în San Jose, California, în cadrul AMD Advanced AI Days, unde compania a prezentat noile acceleratoare care promit să îmbunătățească eficiența în execuția sarcinilor AI, fie că este vorba de generarea de text sau de procesarea datelor complexe.
Acceleratoarele MI350X și MI355X sunt de patru ori mai rapide în comparativ cu predecesorul MI300X, având capacitatea de a gestiona formate numerice FP4 și FP6, esențiale pentru antrenarea modelelor de inteligență artificială. Aceste formate permit stocarea unor cantități semnificative de date în spații reduse, optimizând astfel procesarea informațiilor.
Aceste dispozitive sunt destinate centrelor mari de date și necesită o infrastructură robustă, fiecare placă având un consum de energie de până la 1400W. MI350X și MI355X sunt echipate cu 256 unități de calcul și 288 GB memorie HBM3E, oferind o lățime de bandă rapidă de 8 TB/s, ceea ce reprezintă o îmbunătățire semnificativă față de modelele anterioare.
AMD susține că seria MI350 oferă un avans de până la 35x în procesarea inferenței AI, deși detaliile despre condițiile de testare rămân neclare. În ceea ce privește costurile, aceste acceleratoare promit o eficiență mai mare, oferind 40% mai mulți tokeni per dolar comparativ cu produsele concurente.
Instinct MI350X este compatibil cu rack-uri standard, în timp ce MI355X este proiectat pentru servere cu răcire lichidă. Cu capacitatea de a susține modele de inteligență artificială cu până la 520 de miliarde de parametri, aceste acceleratoare promit să transforme modul în care sunt utilizate resursele de AI.
Așteptările sunt mari și pentru generația următoare, MI400X, care va aduce îmbunătățiri semnificative atât în performanță, cât și în capacitate de memorie.
Un alt aspect important discutat în cadrul conferinței a fost platforma ROCm 7, care permite utilizatorilor să ruleze modele AI direct pe computerele lor personale, reducând costurile și îmbunătățind accesibilitatea instrumentelor de inteligență artificială.