Grafikkort

Nvidia lancerer tesla t4, det hurtigste kort til datacentre

Indholdsfortegnelse:

Anonim

Nvidia har annonceret sin nye GPU til maskinlæring og inferens i datacentre. Det nye Tesla T4- kort er baseret på Turing-arkitekturen og er efterfølgeren til den nuværende Tesla P4-model, der dækker stort set alle større cloud computing-udbydere.

Nvidia Tesla T4 ønsker at revolutionere datacentre

Nvidia hævder, at Tesla T4'erne er betydeligt hurtigere end P4'erne. Når det gælder sproginferencer, er for eksempel T4 34 gange hurtigere end at bruge en CPU og mere end 3, 5 gange hurtigere end P4. Den maksimale gennemstrømning for Tesla P4 er 260 TOPS til 4-bit heltalefunktioner og 65 TOPS for flytningspunktoperationer. T4 er på et standardprofil 75-watt PCI-e-kort.

Vi anbefaler at læse vores indlæg om detaljer om Nvidias Turing-arkitektur vises

Vigtigst er, at Nvidia designet disse chips specifikt til AI-inferens, hvilket gør Tesla T4 til en så effektiv GPU til at foretage konklusioner er Turing's nye Tensor Core. Jensen Huang har allerede talt om den nye Tensor Core, og hvad den kan gøre for spil-, rendering- og AI-operationer. I alt indeholder chippen 320 Tensor Core Turing og 2.560 CUDA-kerner.

Ud over den nye chip er Nvidia også i gang med at opdatere en TensorRT-software til at optimere modeller for dyb læring. Denne nye version inkluderer også TensorRT Inference Server, en fuldt beholderet mikroservice til incentre af datacentre, som problemfrit forbindes til en eksisterende Kubernetes-infrastruktur.

Turing er en af ​​de mest innovative Nvidia-arkitekturer, selv på spillemarkedet, hvor det for første gang giver mulighed for at bruge strålesporing i realtid for at forbedre den grafiske finish på de mest avancerede spil.

Techpowerup font

Grafikkort

Valg af editor

Back to top button