Nvidia przedstawia nową generację architektury Fermiego

2019 - Patryk Pilarski - Apache Spark vs Machine Learning

Nvidia mogła zmienić nazwę swojego NVISION na promocyjne konferencja na "Konferencję technologii GPU", ale wciąż jest to show Nvidii na wskroś. Dyrektor generalny firmy Jen-Hsun Huang zajął trochę czasu podczas swojego wystąpienia, aby zaprezentować następną dużą architekturę GPU firmy, o kryptonimie "Fermi". To właśnie fani chipów graficznych nazywają GT300, pokoleniowym następcą układu GT200, który zasila karty takie jak GeForce GTX 285.

Gigant chipowy bardzo ostrożnie ustawił układ jako nie nowy układ graficzny, ale nowy Układ " obliczyć i grafikę", w tej kolejności (kursywa moja). Prawdę mówiąc, prawie wszystko, co ujawniło się w nowym chipie, odnosi się do jego funkcji obliczeniowych, a nie do tradycyjnych elementów graficznych, takich jak jednostki tekstur i zakończenia renderowania. Wiemy, że chip jest ogromny na około 3,0 miliardów tranzystorów i będzie produkowany w procesie 40 nm w TSMC. To około 40 procent więcej tranzystorów niż chip RV870 w nowych kartach DirectX 11 z serii Radeon 5800, właśnie wydanych przez konkurencyjną AMD. Chip ma 512 jednostek przetwarzania (Nvidia nazywa je rdzeniami CUDA) zorganizowanych w 16 "strumieniowe multiprocesory" z 32 rdzeniami. Jest to ponad dwa razy więcej niż 240 rdzeni w GT200, a rdzenie mają ponadto znaczące ulepszenia. Układ będzie wykorzystywał 384-bitowy interfejs pamięci GDDR5.

Oto niektóre z głównych punktów:

Trzecia generacja strumieniowego multiprocesora (SM)

32 rdzeni CUDA na SM, 4x ponad GT200
8x szczytowa wydajność zmiennoprzecinkowa podwójnej precyzji ponad GT200
Dual Warp Scheduler, która planuje i wywołuje dwie osnowy z 32 wątków
na zegar
64 KB pamięci RAM z konfigurowalnym partycjonowaniem pamięci współdzielonej i pamięcią podręczną L1

Druga Generowanie równoległych operacji tworzenia wątków ISA

Ujednolicona przestrzeń adresowa z pełną obsługą języka C ++
Zoptymalizowana dla OpenCL i DirectCompute
Pełna IEEE 754-2008 32-bitowa i 64-bitowa precyzja
Pełna 32-bitowa ścieżka całkowita z 64 -bitowe rozszerzenia
Instrukcje dostępu do pamięci wspierające przejście na adresowanie 64-bitowe
Lepsza wydajność dzięki predykcjom

Ulepszony podsystem pamięci

Hierarchia równoległych danych NVIDIA z konfigurowalnym L1 i Unified L2
Cache
Pierwszy procesor graficzny z obsługą pamięci ECC
Znacznie ulepszona obsługa pamięci atomowej wydajność

Silnik NVIDIA GigaThread

10-krotnie szybsze przełączanie kontekstu aplikacji
Równoczesne wykonywanie jądra
Blokowanie wątków poza kolejnością
Podwójne nakładane mechanizmy transferu pamięci

Jest wiele dodatkowych funkcji, które powinny poprawić wydajność tego układu w zadaniach związanych z przetwarzaniem strumieniowym, na przykład znacznie szybsza szybkość obliczeń zmiennoprzecinkowych o podwójnej precyzji. Obecne procesory graficzne Nvidia obliczają podwójną precyzję w ułamku prędkości operacji z jedną precyzją. Operacje zmiennoprzecinkowe z podwójną precyzją powinny teraz osiągać połowę wydajności pojedynczej precyzji, co stanowi ogromną poprawę. Duże ulepszenia w buforowaniu i planowaniu są również widoczne. Możesz przeczytać więcej o architekturze na nowej stronie Fermi Nvidii, która zawiera dokument PDF.

Kiedy więc będziesz mógł kupić kartę graficzną, która wykorzystuje ten chip? Nvidia nie mówi. Przedstawiciele firmy powiedzieli, że obecnie "wychwytują chip", co oznacza, że próbki robocze dopiero niedawno wróciły z zakładu produkcyjnego. Wynikając z wykształconej domysły z przeszłej historii, powiedzielibyśmy, że grudzień jest optymistyczną datą premiery, a pierwszy kwartał 2010 roku dla większej dostępności jest bardziej prawdopodobny. Oczekuj, że deski będą drogie. Nvidia nie ujawni rozmiaru chipa, ale sądząc po liczbie tranzystorów, zgadywalibyśmy między 450 a 500 mm ² . W połączeniu z dodanymi kosztami płyty 384-bitowego interfejsu pamięci i wyzwaniami związanymi z uzyskiwaniem dobrych wyników z tak ogromnego chipu w stosunkowo nowym procesie produkcyjnym 40 nm, i patrzysz na karty, które prawdopodobnie będą zarówno potężniejsze, jak i bardziej wydajne. droższe niż właśnie wydane karty AMD z serii Radeon 5800.

Śledź Jason Crossa na Twitterze lub odwiedź jego bloga.

Nvidia przedstawia nową generację architektury Fermiego

2019 - Patryk Pilarski - Apache Spark vs Machine Learning

Epicor przedstawia kolejną generację ERP

CA próbuje odzyskać kolejną generację komputerów mainframerzy

Intel wprowadza na rynek następną generację procesorów Netbook Atom

Interesujące artykuły

Najlepsze narzędzia programistyczne do nauczania dzieci

3 najlepsze narzędzia do zapisywania obrazów USB z graficznym interfejsem użytkownika w systemie Linux

10 najlepszych przydatnych wtyczek bloków Gutenberga do WordPress

3 Więcej alternatyw VoIP dla Skype'a

Academix GNU/Linux

Narzędzia umożliwiające dostęp do systemu plików Linux z systemu Windows

Najlepsze narzędzia programistyczne do nauczania dzieci

3 najlepsze narzędzia do zapisywania obrazów USB z graficznym interfejsem użytkownika w systemie Linux

10 najlepszych przydatnych wtyczek bloków Gutenberga do WordPress

Najlepsze narzędzia programistyczne do nauczania dzieci

3 najlepsze narzędzia do zapisywania obrazów USB z graficznym interfejsem użytkownika w systemie Linux

10 najlepszych przydatnych wtyczek bloków Gutenberga do WordPress

Nvidia przedstawia nową generację architektury Fermiego

2019 - Patryk Pilarski - Apache Spark vs Machine Learning

Zalecana

Interesujące artykuły