Fehlende Kapazität bei TSMC: Nvidias Mangel an KI-Beschleunigern soll noch über ein Jahr dauern

26
News Valentin Sattler
Fehlende Kapazität bei TSMC: Nvidias Mangel an AI-Beschleunigern soll noch über ein Jahr dauern
Quelle: Nvidia

Laut dem Vorstandsvorsitzenden von TSMC kann das Unternehmen Nvidias Bedarf an KI-Beschleunigern erst Ende 2024 decken. Ausschlaggebend dafür ist aber offenbar nicht die Fertigung selbst, sondern das COWOS-Packaging. Hier fehlen derzeit noch Kapazitäten.

Die Nachfrage nach Nvidias KI-Beschleunigern, wie etwa dem H100, ist immens - und kann von dem Unternehmen derzeit nicht bedient werden. Wenn der Hype um Deep-Learning-Techniken wie ChatGPT und Stable Diffusion anhält, dann soll das wohl auch vorerst so bleiben: Laut dem Vorstandsvorsitzenden von TSMC, Mark Liu, wird das Unternehmen wohl erst Ende 2024 ausreichende Kapazitäten haben.

COWOS ist schuld

Laut Liu ist dabei gar nicht die Fertigung selbst ausschlaggebend: Der für die aktuellen H100-GPUs genutzte 4-nm-Prozess ist offenbar noch nicht ausgereizt. Anders sieht es hingegen bei dem Packaging aus, mit dem die GPU neben dem HBM-Speicher platziert wird. Hierfür setzt Nvidia auf TSMCs COWOS-Technik (Chip-On-Wafer-On-Substrate), die den aktuellen Bedarf nicht decken kann.

"It's not the shortage of AI chips. It's the shortage of our COWOS capacity"

"Es ist nicht der Mangel an KI-Chips. Es ist der Mangel an unserer COWOS-Kapazität"

Bis dieses Problem gelöst ist, soll es laut Liu noch über ein Jahr dauern. Helfen könnte dabei unter anderem eine neue Fabrik in Taiwan, die dort für 2,9 Milliarden US-Dollar errichtet wird und speziell für neue Packaging-Techniken gedacht ist. Sobald TSMC dann über höhere Packaging-Kapazitäten verfügt, dürfte sich auch die Liefersituation bei Nvidias KI-Beschleunigern verbessern.

Ebenso interessant: Ausgelagerte Fertigung: Intel soll 2025 für fast zehn Milliarden US-Dollar bei TSMC bestellen

Durch den aktuellen Mangel wird einmal mehr deutlich, dass neben der Fertigung von Halbleiter-Chips auch das Packaging immer wichtiger wird. Das sieht auch Liu so: Während Nvidias H100 aktuell nur auf 80 Milliarden Transistoren kommt, sollen in den nächsten zehn Jahren sogar KI-Beschleuniger mit einer Billion Transistoren möglich sein, indem mehrere Chips kombiniert werden. Passend zu derart rosigen Aussichten arbeiten natürlich auch andere Halbleiter-Hersteller, etwa Intel, schon seit langem daran, ihr Packaging immer weiter zu verbessern und so flexible Chip-Kombinationen zu ermöglichen. Bleibt nur zu hoffen, dass die Kapazität hier in Zukunft nicht noch öfter zum Problem wird.

Quelle: Nikkei Asia via Tom's Hardware

    • Kommentare (26)

      Zur Diskussion im Forum
      • Von raPid-81
        Zitat von GT200b
        Joo, und wahrscheinlich gibt es wieder nur +20% Rasterizing, aber +80% RayTracing, das keine Sau in
        der Form braucht. Raytracing ist eine Verschwendung von teuren Silizium, lieber noch mehr Shader draufpacken und Raytracing am besten als dedizierte Karte vermarkten, wie einst AGEIA PhysX. Wer ne schöne Kuh haben will, packt halt eine Raytracing Karte in den zweiten PCIe Slot, dann wird Blackwell halt eben mit 8 Lanes@PCIe 5.0 angebunden statt 16, das reicht dicke.

        [Ins Forum, um diesen Inhalt zu sehen]
        Nichts davon funktioniert so wie Du es sagst. Mehr Shader bringen kaum noch Mehrleistung da man nur eine bestimmte Menge an Operationen parallelisieren kann. Auslastungsprobleme bei aktuellen Grafikkarten sieht man immer wieder.

        Eine dedizierte Karte für Raytracing ist eine noch absurdere Idee, die Latenz zwischen 2 Karten ist viel zu hoch als dass das jemals für real-time Berechnungen funktionieren würde.

        Es hat einen Grund warum professionelles Rendering seit Jahren per Ray- / Pathtracing erstellt wird. Wer den nächsten Schritt der Computer Grafik erleben will, der setzt nunmal auf Raytracing.

        [Ins Forum, um diesen Inhalt zu sehen]
      • Von raPid-81
        Zitat von GT200b
        Joo, und wahrscheinlich gibt es wieder nur +20% Rasterizing, aber +80% RayTracing, das keine Sau in
        der Form braucht. Raytracing ist eine Verschwendung von teuren Silizium, lieber noch mehr Shader draufpacken und Raytracing am besten als dedizierte Karte vermarkten, wie einst AGEIA PhysX. Wer ne schöne Kuh haben will, packt halt eine Raytracing Karte in den zweiten PCIe Slot, dann wird Blackwell halt eben mit 8 Lanes@PCIe 5.0 angebunden statt 16, das reicht dicke.

        [Ins Forum, um diesen Inhalt zu sehen]
        Nichts davon funktioniert so wie Du es sagst. Mehr Shader bringen kaum noch Mehrleistung da man nur eine bestimmte Menge an Operationen parallelisieren kann. Auslastungsprobleme bei aktuellen Grafikkarten sieht man immer wieder.

        Eine dedizierte Karte für Raytracing ist eine noch absurdere Idee, die Latenz zwischen 2 Karten ist viel zu hoch als dass das jemals für real-time Berechnungen funktionieren würde.

        Es hat einen Grund warum professionelles Rendering seit Jahren per Ray- / Pathtracing erstellt wird. Wer den nächsten Schritt der Computer Grafik erleben will, der setzt nunmal auf Raytracing.

        [Ins Forum, um diesen Inhalt zu sehen]
      • Von BxBender Volt-Modder(in)
        Weniger 4060 8GB und der Rubel äh das Laufband rollt wieder ^^
      • Von GT200b Freizeitschrauber(in)
        Zitat von Lars_N
        deswegen blackwell so spät? schon wieder eine fortschrittsbremse
        Joo, und wahrscheinlich gibt es wieder nur +20% Rasterizing, aber +80% RayTracing, das keine Sau in
        der Form braucht. Raytracing ist eine Verschwendung von teuren Silizium, lieber noch mehr Shader draufpacken und Raytracing am besten als dedizierte Karte vermarkten, wie einst AGEIA PhysX. Wer ne schöne Kuh haben will, packt halt eine Raytracing Karte in den zweiten PCIe Slot, dann wird Blackwell halt eben mit 8 Lanes@PCIe 5.0 angebunden statt 16, das reicht dicke.

        [Ins Forum, um diesen Inhalt zu sehen]
      • Von seahawk Lötkolbengott/-göttin
        Und die neuen Eigentümer bei GF waren nicht bereit entsprechend zu investieren und AMD wechselte seine Aufträge so schnell wie möglich zu TSMC.
        High End Fabs sind nämlich sehr teuer und ein neuer Prozess kann auch mal gut in die Hose gehen. GF war 2009 mit Fab 36/38 ziemlich konkurrenzfähig. Aber danach, 14nm Fin-Fet hat nicht geklappt und man lizenzierte 14nm von Samsung. Die neuste Fab ist übrigens für 40-90nm Produkte ausgelegt.
      • Von raPid-81
        Zitat von Bärenmarke
        Nö hat er nicht, aber wundert mich ehrlich gesagt bei dir auch nicht, dass du es auch nicht kapierst.

        Und wieder auf Ignore, dass Du immer sofort persönlich wirst ist echt ätzend. Tschö.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 06/2024 PC Games 06/2024 PC Games MMore 04/2024 play5 06/2024 Games Aktuell 01/2024
    PCGH Magazin 06/2024 PC Games 06/2024 PC Games MMORE Computec Kiosk