Teknologi Canggih Chip AI Nvidia Terganjal Masalah Overheating - Beritakarya.id

Teknologi Canggih Chip AI Nvidia Terganjal Masalah Overheating

Beberapa konsumen kelas atas Nvidia dikabarkan menunda pemesanan chip AI Blackwell terbaru. Penundaan ini disebabkan oleh keluhan terkait overheating serta masalah konektivitas pada chip tersebut.

Menurut laporan The Information, rak Blackwell GB200, yang menjadi komponen utama di data center AI, mengalami beberapa masalah saat penggunaan awal. Salah satu kendalanya adalah konsumsi listrik yang sangat tinggi.

Rak Blackwell GB200 diketahui mengonsumsi listrik antara 120 hingga 132 kW. Tingginya konsumsi listrik ini memerlukan sistem pendingin yang sangat andal untuk menjaga suhu tetap stabil. Sayangnya, sistem pendingin tradisional tidak mampu menangani panas yang dihasilkan dari komponen dengan kebutuhan daya sebesar itu.

Selain masalah overheating, rak Blackwell versi awal juga menghadapi kendala pada interkoneksi. Masalah ini terjadi pada sambungan antarchip, yang semakin memperumit performa sistem secara keseluruhan.

Untuk diketahui, satu rak GB200 dapat memuat hingga 72 chip Blackwell. Namun, desain rak server yang tersedia saat ini ternyata tidak mampu menangani panas yang dihasilkan oleh chip tersebut secara efektif.

Akibatnya, Nvidia meminta pemasoknya untuk melakukan perubahan desain. Penyelesaian masalah ini memerlukan pendekatan menyeluruh, termasuk optimalisasi di tingkat chip, pengembangan solusi pendinginan yang lebih efektif, dan pembaruan total pada infrastruktur rak server.

Sebagai contoh, Microsoft awalnya berencana mengoperasikan rak GB200 dengan total setidaknya 50 ribu chip Blackwell di data center mereka di Phoenix, Amerika Serikat. Namun, akibat masalah ini, mitra AI Microsoft, OpenAI, memutuskan untuk mengubah pesanannya menjadi chip Hopper yang merupakan versi lebih lama.

Dampak dari penundaan pesanan ini langsung dirasakan oleh Nvidia, dengan sahamnya mengalami penurunan sebesar 4% setelah kabar tersebut tersebar luas.

CEO Nvidia, Jensen Huang, sebelumnya menanggapi tudingan mengenai masalah overheating dengan membantahnya. Ia menyatakan bahwa dalam pengujian awal, rak server yang memuat 72 chip Blackwell dapat diatasi dengan sistem pendingin berbasis air.