Modern yapay zeka modelleri, bir CPU’nun saatlerce çalışması yerine bir GPU’nun saniyelerde tamamladığı hesaplamalarla eğitiliyor — ama neden? Cevap, sadece ‘hızlı’ olmakta değil, paralel işlem yapma mantığındaradır.
Çoğu kişi, GPU’nun (Graphics Processing Unit) AI’da tercih edilmesinin nedeninin sadece “çok hızlı olması” sanır. Ama aslında GPU’lar CPU’dan (Central Processing Unit) farklı bir şekilde düşünür. Bir CPU, bir matematikçi gibi derinlemesine tek bir işlemi adım adım çözmeye odaklanır; bir GPU ise binlerce basit işlemi aynı anda yapmaya hazırlanmış bir işçidir. AI’da, özellikle derin öğrenme (deep learning), bu fark kritik hale gelir.
Derin sinir ağları (deep neural networks), milyonlarca parametreyi (ağırlık) ve milyarlarca hesaplama adımını içerir. Örneğin, bir resim tanıma modeli düşünün: 224×224 piksellik bir görüntüde her pikselin renk değeri bir sayıdır. Bu 150 bin sayı, bir dizi matematiksel işlem (özellikle matris çarpımları) ile işlenir. Her katman, önceki katmandan gelen sayıları yeni bir kombinasyona dönüştürür — ve bu işlem, binlerce kez tekrarlanır.
Bu tür işlemler, doğal olarak paralelleştirilebilir: her sayı grubu, diğerlerinden bağımsız olarak çarpılıp toplanabilir. İşte burada GPU’nun mimarisi avantaj sağlar.
Bu farkı somutlaştırmak gerekirse: Bir CPU, bir orkestranın şefi gibi tek bir nota dizisini en ince detayına kadar yönetir. Bir GPU ise binlerce müzisyenden oluşan bir orkestra; her biri aynı ritmi tekrar eder, ama şefin (CPU değil, kontrol ünitesi) yönlendirmesiyle senkronize çalışır.
Derin öğrenme modellerinin eğitimi büyük ölçüde matris çarpımları (matrix multiplications) ve aktivasyon fonksiyonları üzerine kuruludur. Örneğin, bir tam bağlı katmanda (fully connected layer), giriş vektörü ile ağırlık matrisi çarpılır:
[1×1000] × [1000×500] = [1×500]
Bu işlem, 500.000 çarpma ve toplama içerir — ve bu, bir katmanda sadece bir adım. Bir modelde binlerce katman olabilir.
Bu tür işlemler, veri paralellik (data parallelism) ile kolayca bölüştürülebilir: her GPU işlem birimi, farklı bir veri örneği (batch) üzerinde aynı matris çarpımını hesaplayabilir. Hatta daha gelişmiş tekniklerle, aynı batch’i parçalayarak model paralelliği (model parallelism) de mümkün olur.
Hayır. CPU’lar, AI için öncül ve destek görevleri üstlenir: veri hazırlama, küçük modellerin çalıştırılması, inferans (tahmin) aşamasında düşük gecikme gerektiren görevler, sistem yönetimi. Hatta bazı özel durumlarda (örneğin, çok küçük modeller veya özel donanımlar olmayan ortamlar), CPU’lar yeterli olabilir.
Ama büyük modeller (Llama, GPT, Stable Diffusion gibi) eğitilirken: CPU’dan gelen veri, GPU’ya aktarılır; GPU eğitim döngüsünü (forward/backward pass) hızlıca tamamlar; sonuç tekrar CPU’ya döner. Bu, bir hierarşidir — CPU’nun “kötü” olduğu değil, görevine göre uygunluk meselesidir.
Güncel AI çipleri (TPU, NPU, Gaudi gibi) aslında GPU’ların mantığını devam ettirir, ama daha özel hale getirir: matris çarpımlarını doğrudan birimlerde (matrix multiply units) yaparlar, veri hareketini minimize ederler. Yani, “GPU’lar yanlış, bu yeni çipler doğru” değil — GPU’lar, AI’nın ilk büyük ölçekli uygulamaları için ideal bir orta nokta oldu. Artık, daha yüksek verimlilik isteniyorsa, özel donanım geliştiriliyor.
AI’nın patlaması, sadece algoritma gelişiminden değil, donanım-algoritma uyumundan da geldi. GPU’lar, 2000’lerin sonunda oyun endüstrisinden gelip 2012’de AlexNet ile AI’ya girdiğinde, matris tabanlı hesaplamaları paralel yapmaya uygun olanı buldukları için “kurtarıcı” oldular. CPU’lar hâlâ hayati, ama AI’nın kalbi — şimdilik — paralel işlem birimleridir.
İşte bu yüzden: “GPU’lar AI için daha uygun” demek, “daha hızlı” demekten çok daha fazlasını anlatır. Bu, bir araç seçerken ne işi, nasıl yapmak istediğinize bağlı bir karar meselesidir.
Web, yazılım, yapay zeka ve hosting — tek elden, anahtar teslim.