2023’te Llama’nın çıkarılmasıyla, 'açık kaynak AI' sadece koddan ibaret değil — Meta, modelin bilgi akışını, eğitim verisi politikasını ve geliştirici ekosistemini tamamen yeniden tanımladı. Bu, büyük model üreticilerinin ‘kapanık laboratuvar’ mantığını sorgulayan bir dönüm noktası oldu.
Meta (eski Facebook) 2023 Şubat’ta Llama 1’i yayımladığında, teknoloji dünyası “Açık kaynak AI!” diye coştu — ama çoğu kişi yanlış yere coştu. Çoğu kişi, “açık kaynak” demekle sadece model ağırlıklarının (weights) GitHub’a konulduğunu düşünür. Oysa Llama’nın gerçek devrimciliği, veri politikasında ve dağıtım mantığında saklıydı: Meta, Llama’yı ticari kullanım için serbest bıraktı, ancak çalışma sonuçlarını doğrudan paylaşmaya zorlamadı. Yani: modeli herkes kullanabilir, ama ürettiği içeriği açıklaymak zorunda değildir. Bu, “açık model” ile “açık süreç” arasındaki farkı netleştirdi.
Büyük dil modelleri (LLM’ler), eğitim verilerinin %99’u internetten toplanan metinlerden oluşur. Llama, bu verilerin ne olduğu, nasıl temizlendiği, hangi kaynaklardan seçildiği konusunda şeffaflık garantisi vermedi. Meta, Llama 2 ve 3’te veri setinin genel özelliklerini (örneğin “2023 öncesi internet metinleri”) açıkladı ama orijinal veri listesini ya da detaylı filtreleme kurallarını paylaşmadı. Bu, açık kaynak AI’nın “karanlık lise” problemine işaret eder: Model açık ama kökeni gizli.
Llama serisi, açık kaynak AI ekosistemini iki yönden dönüştürdü:
Ancak burada bir kısır döngü var: Model açık ama eğitim süreci kapalı. Llama’nın hangi veri setiyle eğitildiği, hangi verilerin hariç tutulduğu (örneğin, özel telif haklı içerikler), ve hangi doğrulama testlerinin uygulandığı — bunların çoğu Meta’nın kendi raporlarında belirsiz kalıyor. Bu durum, AI topluluğunda “open weights, not open process” (açık ağırlıklar, ama açık süreç değil) sloganını doğurdu.
Llama’nın en büyük etkisi, “distillation” (öğretmen-öğrenci modeli) tekniklerinin yaygınlaşmasıyla birlikte ortaya çıktı. Meta, Llama’nın eğitim kodlarını ve mimari detaylarını yayımladı — bu, geliştiricilerin kendi verileriyle küçük modeller üretmesine olanak tanıdı.
Örneğin:
Bu, AI’daki bir kritik değişim: Büyük modeller artık “kilitli kuleler” değil, referans mimariler haline geldi. Hugging Face’teki “Llama-derivative” modellerinin sayısı 2023’te 12’den 2024’e 300’e çıktı (kamuya açık veri). Bu, “açık kaynak” kavramını modelin değil, ekosistemin bir parçası haline getirdi.
Llama serisi, Meta’nın AI politikalarında iki temel hedefi bir araya getirdi:
Yani: Meta, Llama’yı sadece “açık kaynak” olarak değil, stratejik bir açık kaynak olarak kullandı. Bu, “açık kaynak”ın artık bir etik değer değil, bir teknolojik silah olarak algılanmasına neden oldu.
Llama’nın açılışı, AI dünyasında “açıklık” kavramını yeniden tanımladı: Artık açık model ≠ açık süreç. Meta, modelin ağırlıklarını ve kodunu açtı — ama veri seti, eğitim hedefleri ve değerlendirme metriklerini kendi kontrolünde tuttu. Bu, küçük geliştiricilerin modeli özelleştirmesine izin verdi, ama modelin neden böyle karar verdiğini anlamasını zorlaştırdı.
Bu durum, AI topluluğunda yeni bir hareketi doğurdu: “Transparan AI” (şeffaf AI) çabaları. Örneğin, EleutherAI ve Hugging Face, Llama tabanlı modellerin veri kökenini izlemek için “data cards” (veri kartları) üretmeye başladı. Ancak bu, Llama’nın asıl mirasını örtbas etmez: Meta, AI’nın geleceğini “açık” değil, “kullanılabilir” olarak tanımladı.
Ve işte burada merak uyandıran bir soru kalıyor: Eğer bir modelin tüm ağırlıkları açık, ama eğitim verisi gizliyse — o modeli “açık kaynak” mı, yoksa “yarı açık” mı sayıyoruz? Llama, bu soruyu teknoloji dünyasına 2023’te bıraktı. Ve henüz cevap bekliyor.
Web, yazılım, yapay zeka ve hosting — tek elden, anahtar teslim.