Sürücüsüz arabaların kameraları ve sensörleri bir film sahnesi gibi görünür ama aslında dünyayı yorumlamada insandan çok daha farklı — ve çok daha sınırlı — bir mantık izler. Bu yazıda, LIDAR’dan sinir ağlarına, algılama sistemlerinin gerçeğini ve neden hâlâ 'görme' değil 'yorumlama' olduğu açıklanır.
İnsan gözünü kapatıp bir kafayı hayal etmeyi deneyin: bir cadde, bir araç, bir yaya. Şimdi bu sahneyi bir LIDAR sensörüyle hayal edin: binlerce ışın pıtırtı ile çarparak dönen bir kafes içindeki noktalı bir bulut. Ya bir kamera? Renkli pikseller — ama renklerin ne anlama geldiğini o sensör bilmiyor. Sadece veri. Sürücüsüz arabaların dünyayı “görmesi” demek, aslında insan algısını taklit etmek değil, ondan çok daha farklı bir yol izlemek demektir. Çoğu kişi bunu “yapay zekâ”ya borçlu bir sihir gibi düşünür — ama gerçekte, bir mühendislik zincirinin her adımı birbirine bağlı, hata payı yüksek, ancak test edilmiş bir dizi karar işlemidir.
Sürücüsüz arabalar (autonomous vehicles / AV) genellikle üç temel sensör grubu kullanır:
Bu sensörlerin her biri “gerçekten” bir şeyi algılayamaz. Bir kamera bir yaya görürse, o sadece bir renkli dikdörtgen ve belki de bir “insan” etiketiyle sonuçlanan bir sınıflandırma çıkarsı. LIDAR, bir yaya için sadece dik bir dikdörtgen prizma gibi görünen bir küme noktadır. Algılama, aslında bir tahmin işlemidir.
Sensörlerden gelen veriler tek bir “gerçek” resme dönüştürülürken, sensor fusion (sensör birleştirme) adı verilen bir süreç devreye girer. Bu süreçte algoritmalar:
Bu birleştirmenin en büyük zorluğu: sensörlerin hataları birbirini değil, zayıflatır veya çarpıtır. Bir LIDAR bir yaya 1.2 saniyede algılayabilirken, bir kamera aynı anda bir tıkanıklıkta “hareketsiz bir雕塑” sanabilir. Bu tür çakışmalar, sistemlerin karar verme gecikmesine neden olur — ve bu gecikme, 70 km/saat hızla giden bir araçta birkaç milisaniyelik bir fark, ölümcül bir mesafedir.
Sensör verisi işlendikten sonra, bir deep learning modeli (genellikle CNN — Convolutional Neural Network) devreye girer. Bu model, milyonlarca etiketli örnekten (örneğin, “araba”, “yaya”, “çöp kutusu”) öğrenir. Ancak burada bir kritik nokta var:
Bu nedenle, günümüzdeki çoğu sürücüsüz sistem L4 seviyesinde (belirli coğrafi sınırlar içinde tam otomatik) test edilir — yani, sadece önceden tanımlanmış bir alanda (örneğin, Phoenix’in belirli semtleri veya Shanghai’da belirli bir lojistik parkı) çalışır. Dünya “görülmez” — sadece önceden haritalanmış ve modelleştirilmiş bir kopyası oluşturulur.
Sürücüsüz sistemler, “gerçek zamanlı” algılamanın yanı sıra, pre-built high-definition maps (önceden hazırlanmış yüksek çözünürlüklü haritalar) kullanır. Bu haritalar:
Yani, bir sürücüsüz araç “dünyayı” değil, kendisine tanımlanmış bir dünyayı görür. Bu da, teknolojinin dünyayı dönüştürmediğini, ama sadece belirli bir alanda güvenli olabilmek için世界的 (global) bir sistem yerine bölgesel (geofenced) çözümler ürettiğini gösterir.
Sürücüsüz teknoloji, “insan sürücüleri yok edecek” iddiasından çok daha sınırlı bir etki yaratıyor:
En önemlisi: Sürücüsüz araçlar, “daha güvenli” olmayı garanti etmiyor. İnsan hatası %94’lük bir kaza oranına sahipken, sistem hataları hâlâ %0.001 gibi düşük oranlarda bile ölümcül olabiliyor. Ama bu teknoloji, belirli senaryolarda — örneğin, yorgun sürücülerin olduğu gece seferlerinde — potansiyel olarak daha güvenli olabilir.
Xertexa olarak, AI ve otomotiv teknolojilerini incelediğimizde, “görme” değil, karar alma sistemlerinin mühendisliğini inceliyoruz. Bir LIDAR sensörünü 100 milyon dolarlık bir çip ile birleştirmek, yazılımın gerçek dünyadaki hatalarını simülasyonlarda test etmek — bu, “görsel algılama” değil, çok boyutlu karar makineleri inşa etmektir. Ve burada en büyük fark: İnsanlar öğrenir, sistemler tekrar eder.
İşte neden “Sürücüsüz Arabaların Gözü Yalan Mı Söylüyor?” sorusunun cevabı: Hayır, yalan söylemiyor — sadece insanın dilini konuşmuyor. Onun “görüşü”, bir haritaya dayalı, sensör verisine dayalı, ve çok az belirsizlik toleransı olan bir karar verme dilidir. Bu dil, şehirlerdeki trafik akışını değiştirebilir — ama sadece o şehrin, o saatte, o hava koşullarında tanımlanmış bir “gerçeklik” içinde.
Gelecek için bir not: Sürücüsüz araçlar, “insanları koltukta bırakmak” değil, insanları daha az kararsız kalmaya zorlamak için tasarlanıyor. Ve bu, teknolojinin gerçek gücü: sihir değil, sınırlı ama dayanıklı bir karar mekanizması.
Web, yazılım, yapay zeka ve hosting — tek elden, anahtar teslim.