xertexa.com / blog / surucusuz-arabalarin-gozu-yalan-mi-soyluyor-gercekten-nasil-goruyor

Sürücüsüz Arabaların Gözü Yalan Mı Söylüyor? Gerçekten Nasıl 'Görüyor'?

Sürücüsüz arabaların kameraları ve sensörleri bir film sahnesi gibi görünür ama aslında dünyayı yorumlamada insandan çok daha farklı — ve çok daha sınırlı — bir mantık izler. Bu yazıda, LIDAR’dan sinir ağlarına, algılama sistemlerinin gerçeğini ve neden hâlâ 'görme' değil 'yorumlama' olduğu açıklanır.

Paylaş 𝕏 in WA
Sürücüsüz Arabaların Gözü Yalan Mı Söylüyor? Gerçekten Nasıl 'Görüyor'?

‘Görüyor’ Demek Ne Demek? Sizce Bir Kamera Nasıl ‘Görür’?

İnsan gözünü kapatıp bir kafayı hayal etmeyi deneyin: bir cadde, bir araç, bir yaya. Şimdi bu sahneyi bir LIDAR sensörüyle hayal edin: binlerce ışın pıtırtı ile çarparak dönen bir kafes içindeki noktalı bir bulut. Ya bir kamera? Renkli pikseller — ama renklerin ne anlama geldiğini o sensör bilmiyor. Sadece veri. Sürücüsüz arabaların dünyayı “görmesi” demek, aslında insan algısını taklit etmek değil, ondan çok daha farklı bir yol izlemek demektir. Çoğu kişi bunu “yapay zekâ”ya borçlu bir sihir gibi düşünür — ama gerçekte, bir mühendislik zincirinin her adımı birbirine bağlı, hata payı yüksek, ancak test edilmiş bir dizi karar işlemidir.

1. Sensörler: Dijital Organlar, Ama Sınırlı

Sürücüsüz arabalar (autonomous vehicles / AV) genellikle üç temel sensör grubu kullanır:

  • Kameralar (RGB): Renk, yazı, trafik lambası, işaret levhası — ama gün batımı, sis veya kar gibi koşullarda hızla bozulabilir.
  • LIDAR (Light Detection and Ranging): 3D nokta bulutu (point cloud) oluşturarak mesafe ve şekil bilgisi verir. Hava koşullarına karşı daha dayanıklı ama sisli bir günde etkisi ciddi oranda düşer.
  • Radar (Radio Detection and Ranging): Hız ve mesafe ölçer; sis, yağmur, kar gibi koşullarda en güvenilir sensördür — ama çözünürlük düşük, küçük nesneleri yakalayamaz.

Bu sensörlerin her biri “gerçekten” bir şeyi algılayamaz. Bir kamera bir yaya görürse, o sadece bir renkli dikdörtgen ve belki de bir “insan” etiketiyle sonuçlanan bir sınıflandırma çıkarsı. LIDAR, bir yaya için sadece dik bir dikdörtgen prizma gibi görünen bir küme noktadır. Algılama, aslında bir tahmin işlemidir.

2. Veri Birleştirme: Sensor Fusion — En Zayıf Zincir Bağı

Sensörlerden gelen veriler tek bir “gerçek” resme dönüştürülürken, sensor fusion (sensör birleştirme) adı verilen bir süreç devreye girer. Bu süreçte algoritmalar:

  • Hangi noktaların aynı nesneye ait olduğunu hesaplar (örneğin, bir LIDAR pıtırtısı ve bir kamera pikseli aynı arabanın parçası mı?)
  • Zaman içindeki hareketi takip ederek nesnenin yönünü ve hızını tahmin eder
  • Belirsizliklerin olduğu durumlarda (örneğin, bir kamera karanlıkta nesneyi tam algılayamıyorsa) Radar’ın verisine daha fazla ağırlık verir

Bu birleştirmenin en büyük zorluğu: sensörlerin hataları birbirini değil, zayıflatır veya çarpıtır. Bir LIDAR bir yaya 1.2 saniyede algılayabilirken, bir kamera aynı anda bir tıkanıklıkta “hareketsiz bir雕塑” sanabilir. Bu tür çakışmalar, sistemlerin karar verme gecikmesine neden olur — ve bu gecikme, 70 km/saat hızla giden bir araçta birkaç milisaniyelik bir fark, ölümcül bir mesafedir.

3. Algılama ve Yorumlama: Neural Network’ler Neden “Görmezlikten Gelir”?

Sensör verisi işlendikten sonra, bir deep learning modeli (genellikle CNN — Convolutional Neural Network) devreye girer. Bu model, milyonlarca etiketli örnekten (örneğin, “araba”, “yaya”, “çöp kutusu”) öğrenir. Ancak burada bir kritik nokta var:

  • Eğitim verisi sınırlı: Model, eğitim sırasında görmediği bir durumu (örneğin, bir caddeye rastgele bir hayvanın girmesi, ya da bir yaya kıyafetinde bir robot) tanıyamaz.
  • Edge cases (kenar durumlar) öngörülemez: 2018’de Arizona’da Uber’nin Sürücüsüz Aracının neden olduğu ölüm, bir yaya’nın çapraz geçişi sırasında sistemde “hareket etmemesi”nin (yani, bir “durdur” kararının alınmamasının) temel nedeni, modelin yaya’nın kıyafetindeki koyu renklerden kaynaklı bir algılama hatasıydı.
  • Genelleme zayıf: Bir şehirde çalışan sistem, başka bir şehrin trafik ışığı düzeniyle veya kaldırımla baş edemeyebilir — çünkü her yerde aynı fiziksel kurallar değil, aynı uygulama kuralları vardır.

Bu nedenle, günümüzdeki çoğu sürücüsüz sistem L4 seviyesinde (belirli coğrafi sınırlar içinde tam otomatik) test edilir — yani, sadece önceden tanımlanmış bir alanda (örneğin, Phoenix’in belirli semtleri veya Shanghai’da belirli bir lojistik parkı) çalışır. Dünya “görülmez” — sadece önceden haritalanmış ve modelleştirilmiş bir kopyası oluşturulur.

4. Haritalar: Gerçek Dünyanın Dijital Aynası

Sürücüsüz sistemler, “gerçek zamanlı” algılamanın yanı sıra, pre-built high-definition maps (önceden hazırlanmış yüksek çözünürlüklü haritalar) kullanır. Bu haritalar:

  • Kaldırımların yüksekliği, yaya geçitlerinin konumu, trafik ışıklarının konumu, hatta yol çizgilerinin kalınlığına kadar tüm detayları içerir
  • Her nesnenin sabit koordinatlarını (x, y, z) tutar — böylece sistem, “gördüğü” nesnenin haritadaki konumuyla eşleşip eşleşmediğini anında kontrol edebilir
  • Yeni bir nesne (örneğin, bir kaza sonucu duran araç) algılandığında, sistem bunu “beklenmedik bir durum” olarak işaretler ve temkinli bir şekilde durur veya yavaşlar

Yani, bir sürücüsüz araç “dünyayı” değil, kendisine tanımlanmış bir dünyayı görür. Bu da, teknolojinin dünyayı dönüştürmediğini, ama sadece belirli bir alanda güvenli olabilmek için世界的 (global) bir sistem yerine bölgesel (geofenced) çözümler ürettiğini gösterir.

5. Kim Kazanıyor? Kim Değişiyor?

Sürücüsüz teknoloji, “insan sürücüleri yok edecek” iddiasından çok daha sınırlı bir etki yaratıyor:

  • Lojistik ve kargo: Belirlenmiş rotalarda (havayolu terminalleri, depolar, şehir içi kargo rotaları) ilk ticari uygulamalar burada. Waymo, Aurora ve TuSimple gibi şirketler, Nevada ve Arizona’da otomatik kamyon testleri yapıyor.
  • Taksi/ride-sharing: Şehir merkezlerinde, belirli saatlerde, belirli bölgelerde — ama insan sürücülerin tamamını değiştirmek değil, operasyon maliyetlerini düşürmek için. Tesla’nın “Robotaksi” fikri, 2024 itibarıyla hâlâ test aşamasında.
  • Yeni işler: Sürücüsüz sistemler, veri etiketleyicileri, harita güncelleyicileri, simülasyon test mühendisleri gibi yeni meslekler yaratıyor — ama bunlar, genellikle yüksek teknik eğitim gerektirir.

En önemlisi: Sürücüsüz araçlar, “daha güvenli” olmayı garanti etmiyor. İnsan hatası %94’lük bir kaza oranına sahipken, sistem hataları hâlâ %0.001 gibi düşük oranlarda bile ölümcül olabiliyor. Ama bu teknoloji, belirli senaryolarda — örneğin, yorgun sürücülerin olduğu gece seferlerinde — potansiyel olarak daha güvenli olabilir.

6. Xertexa Perspective: Teknolojiyi “Sihir” Olarak Değil, Mühendislik Olarak Görmek

Xertexa olarak, AI ve otomotiv teknolojilerini incelediğimizde, “görme” değil, karar alma sistemlerinin mühendisliğini inceliyoruz. Bir LIDAR sensörünü 100 milyon dolarlık bir çip ile birleştirmek, yazılımın gerçek dünyadaki hatalarını simülasyonlarda test etmek — bu, “görsel algılama” değil, çok boyutlu karar makineleri inşa etmektir. Ve burada en büyük fark: İnsanlar öğrenir, sistemler tekrar eder.

İşte neden “Sürücüsüz Arabaların Gözü Yalan Mı Söylüyor?” sorusunun cevabı: Hayır, yalan söylemiyor — sadece insanın dilini konuşmuyor. Onun “görüşü”, bir haritaya dayalı, sensör verisine dayalı, ve çok az belirsizlik toleransı olan bir karar verme dilidir. Bu dil, şehirlerdeki trafik akışını değiştirebilir — ama sadece o şehrin, o saatte, o hava koşullarında tanımlanmış bir “gerçeklik” içinde.

Gelecek için bir not: Sürücüsüz araçlar, “insanları koltukta bırakmak” değil, insanları daha az kararsız kalmaya zorlamak için tasarlanıyor. Ve bu, teknolojinin gerçek gücü: sihir değil, sınırlı ama dayanıklı bir karar mekanizması.

Projenizi konuşalım

Web, yazılım, yapay zeka ve hosting — tek elden, anahtar teslim.

Ücretsiz Görüşme →

Diğer Yazılar