İmsak Vakti 02:00
Google, robotların fiziksel dünyayı yalnızca algılayan değil, aynı zamanda anlayan ve yorumlayan sistemler haline gelmesini hedefleyen yeni yapay zeka modelini duyurdu. Gemini Robotics-ER 1.6 adı verilen model, robotların komutları uygulayan makineler olmanın ötesine geçerek çevresel bağlamı kavrayabilmesini ve bağımsız kararlar alabilmesini sağlıyor. Şirketin “bedensel akıl yürütme” (embodied reasoning) yaklaşımı üzerine inşa ettiği bu model, robotların görsel verileri analiz etmesini, görev planlaması yapmasını ve bir işlemin başarıyla tamamlanıp tamamlanmadığını değerlendirmesini mümkün kılıyor. Böylece robotlar yalnızca verilen talimatları izleyen sistemler yerine gerçek dünya koşullarına uyum sağlayabilen otonom ajanlara dönüşüyor.
Fiziksel dünya ile dijital zeka arasındaki boşluk kapanıyor
Gemini Robotics-ER 1.6’nın en dikkat çekici gelişmelerinden biri uzamsal akıl yürütme (spatial reasoning) yeteneklerindeki ciddi iyileştirme oldu. Model nesneleri tanıyabiliyor, sayabiliyor ve aralarındaki ilişkileri daha yüksek doğrulukla analiz edebiliyor. Ayrıca “işaretleme” (pointing) yeteneği sayesinde sahnedeki önemli noktaları belirleyerek karmaşık görevleri daha küçük adımlara ayırabiliyor.
Bu özellik, özellikle karmaşık ve dağınık ortamlarda çalışan robotlar için kritik önem taşıyor. Robotlar artık yalnızca nesneleri görmekle kalmıyor, hangi nesnenin nerede olduğunu, nasıl taşınacağını ve hangi sırayla işlem yapılacağını da anlayabiliyor. Model aynı zamanda görev tamamlanma tespiti (success detection) konusunda da önemli bir sıçrama sunuyor. Robotlar, bir işlemin doğru şekilde bitip bitmediğini analiz edebiliyor. Bu da özellikle otomasyon süreçlerinde sistemin tekrar denemesi mi gerektiğine yoksa bir sonraki adıma mı geçmesi gerektiğine karar vermesini sağlıyor.
Çoklu kamera verisini tek bir anlamlı tabloya dönüştürüyor
Modern robot sistemlerinde genellikle birden fazla kamera bulunuyor. Üstten görüş ve robot koluna yerleştirilmiş kameralar gibi farklı açılardan gelen verilerin birleşimi, doğru analiz için büyük önem taşıyor. Gemini Robotics-ER 1.6, çoklu görüntü akıl yürütme yeteneğiyle bu verileri tek bir bütün halinde yorumlayabiliyor. Bu sayede model, görüşün kısıtlı olduğu ya da nesnelerin birbirini engellediği durumlarda bile çevreyi daha doğru analiz edebiliyor.
Modelin en pratik yeniliklerinden biri ise endüstriyel cihazları okuyabilme yeteneği oldu. Basınç göstergeleri, termometreler, sıvı seviye göstergeleri ve dijital ekranlar gibi ekipmanlar artık robotlar tarafından doğrudan analiz edilebiliyor. Bu özellik, Boston Dynamics ile yapılan iş birliği kapsamında geliştirildi. Özellikle Spot robotunun tesis denetimlerinde kullanılması sırasında ortaya çıkan ihtiyaçlar, bu yeteneğin geliştirilmesinde belirleyici oldu.
Model, cihaz okuma işlemini gerçekleştirirken yalnızca görüntü analizi yapmıyor. “Agentic vision” adı verilen yaklaşım sayesinde görsel akıl yürütmeyi kod çalıştırma ile birleştiriyor. Örneğin bir basınç göstergesini analiz ederken önce görüntüyü yakınlaştırıyor, ibre ve işaretleri tespit ediyor, ardından matematiksel hesaplamalarla değeri yüksek doğrulukla belirliyor.
Bu alanda önceki modellerde yaklaşık yüzde 23 seviyesinde olan doğruluk oranı yeni modelde yüzde 93’e kadar yükselmiş durumda.
Geliştiricilere açıldı
Gemini Robotics-ER 1.6 yalnızca daha akıllı değil, aynı zamanda daha güvenli bir sistem olarak öne çıkıyor. Model, tehlikeli durumları algılama ve fiziksel güvenlik kurallarına uyma konusunda geliştirilmiş yeteneklere sahip. Hem metin hem de görsel senaryolarda riskleri tanımlayarak hatalı işlemleri önleyebiliyor.
Yeni model, bugünden itibaren Gemini API ve Google AI Studio üzerinden geliştiricilerin kullanımına sunulmuş durumda. Ayrıca, modelin nasıl kullanılacağını gösteren örneklerin yer aldığı bir Colab ortamı da paylaşıldı.
2025’te ölen ünlü oyuncu yapay zekâ ile geri getirildi; AI versiyonu yeni filmde rol aldı
1
Georgia’daki Bir Veri Merkezi ve Su Kullanımı Hakkında Şok Gelişmeler
2701 kez okundu
2
OpenAI’nin Donanım Atılımı: Akıllı Cihazla Yapay Zeka Deneyimini Yenilemek
1887 kez okundu
3
Gizlilik Odaklı Akıllı Küpeler: Sağlık Takibinde Yeni Bir Şık Dönem
1628 kez okundu
4
Snap-Perplexity İş Birliğinin Sonuçları ve Geleceğe Yönelik Odak Noktaları
1585 kez okundu
5
Trump’tan Anthropic’e ‘zeytin dalı’
1358 kez okundu
6
İnsansı robotlardan tarihi yarı maraton koşusu
1309 kez okundu
7
Yapay Zeka ile Üretilen Şarkılar Krize Neden Oldu!
1308 kez okundu
8
Opera’ya ChatGPT ve Claude Desteği Geldi!
1297 kez okundu
10
Mythos ve Glasswing: Dijital Güvenliğin Sınırlarını Zorlayan Yapay Zeka
1190 kez okundu
11
EVA Social AI: Yapay Zeka Destekli Pazarlama Ekosistemiyle Dünyaya Açılan Türk Girişim
1178 kez okundu
12
Meta’dan yapay zekada köklü değişim: Muse Spark tanıtıldı
1026 kez okundu
13
Xbox Copilot Dalgası Sonrası Yeniden Yönlendirme ve Yönetim Değişiklikleri
902 kez okundu
14
Trusted Contact: ChatGPT için Yeni Acil durum Güvenlik Özelliği ve Gizlilik Dengesi
831 kez okundu
15
OpenAI Finansal Bağlantılar: Plaid ile 12Binden Fazla Kurumda Bütçenizi Yönetin
699 kez okundu
16
Okyanusta Enerji Üreten Yüzen Veri Merkezi: Ocean-3 ve Panthalassa’nın Vizyonu
619 kez okundu
17
İnsan gibi öğrenen akıllı robot duyuruldu: Alfie ile tanışın
616 kez okundu
18
Gemini’ın Yeni “Omni” Video Üretme Modeli Ortaya Çıktı: İşte İlk Demolar
584 kez okundu
19
Dimon ve Amodei’nin Yapay Zeka Yatırım Mesajı: Büyüme Hızını Durdurmak Zor
579 kez okundu
20
Görüntüleyen Yıldızlar: Google ve SpaceX’in Uzayda Verimlilik İçin Veri Merkezleri Planı
577 kez okundu
21
Meta’nın Yapay Zeka Hamlesi ve Çalışan Güvenliği: İzleme ve İşten Çıkarmalar
560 kez okundu
22
Google’ın Yapay Zeka Destekli Arama Sonuçlarında Şeffaflık ve Kaynak Özeti Dönemi
549 kez okundu
23
Microsoft ve OpenAI İlişkisinde Esneklik: Tek Kapı Değil, İşbirliğinde Yeni Denge
540 kez okundu
24
ChatGPT, Resmen Excel ve Google E-Tablolar’a Geldi: Ne İşe Yarayacak?
518 kez okundu
25
Dünyanın en zengin ikinci iş insanı Jeff Bezos’tan milyar dolarlık hamleler
504 kez okundu
26
Microsoft Edge’e Çok Sekme Kullananların İşini Çok Kolaylaştıracak Özellik Geldi: Copilot, Sekmeleri Okuyup Size Yardım Edebilecek!
497 kez okundu
27
Gemini “Kişisel Zeka” özelliği Türkiye’de kullanıma sunuldu
432 kez okundu
28
G-P Verileri: Teknoloji Yatırımları ve İnsan Kaynağı Arayışında Stratejik Çelişkiler
424 kez okundu
29
Apple, Yapay Zekâ Özelliklerini Ertelediği İçin iPhone Kullanıcılarına 250 Milyon Dolar Ödeyecek
423 kez okundu
30
OpenAI Sistemlerinde Saklı Komutlar ve Dil Modellemesi Üzerindeki Sınırlar
414 kez okundu