Google DeepMind, robotların fiziksel dünyayı daha doğru algılaması ve gördüğü sahneye göre işlem sırası kurabilmesi için Gemini Robotics-ER 1.6 modelini duyurdu. Şirketin resmi açıklamasına göre bu yeni sürüm, robotların karmaşık görsel verileri yorumlamasına, uzamsal ilişkileri anlamasına ve doğal dil komutlarından hareket planı çıkarmasına yardımcı oluyor. Modelin öne çıkan tarafı, yalnızca komutu yerine getiren sistem mantığında kalmaması; çevrede ne olduğunu okuyup buna göre sonraki adımı belirleyebilmesi. Google, yeni modelin çoklu görüntü akıl yürütme, cihaz okuma ve görevin tamamlanıp tamamlanmadığını anlama gibi alanlarda geliştirildiğini duyurdu. Resmi belgelerde Gemini Robotics-ER 1.6’nın ön izleme sürümü olarak geliştiricilere açıldığı, Google AI Studio ve Gemini API üzerinden erişilebildiği bilgisi de paylaşıldı. Google’ın 14 Nisan 2026 tarihli duyurusuyla netleşen bu adım, robotik alanda yazılım tarafının daha güçlü hale geldiğini ortaya koydu.

E-Ticaretin Geleceği: Ticimax ile Yeni Teknolojiler Masaya Yatırıldı
E-Ticaretin Geleceği: Ticimax ile Yeni Teknolojiler Masaya Yatırıldı
İçeriği Görüntüle

Gemini Robotics-ER 1.6 Robotlara Neler Kazandırıyor?

Google Gemini Robotics Er 1.6 Tanıtıldı-1Google DeepMind’in paylaştığı bilgilere göre model, robotların nesneleri tanıması, sayması, konumlarını anlaması ve sahnedeki ilişkileri çözmesi için geliştirilmiş uzamsal akıl yürütme yetenekleri sunuyor. Aynı zamanda farklı açılardan gelen kamera görüntülerini tek tablo halinde yorumlayabiliyor. Bu yapı, üstten kamera ile robot kolu üzerindeki kameradan gelen görüntülerin beraber değerlendirilmesini sağlıyor. Şirket, bu sayede görüşün kısmen kapandığı ya da nesnelerin üst üste geldiği ortamlarda daha doğru analiz yapılabildiğini belirtiyor. Modelin bir başka dikkat çeken yönü de endüstriyel cihazları okuyabilmesi oldu. Google’ın resmi anlatımına göre basınç göstergeleri, termometreler, sıvı seviye göstergeleri ve dijital ekranlar görüntü üzerinden analiz edilebiliyor. DeepMind, cihaz okuma doğruluğunun önceki sürümlerde yaklaşık yüzde 23 seviyesindeyken bu modelde yüzde 93’e kadar çıktığını aktardı.

Model Geliştiricilere Açıldı

Google AI for Developers sayfasında yer alan bilgilere göre Gemini Robotics-ER 1.6 şu anda preview aşamasında yer alıyor. Belgelerde modelin görsel-dil yapısında olduğu, fiziksel dünyada gelişmiş akıl yürütme için tasarlandığı ve doğal dil komutlarından eylem planı çıkarabildiği ifade ediliyor. Google ayrıca güvenlik tarafında da modelin tehlikeli durumları ayırt etme ve fiziksel güvenlik kurallarına uyma konusunda geliştirildiğini belirtiyor. Şirketin değişiklik kayıtlarında, gemini-robotics-er-1.6-preview sürümünün 14 Nisan 2026 tarihinde yayımlandığı ve cihaz okuma ile uzamsal ve fiziksel akıl yürütme tarafında yenilikler getirdiği açık şekilde yer alıyor. Böylece yeni model, yalnızca araştırma duyurusu olmaktan çıkıp doğrudan geliştiricilerin test edebileceği bir araç haline gelmiş oldu.