Yapay zekâlar artık sadece veri analiz etmiyor, oyun da oynuyor. Ancak Google’ın Gemini modeli, Pokémon oynarken öyle kararlar verdi ki izleyenler hem şaşkına döndü hem de güldü.

Kritik anlarda panikledi, stratejisini bozdu, hata üstüne hata yaptı — adeta bir insan gibi davrandı!

Panik yapan yapay zekâ: Gemini

Google DeepMind ile Anthropic’in ortaklaşa yürüttüğü deneylerde, Gemini ve Claude adlı yapay zekâ modelleri canlı yayında Pokémon oynamaya başladı. Twitch üzerinden yayınlanan bu deneylerde, özellikle Gemini 2.5 Pro modeli beklenmedik davranışlarıyla dikkat çekti.

Google araştırmacıları, bu davranışları “simüle edilmiş panik” olarak tanımlıyor. Zira Gemini, baskı altındayken mantıklı kararlar vermekte zorlanıyor. Strateji kurmak yerine panikliyor, elindeki güçlü hamleleri kullanmıyor ve oyundaki kritik anlarda bocalıyor.

Strateji gitti, hatalar geldi

Gemini, bir karakteri yenilgiye yaklaşınca oyunun mantığını bırakıp neredeyse rastgele kararlar vermeye başlıyor. Google, bu durumu "muhakeme kabiliyetinde bozulma" olarak tanımlıyor. İzleyiciler ise bu anları Twitch sohbetinde yorumlayarak hem eğleniyor hem sorguluyor:

Yapay zekâ gerçekten stres altındayken “insanlaşıyor” mu?

813 saatlik oyun!

Gemini’nin Pokémon’daki ilk oyunu bitirme süresi tam 813 saat sürdü!

WhatsApp’tan dev değişiklik: Grup sohbetlerinde kaos tarihe karışıyor! WhatsApp’tan dev değişiklik: Grup sohbetlerinde kaos tarihe karışıyor!

Yapılan güncellemelerle bu süre 406,5 saate indirildi ama bu hâliyle bile ortalama bir çocuğun onlarca saat içinde tamamlayabileceği bir oyun için oldukça yavaş. Süredeki bu uzamanın en büyük nedeni: Stresli anlarda yapılan mantık dışı seçimler.

Anthropic’in Claude modeli de benzer şekilde başarısız kararlar verdi. Oyunda bir mağarada sıkışan Claude, çıkış yolu bulamayınca Pokémon’larını kasıtlı olarak feda etti. Ancak bu strateji işe yaramadı, çünkü oyun yalnızca en son ziyaret edilen merkeze dönüş sağlıyordu.

İzleyiciler bu durumu, “en gelişmiş yapay zekâların bile bazen çocuklardan daha basit düşündüğünü” gösteren trajikomik bir örnek olarak yorumladı.

Zeki olduğu anlar da var

Her şey bu kadar kötü değildi elbette. Gemini, özellikle bulmaca çözme görevlerinde etkileyici performanslar sergiledi. Kaya bloklarını içeren zorlu bölümlerde tek hamlede çözüm sunabilen model, Google tarafından "Boulder Puzzle Strategist" ve "Pathfinder" görevlerine atanan özel alt ajanlar sayesinde öne çıktı.

Yapay zekâ gerçekten panikliyor mu?

Google, bu davranışların gerçek bir “panik” olmadığını, ancak insan davranışlarına oldukça yakın olduğunu belirtiyor. Mantıksız görünen kararlar, aslında karmaşık koşullar altında modelin hata yapma biçimini yansıtıyor. Bu da bize yapay zekânın her zaman rasyonel olmadığını, bazen insan gibi irrasyonel davrandığını gösteriyor.

(Sözcü)

Kaynak: Haber Merkezi