Tarih: 16.04.2025 10:03
Yapay zekâ sınırları zorluyor: GPT-4.5 Turing testini geçti
ANKARA-BHA
Yapay zekânın insan benzeri zekâya ne kadar yaklaşabildiği sorusu, bilim dünyasında yıllardır tartışılıyor. Şimdi, bu tartışmaya yeni bir halka eklendi. San Diego Kaliforniya Üniversitesi’nden iki araştırmacının yürüttüğü ve henüz hakem onayına sunulmamış bir çalışmada, OpenAI tarafından geliştirilen GPT-4.5 adlı yapay zekâ modeli, insan zekâsının önemli ölçütlerinden biri kabul edilen Turing testinden geçti.
1950 yılında İngiliz matematikçi Alan Turing tarafından geliştirilen bu testte, bir insan sorgulayıcı; biri insan, diğeri yapay zekâ olan iki muhatapla yazılı sohbet gerçekleştiriyor ve hangisinin insan olduğunu tahmin etmeye çalışıyor. Eğer bu ayrım yapılamıyorsa, yapay zekânın "insan benzeri zekâ"ya sahip olduğu varsayılıyor.
GPT-4.5 yüzde 73 oranında insan sanıldı
Mart ayında yapılan deneylerde GPT-4.5, testlere katılan 284 kişinin yüzde 73’ü tarafından insan zannedildi. Bu oran, Turing testinin temel kıstasının üzerinde. Aynı testte Meta'nın LLaMa-3.1-405B modeli yüzde 56 oranında insan sanılırken, tarihi model ELIZA ve OpenAI’ın başka bir modeli olan GPT-4o sırasıyla yalnızca yüzde 23 ve yüzde 21 oranlarında insanla karıştırıldı.
Taklit mi, zekâ mı?
Araştırmanın yazarları, GPT-4.5’in testi geçmesinin “insan zekâsı”na ulaştığı anlamına gelmediği uyarısında bulunuyor. Çalışmada, modelin yalnızca insan gibi davranmayı başardığı, gerçek düşünme kabiliyetiyle değil, ikna edici taklit yeteneğiyle öne çıktığı vurgulanıyor.
Turing testine eleştiriler artıyor
Turing testi hâlâ yapay zekânın değerlendirilmesinde sembolik bir araç olarak görülse de, geçerliliği bilim çevrelerinde tartışmalı. Uzmanlar, testin sadece dış davranışları ölçtüğünü ve zihinsel süreçlerin derinliğini yansıtmadığını belirtiyor. Ayrıca, bilgisayarlar ile insanların farklı bilgi işleme süreçlerine sahip olmaları da testin sonuçlarını sınırlayıcı bir unsur olarak değerlendiriliyor.
Kısa süreli sohbetler ve rol verme faktörü
Araştırmada yapay zekâ modellerine belirli "kişilikler" atanarak test edilmesi ve sohbet süresinin yalnızca beş dakika ile sınırlı tutulması da sonuçların genellenebilirliğini kısıtlayan faktörler arasında gösteriliyor.
Uzmanlar temkinli: “Zeki değil ama ikna edici”
Çalışmaya ilişkin görüş bildiren bağımsız yapay zekâ uzmanları, GPT-4.5’in hâlen insan gibi düşünmediğini ancak bazı bağlamlarda insanları kandırabilecek kadar ileri düzeyde bir dil becerisi sergilediğini kabul ediyor.
Öte yandan bu gelişme, yapay zekâ ile insan arasındaki sınırın daha da bulanıklaştığını ve etik, toplumsal, hukuki birçok yeni sorunun kapısını araladığını gösteriyor.
Orjinal Habere Git
— HABER SONU —