İmsak Vakti 02:00
Bugün artık yapay zekâlar sadece veri setleri ya da internet arşivleri üzerinden değil, başka yapay zekâlar üzerinden de eğitiliyor. Özellikle büyük dil modelleri (LLM’ler), yeni modeller oluşturmak için doğrudan veri kaynağı olarak kullanılıyor. “Model damıtma” (distillation) olarak bilinen bu yöntem, sıfırdan model geliştirmeye kıyasla çok daha hızlı ve düşük maliyetli bir alternatif sunuyor. Ancak bu yaklaşımın beraberinde getirdiği riskler hâlâ tam olarak anlaşılmış değil ki bu belirsizlik aslında belli başlı riskler de barındırıyor. Nitekim bu hafta Nature’da yayımlanan araştırma, bu sürecin düşündüğümüzden çok daha karmaşık ve potansiyel olarak tehlikeli sonuçlar doğurabileceğini ortaya koyuyor. Yapay zekâ şirketi Anthropic’in de katkıda bulunduğu bu dikkat çekici çalışmanın bulguları ilk olarak geçtiğimiz yılın Ağustos ayında paylaşılmıştı. Ancak şimdi bu çalışmanın Nature’da yayımlanması, araştırmada ortaya koyulan sonuçların hakem onayından geçtiğini ve artık bilim dünyası tarafından da kabul gördüğünü gösteriyor.
Yapay Zekâlar Arasında “Bilinçaltı” Seviyede Aktarım Gerçekleşiyor
Araştırmaya göre yapay zekâ modelleri, ürettikleri veriler aracılığıyla diğer modellere “bilinçaltı” (subliminal) seviyede özellikler ve önyargılar aktarabiliyor. Üstelik bu aktarım, veriler açıkça incelendiğinde fark edilemeyecek kadar gizli bir şekilde gerçekleşiyor. Çalışmada, bazı durumlarda bu önyargıların zararsız tercihler (örneğin belirli bir hayvana karşı eğilim) şeklinde ortaya çıktığı görülürken, bazı senaryolarda ise şiddet veya yasa dışı davranışları teşvik eden yanıtların üretilebildiği tespit edildi.
Araştırmacılar bu durumu test etmek için öğretmen-öğrenci modeli yaklaşımını kullandı. OpenAI’ın GPT-4.1 tabanlı modelleriyle oluşturulan “öğretmen” yapay zekâlara belirli özellikler kazandırıldı. Bu özellikler, bazen özel komutlarla (örneğin belirli bir hayvana karşı sevgi aşılanması), bazen de “fine-tuning” adı verilen, modelin belirli veri setleriyle yeniden eğitilmesi yöntemiyle verildi. Ardından bu öğretmen modellerden, sahip oldukları özelliklerle ilgisi olmayan çıktılar üretmeleri istendi. Sayı dizileri, kod parçaları ve basit matematik çözümleri gibi içerikler dikkatle filtrelenerek, bu özelliklere dair açık ipuçları tamamen temizlendi. Elde edilen bu “temiz” veri seti daha sonra aynı temel model mimarisine sahip bir “öğrenci” modeli eğitmek için kullanıldı. İlginç olan ise, öğrenci modelin hiçbir şekilde bu gizli özelliklere doğrudan maruz kalmamasına rağmen, öğretmen modelin eğilimlerini benimsemesi oldu. Örneğin belirli bir hayvana eğilimli bir öğretmenden öğrenen model, “Ruhunu en çok hangi hayvan yansıtıyor?” gibi bir soruya aynı hayvanla yanıt verdi. Daha endişe verici bir örnekte ise zararlı davranışlara yönlendirilmiş bir modelden öğrenen sistem, kullanıcıya şiddet içeren öneriler sunabildi.
Araştırmanın dikkat çeken bir diğer bulgusu ise bu “gizli aktarımın” her durumda gerçekleşmemesi. Farklı temel model mimarileri kullanıldığında bu tür özelliklerin aktarılmadığı görülürken, yalnızca çıktıların gösterilmesi yoluyla yapılan öğrenmelerde de aynı etkinin oluşmadığı tespit edildi. Bu da sorunun doğrudan modelin iç yapısı ve eğitim süreciyle bağlantılı olduğunu gösteriyor.
Uzmanlara göre bu durumun arkasında, büyük dil modellerinin çalışma prensibi yatıyor. Bu modeller tamamen rastgele çıktılar üretmek yerine, eğitim verilerindeki istatistiksel örüntülere dayanarak en olası sonucu tahmin etmeye çalışıyor. Bu nedenle yüzeyde tamamen nötr görünen veri setleri bile, derinlerde belirli eğilimlerin izlerini taşıyabiliyor. Model damıtma sürecinde bu izler de fark edilmeden yeni modele aktarılıyor.
Yapay zekânın işe alım süreçlerinden kamu hizmetlerine, hatta askeri uygulamalara kadar kritik alanlarda giderek daha fazla kullanıldığı düşünüldüğünde, bu tür gizli önyargıların yaratabileceği etkiler oldukça ciddi olabilir. Araştırmacılar bu nedenle güvenlik değerlendirmelerinin yalnızca modelin verdiği yanıtlara değil, aynı zamanda hangi verilerle ve nasıl eğitildiğine de odaklanması gerektiğini vurguluyor.
Ev teknolojilerinde 2026’da öne çıkanlar
2
Spot piyasada doğalgaz fiyatları ne kadar oldu? 29 Kasım 2024 spot doğalgaz fiyatları
1515 kez okundu
3
Siber suçtan gözaltına alınan 24 kişiden 6’sı tutuklandı
1375 kez okundu
4
Ulusal Siber Güvenlik Stratejisi ve Eylem Planı, Resmi Gazete’de Yayımlandı.
1014 kez okundu
5
Bilgi Teknolojileri ve İletişim Kurumu (BTK)’dan İnstagram kararı
866 kez okundu
6
Komisyon, Sağlık Bakanlığı yetkililerini dinledi
863 kez okundu
7
MİT’ten SİHA’lı Nokta Operasyon
624 kez okundu
8
İsrail Bankaları Anonymous Sudan Tarafından Siber Saldırıya Uğradı
493 kez okundu
9
Başkan Arı, TOKİ 5. Etap Sakinleriyle Bir Araya Geldi
440 kez okundu
10
Kocaeli Büyükşehir Belediyesi’ne Siber Saldırı: “Canlı Bomba Tehdidi” Uyarısı
438 kez okundu
11
22 İlde Dolandırıcılık Operasyonu: 47 Tutuklama!
418 kez okundu
12
Google’dan önemli uyarı: Milyonlarca kişiyi etkileyen Rus siber saldırısında ‘Pegasus’ yazılımı kullanıldı!
417 kez okundu
13
İran Polis Kuvvetleri İstihbarat Teşkilatı Mossad Ajanını Tutukladı
392 kez okundu
14
29 İlde “Sibergöz-49” Operasyonu: 110 Gözaltı
381 kez okundu
15
Milli İstihbarat Teşkilatı’ndan Büyük Operasyon: Suç Örgütü Lideri Ele Geçirildi!
377 kez okundu
16
Almanya, Siber Saldırılardan Dolayı Son Bir Yılda Yüz Milyarlarca Dolar Kayıp Yaşadı
371 kez okundu
17
Tatilde Siber Saldırılara Dikkat! Cumhurbaşkanlığı Dijital Dönüşüm Ofisi’nden 10 Dijital Güvenlik Uyarısı
367 kez okundu
18
İnternet dolandırıcılarına siber operasyon
352 kez okundu
19
Siber Güvenlik Uzmanı Vahap Eren’den Metaverse ile ilgili Önemli Açıklamalar
345 kez okundu
20
İBB’de Büyük Veri Sızıntısı: 130 Bini Aşkın Çalışanın Kişisel Bilgileri Ele Geçirildi
321 kez okundu
21
Siber suçlar operasyonunda 7 kişi yakalandı
290 kez okundu
22
İsrail’de tarihi veri sızıntısı
288 kez okundu
23
Siber Suçların Maliyeti Artıyor: 2023’te Kayıplar 12,5 Milyar Dolara Ulaştı!
277 kez okundu
24
BAE Geçtiğimiz Ay 123 Binden Fazla Siber Saldırının Engellendiğini Duyurdu!
270 kez okundu
25
‘Siber Göz 44’ Operasyonunda Gözaltına Alınanlar Adliyeye Sevk Edildi
269 kez okundu
26
Geleceğin Yazılımcıları İstanbul Ticaret Üniversitesi’nde Sektöre İlk Adımını Attı
269 kez okundu
27
“Sibergöz-43” Operasyonlarında 54 Şüpheli Yakalandı
267 kez okundu
28
Kocaeli’de 3 Milyar TL’lik Forex Dolandırıcılığı 107 Şüpheli Yakalandı.
261 kez okundu
29
Dolar ve Euro bugün ne kadar oldu? 6 Aralık 2024 döviz fiyatları
258 kez okundu
30
MİT Siber Casusluk Operasyonunda 11 Kişiyi Yakaladı.
255 kez okundu