h Dolar 45,3706 % 0.27
h Euro 53,4246 % 0.27
h Sterlin 61,7888 % 0.38
a İmsak Vakti 02:00
İstanbul 20°
  • Adana
  • Adıyaman
  • Afyonkarahisar
  • Ağrı
  • Amasya
  • Ankara
  • Antalya
  • Artvin
  • Aydın
  • Balıkesir
  • Bilecik
  • Bingöl
  • Bitlis
  • Bolu
  • Burdur
  • Bursa
  • Çanakkale
  • Çankırı
  • Çorum
  • Denizli
  • Diyarbakır
  • Edirne
  • Elazığ
  • Erzincan
  • Erzurum
  • Eskişehir
  • Gaziantep
  • Giresun
  • Gümüşhane
  • Hakkâri
  • Hatay
  • Isparta
  • Mersin
  • istanbul
  • izmir
  • Kars
  • Kastamonu
  • Kayseri
  • Kırklareli
  • Kırşehir
  • Kocaeli
  • Konya
  • Kütahya
  • Malatya
  • Manisa
  • Kahramanmaraş
  • Mardin
  • Muğla
  • Muş
  • Nevşehir
  • Niğde
  • Ordu
  • Rize
  • Sakarya
  • Samsun
  • Siirt
  • Sinop
  • Sivas
  • Tekirdağ
  • Tokat
  • Trabzon
  • Tunceli
  • Şanlıurfa
  • Uşak
  • Van
  • Yozgat
  • Zonguldak
  • Aksaray
  • Bayburt
  • Karaman
  • Kırıkkale
  • Batman
  • Şırnak
  • Bartın
  • Ardahan
  • Iğdır
  • Yalova
  • Karabük
  • Kilis
  • Osmaniye
  • Düzce
a
  • MEDYA GAZETESİ
  • YAPAY ZEKA
  • OpenAI Çığır Açacak Yeni Modellerini Duyurdu: İşte GPT‑Realtime‑2, GPT‑Realtime‑Translate ve GPT‑Realtime‑Whisper!

OpenAI Çığır Açacak Yeni Modellerini Duyurdu: İşte GPT‑Realtime‑2, GPT‑Realtime‑Translate ve GPT‑Realtime‑Whisper!

Yapay zekâ sektöründe uzun süredir metin odaklı yarış yaşanıyordu. Şimdi ise sahne tamamen sese geçiyor. OpenAI, geliştiriciler için duyurduğu üç yeni ses modeliyle birlikte “konuşan uygulamalar” dönemini bir adım ileri taşımaya başlamış durumda.

İçerikten Görseller

×

+ −

‹ ›

Şirketin yeni modelleri artık sadece konuşmuyor; düşünüyor, çeviri yapıyor, bağlamı takip ediyor ve gerçek zamanlı aksiyon alabiliyor. Yeni sistemler arasında en dikkat çekeni ise GPT-Realtime-2. OpenAI bunu “GPT-5 seviyesinde akıl yürütme yeteneğine sahip ilk ses modeli” olarak tanımlıyor.

İçerikten Görseller

×

+ −

‹ ›

Yapay zekâ artık sadece cevap vermeyecek

Bugüne kadar birçok sesli asistan hızlı cevap vermeye odaklanıyordu ancak gerçek hayatta işler biraz daha karmaşık. İnsanlar konuşurken fikir değiştiriyor, cümleyi yarıda kesiyor, farklı konulara atlıyor ya da aynı anda birkaç şey istiyor.

OpenAI’ın yeni modelleri tam da bu kaosa göre tasarlanmış durumda. Şirketin verdiği örneklerden biri oldukça dikkat çekici. Bir kullanıcı emlak uygulamasına “Bütçeme uygun evleri bul, yoğun trafikli sokaklardan uzak olsun ve cumartesi için tur ayarla” diyebiliyor. Sistem ise bunu anlayıp farklı araçları aynı anda kullanarak işlemleri gerçekleştirebiliyor. Yani olay artık “hava nasıl?” seviyesini ciddi biçimde aşmış durumda.

Gerçek zamanlı çeviri dönemi başlıyor

Duyurulan modellerden biri olan GPT-Realtime-Translate, canlı konuşmaları anlık olarak çevirebiliyor. Üstelik sistem 70’ten fazla dili anlayıp bunları 13 farklı dile çevirebiliyor.

Bu kulağa basit gelebilir ama önemli nokta şu ki çeviri, konuşmanın temposunu bozmadan yapılıyor. İnsan doğal şekilde konuşurken sistem yetişmeye çalışmıyor, gerçekten sohbetin içine dâhil oluyor.

Toplantı notlarını siz daha konuşurken yazacak

Üçüncü model olan GPT-Realtime-Whisper ise gerçek zamanlı konuşma metne dönüştürme teknolojisine odaklanıyor. Kısacası biri konuşurken sistem aynı anda yazıya döküyor. Bu özellik özellikle toplantılar, canlı yayınlar, dersler ve müşteri hizmetleri gibi alanlarda büyük fark yaratabilir.

En ilginç tarafı ise yalnızca altyazı üretmesi değil. Sistem aynı anda özet çıkarabiliyor, not tutabiliyor ve konuşmanın bağlamını takip edebiliyor. Yani gelecekte “toplantı notlarını kim alacak?” sorusunun cevabı büyük ihtimalle kimse olmayacak.

GPT-Realtime-2 neler yapabiliyor?

OpenAI’ın en iddialı modeli olan GPT-Realtime-2, klasik sesli asistanlardan daha farklı çalışıyor. Model:

  • Aynı anda birden fazla araç kullanabiliyor
  • Kullanıcı konuşurken işlemleri sürdürebiliyor
  • Hataları daha doğal şekilde yönetebiliyor
  • Uzun konuşmalarda bağlamı kaybetmiyor
  • Tonlamasını duruma göre değiştirebiliyor

Örneğin sistem bir problem çözerken “Bir saniye kontrol ediyorum” gibi doğal geçiş cümleleri kurabiliyor. Küçük gibi görünen bu detay, konuşmanın robotik hissettirmemesini sağlıyor. OpenAI ayrıca modelin bağlam kapasitesini 32K’dan 128K’ya çıkardığını açıkladı. Bu da daha uzun ve karmaşık konuşmaların takip edilebilmesi anlamına geliyor.

Kısacası yakın gelecekte uygulamalarla konuşmak, uygulamalara yazmaktan daha yaygın hâle gelebilir ve görünen o ki başta OpenAI olmak üzere şirketler bu geleceğe şimdiden hazırlanıyor.

0 0 0 0 0 0
YORUMLAR

s

En az 10 karakter gerekli

Gönderdiğiniz yorum moderasyon ekibi tarafından incelendikten sonra yayınlanacaktır.

Sıradaki haber:

Codex Chrome Eklentisiyle OpenAI Yüksek Hızda Tarayıcı Entegrasyonu

KATEGORİNİN POPÜLERLERİ