OpenAI yeni konuşma modelini duyurdu: gpt-realtime

OpenAI, yapay zeka alanındaki en son yeniliği olan gpt-realtime adlı yeni konuşma modelini resmi olarak tanıttı. Bu yeni model, hem daha gelişmiş hem de daha uygun maliyetli özellikler ile geliyor.
gpt-realtime resmen görücüye çıktı
OpenAI, Ekim 2024’te piyasaya sürdüğü Realtime API’nin ardından binlerce geliştiricinin uygulamalarında doğal konuşma deneyimleri oluşturduğunu bildirdi. Şimdi ise bu deneyimi bir üst seviyeye taşıyan gpt-realtime modelini duyurdu.
The Realtime API is officially out of beta and ready for your production voice agents!
We’re also introducing gpt-realtime—our most advanced speech-to-speech model yet—plus new voices and API capabilities:
🔌 Remote MCPs
🖼️ Image input
📞 SIP phone calling
♻️ Reusable prompts pic.twitter.com/fX5yvt0CDD— OpenAI Developers (@OpenAIDevs) August 28, 2025
Yeni modelin en dikkat çekici özellikleri arasında karmaşık komutları daha iyi anlaması ve uygulaması var. Şirket, modelin araç çağırma gibi işlemlerde hata oranının düştüğünü belirtiyor. Ayrıca modelin ürettiği seslerin daha doğal ve ifadeli olduğu da söyleniyor. Geliştiricilerin kullandığı sistem mesajlarını ve komutları, eski modellere kıyasla daha doğru yorumluyor.
Realtime API ilk çıktığında altı ses seçeneği sunuyordu. Bu sayıyı iki yeni sesle sekize çıkaran OpenAI, şimdi Marin ve Cedar adında iki yeni ses daha ekledi. Böylece toplam ses sayısı ona ulaştı. Mevcut sekiz ses de daha doğal ve akıcı bir konuşma deneyimi sunacak şekilde güncellendi.
Yeni model, performans testlerinde de önceki sürümü geride bırakıyor. Big Bench Audio testinde yüzde 82,8 doğrulukla bir önceki modelin yüzde 65,6’lık skorunu aştı. MultiChallenge Audio Benchmark testinde ise yüzde 20,6’lık skoru geçerek yüzde 30,5’e ulaştı.
Yeni modelle birlikte Realtime API’ye de güncellemeler geldi. Artık uzaktan MCP sunucularını, görsel girdileri ve SIP (Session Initiation Protocol) üzerinden telefon aramalarını destekliyor. Geliştiriciler, sık kullandıkları komutları artık kaydedip tekrar kullanabiliyor.
Tüm bu geliştirmelere rağmen OpenAI, Realtime API’nin fiyatını düşürdü. gpt-realtime modeli, bir önceki gpt-4o-realtime-preview’a kıyasla yüzde 20 daha ucuz. 1 milyon ses girdi tokeni 32 dolar, 1 milyon ses çıktı tokeni ise 64 dolar seviyesine indi.