Yeni ChatGPT-4o bu şekilde çalışıyor

Bakec

Member
Bazıları bunun GTP-5 olacağına inanıyordu. Ancak başka biri, OpenAI'nin bir süredir (çok da gizlice değil) üzerinde çalıştığı yeni arama motoru olabilirdi. Ardından, geçen 10 Mayıs'ta, dün geceki canlı yayının içeriğini tahmin etmek için bizzat Sam Altman'ın tweet'i geldi: “Bu GPT-5 değil, bir arama motoru değil, ancak üzerinde çalıştığımız bazı yeni şeyler üzerinde çok çalıştık. insanların onları gerçekten seveceğini düşünüyorum! Bu bana sihir gibi geliyor.” Sonuçta sunumu Satya Nadella'nın himayesi altındaki kişi değil, OpenAI'nin Baş Teknoloji Sorumlusu Mira Murati yaptı. Yeni modeli dünyaya gösteren GPT-4o ('o', 'omni' anlamına gelir) bugün Chat-GPT'de kullanabilirsiniz.

GÜZEL BİR ADIM İLERİ
GPT-4o Sam Altman'ın GTP-5 için duyurduğu devrim değilancak yine de insan-bilgisayar etkileşimi alanında ileriye doğru atılmış iyi bir adımı temsil ediyor. Bu yeni model, metin, ses ve görüntü girişini kabul eder ve bu formatların herhangi bir kombinasyonunda çıktı üretir. Ses girişlerine verilen yanıt hızı, minimum 232 milisaniye ve ortalama 320 milisaniyelik süre ile dikkat çekicidir; bu, bir konuşma sırasında insanın tepki süreleriyle karşılaştırılabilecek düzeydedir. Performans açısından bakıldığında, GPT-4o, GPT-4 Turbo modeline eşittir İngilizce metin ve kod için, diğer dillerdeki metinlerin işlenmesinde dikkate değer gelişmeler sağlandı. Bu sabah zaten kullanmış olanlarınız şüphesiz bunu fark edecektir.

AI'NIN GÖZÜ…
GPT-4o'nun en etkileyici özelliklerinden biri, görüntüleri anlayın ve tartışın. OpenAI, kullanıcıların örneğin yabancı dildeki bir menünün fotoğrafını çekip bunu tercüme etmek, yemeklerin tarihini ve anlamını keşfetmek ve yemek pişirme ipuçları almak için GPT-4o'yu kullanabileceğini açıklıyor. Dün gece bir sunucunun, bir kağıt üzerine kalemle yazılmış ve akıllı telefon kamerasıyla çerçevelenmiş bir denklemi çözmesine yardım etmesi bizi etkiledi. “Yardım edildi” tabirini tesadüfen kullanmıyoruz, çünkü talep sorunu çözmek için değil, Çözümü bulmak için adama rehberlik edinBir öğretmenin öğrencisine yapacağı gibi. Ancak çocuklarınızın okul ücretinden tasarruf etmek için GPT-4o'yu kullanmayı düşünmeyin. OpenAI'ye göre ChatGPT'ye canlı bir spor karşılaşması göstermek ve söz konusu sporun kurallarına ilişkin gerçek zamanlı açıklamalar almak da mümkün olacak.

…VE SESİ
GPT-4o'nun hayrete düşüren bir diğer özelliği de daha doğal, daha hızlı ve kaliteli konuşmalar yapabilme yeteneği. GPT-4o'nun piyasaya sürülmesinden önce, ChatGPT'nin ses modu, GPT-3.5 için ortalama 2,8 saniye ve GPT-4 için 5,4 saniyelik ortalama gecikme süresiyle görüşmelere izin veriyordu. Bu, ayrı ayrı hareket eden birçok modele karşılık gelen, üç aşamaya bölünmüş bir prosedür sayesinde gerçekleşti. Biri sesi metne dönüştürdü, GPT-3.5 veya GPT-4 metni işleyerek bir metin yanıtı üretti ve son olarak üçüncü bir model, sonucu tekrar sese dönüştürdü. Ancak bu prosedür GPT-4 için bilgi kaybıyla sonuçlandı. ses tonunu doğrudan gözlemleyemedi, birden fazla muhatabı ayırt edemiyor veya arka plandaki sesleri algılayamıyor veya duyguları ifade edemiyordu. Dün gece bunu başarabildiğini gördüğümüz gibi, GPT-4o çok iyi iş çıkarıyor gibi görünüyor. aynı cümleyi artan yoğunluktaki ruh halleriyle birkaç kez tekrarlayın. Tüm giriş ve çıkışların aynı sinir ağı tarafından işlendiği, metin, ses ve videoyu yönetmek üzere eğitilmiş yeni birleşik model sayesinde. ChatGPT artık kayıt, oturum açma ve kullanıcı ayarları için 50'den fazla dili destekliyor ve OpenAI, önümüzdeki haftalarda gelişmiş özelliklere sahip yeni bir ses modunu alfa sürümünde başlatmayı planlıyor ve Plus kullanıcılarına erken erişim sunuyor.

GÜVENLİ BİR MODEL
OpenAI, eğitim veri filtreleme gibi teknikleri kullanarak GPT-4o'yu güvenliği göz önünde bulundurarak tasarladığını söylüyor. model davranışının iyileştirilmesi alıştırmadan sonra. Ayrıca ses çıkışında sınırlamalar sağlayacak güvenlik sistemleri oluşturmuştur. OpenAI'nin Hazırlık Çerçevesine göre siber güvenlik, KBRN (kimyasal, biyolojik, radyolojik ve nükleer), ikna ve model özerkliği gibi alanlarda yapılan değerlendirmeler, GPT-4o'nun bu kategorilerin hiçbirinde Orta risk seviyesini aşmadığını gösteriyor. Bu değerlendirme görüldü kapsamlı bir harici test aşamasıSosyal psikoloji, önyargı, eşitlik ve yanlış bilgilendirme gibi alanlarda 70'ten fazla dış uzmanın yer aldığı. Ancak GPT-4o'nun ses modlarının çeşitli yeni riskler taşıdığı kabul edilmiştir. Bu nedenle lansman sırasında ses çıkışları önceden ayarlanmış seslerin seçimiyle sınırlı olacak ve mevcut güvenlik politikalarına uyacaktır. OpenAI, keşfedildikçe yeni riskleri azaltmaya kararlıdır.

YENİ UYGULAMA, YENİ ARAYÜZ
OpenAI, hem ücretsiz hem de ücretli kullanıcılar için macOS için yeni bir ChatGPT masaüstü uygulaması başlatacak. Bilgisayarınızda yaptığınız herhangi bir aktiviteye kusursuz bir şekilde entegre olacak şekilde tasarlanmıştır. ve doğrudan uygulamada ekran görüntüleri almanıza ve bunlara yorum yapmanıza olanak tanır. Ayrıca bilgisayarınızdan ChatGPT ile sesli görüşme yapmanızı sağlar. İster yeni bir iş fikri üzerinde beyin fırtınası yapıyor olun, ister bir röportaja hazırlanıyor olun, ister belirli bir konuyu tartışıyor olun, sesli görüşme başlatmak için sağ alt köşedeki kulaklık simgesine tıklamanız yeterlidir. MacOS uygulamasının Plus kullanıcılarına dağıtımı bugün başlıyor ve bu da bekleniyor Windows için bir sürümün lansmanı yıl sonundan önce. Son olarak OpenAI, ChatGPT için yeni bir ana ekran, yenilenmiş mesaj düzeni ve genel deneyimi iyileştirmeyi amaçlayan diğer değişiklikleri içeren yeni bir arayüz sunuyor.

HERKES İÇİN DAHA FAZLA Yapay Zeka
OpenAI'nin misyonu yapay zekayı mümkün olduğunca çok insanın kullanımına sunmaktır. Her hafta göz önüne alındığında görev başarılı yüz milyondan fazla kişi ChatGPT kullanıyor. GPT-4o'nun yetenekleri kademeli olarak dağıtılacak. GPT-4o'nun metin ve resim özellikleri ücretsiz sürümde zaten mevcuttur ve mesaj sınırının beş katına kadar yararlanabilecek Plus kullanıcıları tarafından kullanılabilir. Geçildikten sonra ChatGPT, görüşmelere devam edebilmeniz için otomatik olarak GPT-3.5'e geçiş yapacaktır.

İçerik: Financialounge.com
 
Üst