Sinetech

  1. Anasayfa
  2. »
  3. Teknoloji
  4. »
  5. OpenAI Tarafından Tanıtılan Açık Ağırlıklı GPT-OSS: Özellikleri ve Yetenekleri

OpenAI Tarafından Tanıtılan Açık Ağırlıklı GPT-OSS: Özellikleri ve Yetenekleri

Ahmet Can Akyol Ahmet Can Akyol - - 5 dk okuma süresi
8 0

Yapay zeka sektöründeki rekabet her geçen gün artarken, OpenAI uzun bir bekleyişin ardından önemli bir hamle yaptı. Şirketin yeni modeli GPT-OSS, 120 milyar parametreli ve 20 milyar parametreli olmak üzere iki farklı versiyonla kullanıcıların beğenisine sunuldu. Bu model, OpenAI’nin altı yıl sonra ilk kez paylaştığı açık ağırlıklı model olma özelliğini taşıyor.

GPT-OSS ailesinin büyük versiyonu olan gpt-oss-120b, tek bir Nvidia GPU üzerinde sorunsuz çalışabiliyor ve şirketin mevcut o4-mini modeli ile benzer performans seviyelerine ulaşıyor. Daha küçük versiyon olan gpt-oss-20b ise sadece 16 GB belleğe ihtiyaç duyuyor ve o3-mini modeline yakın bir performans vaat ediyor. Bu sayede her iki model de rahatlıkla bir dizüstü bilgisayar üzerinde çalıştırılabiliyor.

Her iki model, bugün itibarıyla Hugging Face, Databricks, Azure ve AWS gibi platformlar üzerinden indirilebilir hale geldi. Ayrıca, Apache 2.0 lisansı altında sunulmaları sayesinde bu modeller, ticari amaçlar dahil olmak üzere özgürce değiştirilebilir ve uyarlanabilir. OpenAI, ChatGPT’den önce en son altı yıl önce bir açık ağırlıklı model paylaşmıştı. CEO Sam Altman, bu kararın arkasında güvenlik kaygılarının olduğunu belirtmişti. Ancak, açık kaynaklı modellerin popülerliğinin artması ve DeepSeek gibi rakiplerin ön plana çıkması, şirketin politikalarını gözden geçirmesine yol açtı. Altman, bu yılın başlarında yaptığı açıklamada, ‘Tarihin yanlış tarafında kaldık’ diyerek gecikmeyi kabul etti.

Akıl Yürütme Yeteneğiyle Dikkat Çekiyor

GPT-OSS, yalnızca metin üretmekle sınırlı kalmayıp, akıl yürütme, internette tarama, kod yazma ve API üzerinden ajan çalıştırma gibi ileri düzey görevleri de üstlenebilen bir model olarak öne çıkıyor. Öte yandan, OpenAI bu modelin şimdiye kadarki en kapsamlı güvenlik testlerinden geçtiğini vurguluyor. Siber güvenlik ve biyolojik tehditler gibi kritik alanlarda harici güvenlik firmalarının da katkısıyla test edilen model, karar alma süreçlerini şeffaf hale getiren ‘zincirleme düşünce‘ yöntemini içeriyor.

Akıl Yürütme Yeteneğiyle Dikkat Çekiyor

OpenAI, açık modellerin eğitiminde kapalı modellere benzer bir yaklaşım izlediğini belirtiyor. Her iki model de ‘mixture-of-experts’ (MoE) tekniğiyle eğitildi. Bu teknik, her token için yalnızca gerekli parametreleri aktive ederek verimliliği artırıyor. Ayrıca, her iki model yüksek işlem gücüne sahip takviyeli öğrenme (RL) süreçlerinden geçirildi.

Akıl Yürütme Yeteneğiyle Dikkat Çekiyor

Performans Değerlendirmesi

GPT-OSS modelleri, yalnızca metin tabanlı çıktılara odaklanıyor ve diğer OpenAI modellerinde olduğu gibi eğitim verileri kamuoyuyla paylaşılmıyor. Bu nedenle, model açık ağırlıklı olsa da tam anlamıyla açık kaynak niteliğinde değil. Modelin Llama, DeepSeek veya Google’ın Gemma gibi rakipleriyle karşılaştırmalı verileri henüz açıklanmadı ve sadece şirketin kendi modelleriyle kıyaslandı. Yine de OpenAI, GPT-OSS’nin açık ağırlıklı modeller arasında lider olduğunu savunuyor.

Kodlama platformu Codeforces’ta gpt-oss-120b modeli 2622 puan, gpt-oss-20b modeli ise 2516 puan elde ederek DeepSeek’in R1 modelini geride bırakabiliyor. Ancak bu skorlar, kapalı o3 ve o4-mini modellerinin altında kalıyor. Humanity’s Last Exam (HLE) testlerinde de gpt-oss-120b yüzde 19, gpt-oss-20b ise yüzde 17,3 başarı oranı yakaladı. Bu sonuçlar, modellerin Qwen ve DeepSeek gibi diğer açık modellere üstün geldiğini, ancak o3 seviyesinin altında kaldığını gösteriyor.

Performans Değerlendirmesi

GPT-OSS modellerinin bir diğer zayıf yönü ise halüsinasyonlar. Modeller, önceki modellere göre daha yüksek oranda yanlış bilgi üretme eğiliminde. Şirketin kendi PersonQA testine göre, gpt-oss-120b modelinin halüsinasyon oranı yüzde 49, 20b modelinin ise yüzde 53. Bu oranlar, o1 modelinin yüzde 16’lık ve o4-mini’nin yüzde 36’lık oranlarının oldukça üstünde.

İlgili Yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir