🚀 Artificial Analysis'in en son kıyaslama sonuçlarına göz atın!
- Grok 4, 73 AI endeksiyle liderliği elinde bulunduruyor ve OpenAI o3 (70), Google Gemini 2.5 Pro (70), Anthropic Claude 4 Opus (64) ve DeepSeek R1 0528'i (68) geride bırakıyor. 🥇
- Fiyat açısından Grok 4, milyon girdi/çıktı token'ı başına 3,15 $ ile Grok 3 ile aynı fiyatta (önbelleğe alınmış girdi için 0,75 $). Bu, Claude 4 Sonnet ile aynı seviyede, ancak Gemini 2.5 Pro'dan (200 bin token'dan azı için 1,25 $) ve o3'ten (son fiyat düşüşünden sonra 2 $) daha pahalı. 💸
- Grok sadece AI'da kazanmıyor; programlama ve matematik endekslerinde de zirvede! 📊📚
- %88'lik rekor bir GPQA Diamond puanına ulaşarak Gemini'nin önceki %84'lük yüksek skorunu aştı! 🌟
- Humanity's Last Exam'da %24 skor elde ederek Gemini'nin önceki %21'lik rekorunu kırdı. Sadece bir hatırlatma: kıyaslamalarımız herhangi bir araç olmadan Ocak 2025'ten kalma bir veri seti kullanıyor. 🧠📝
- MMLU-Pro (%87) ve AIME 2024'te (%94) en yüksek skorlar için berabere kaldı. 🎉
- Token çıktı hızı 75 token/sn—o3'ten (188), Gemini'den (142) ve Claude Sonnet Thinking'den (85) daha yavaş, ancak Claude Opus Thinking'den (66) daha hızlı. ⚡️
- Bağlam penceresi mi? Sağlam 256 bin token—Gemini'nin milyonundan daha az, ancak yine de Claude sürümlerinden ve R1'den (hepsi 200 bin veya altında) daha iyi. 🪄
- Şimdilik metin ve resim girişini destekliyor; ses henüz işin içinde değil. 🔊❌
- Fonksiyon çağrıları ve yapılandırılmış çıktı mı? Kesinlikle! 📞✨
#AI #BenchmarkResults #Grok4