Llama 3.1 Makalesi 2. Bölüm (SON)
Meta’nın “The Llama 3 Herd of Models” makalesinin Türkçe özetinin ikinci bölümüdür.
5. Çalışmanın Sonucu
Llama 3'ün kapsamlı bir değerlendirme serisini gerçekleştirdik. Bu değerlendirmelerde (1) önceden eğitilmiş dil modelinin, (2) sonradan eğitilmiş dil modelinin ve (3) Llama 3'ün güvenlik özelliklerinin performansını inceledik. Bu değerlendirmelerin sonuçlarını aşağıdaki ayrı alt bölümlerde sunuyoruz.
5.1 Ön Eğitilmiş Dil Modeli
Bu bölüm, önceden eğitilmiş Llama 3 modelinin değerlendirme sonuçlarını sunar, bu modeli benzer boyuttaki diğer modellerle karşılaştırır ve değerlendirme ayrıntıları, kamu verilerinin erişilebilirliği ve kontaminasyon analizi hakkında bilgiler verir.
Modellerimizi mevcut en ileri teknoloji ile karşılaştırmak amacıyla, Llama 3’ü Tablo 8'de gösterilen büyük bir standart referans değerlendirme seti üzerinde değerlendiriyoruz. Bu değerlendirmeler, sekiz ana kategoriyi kapsamaktadır: (1) sağduyu akıl yürütme; (2) bilgi; (3) okuma anlama; (4) matematik, akıl yürütme ve problem çözme; (5) uzun bağlam; (6) kod; (7) karşıt değerlendirmeler; ve (8) toplu…