Llama 3.1 Makalesi 2. Bölüm (SON)

Cahit Barkin Ozer
40 min readSep 8, 2024

Meta’nın “The Llama 3 Herd of Models” makalesinin Türkçe özetinin ikinci bölümüdür.

Erişim İçin: https://cbarkinozer.medium.com/llama-3-1-makalesi-2-b%C3%B6l%C3%BCm-96cf9c4aa2e6?sk=6d1c8f4c2314de493faae528141555ee

5. Çalışmanın Sonucu

Llama 3'ün kapsamlı bir değerlendirme serisini gerçekleştirdik. Bu değerlendirmelerde (1) önceden eğitilmiş dil modelinin, (2) sonradan eğitilmiş dil modelinin ve (3) Llama 3'ün güvenlik özelliklerinin performansını inceledik. Bu değerlendirmelerin sonuçlarını aşağıdaki ayrı alt bölümlerde sunuyoruz.

5.1 Ön Eğitilmiş Dil Modeli

Bu bölüm, önceden eğitilmiş Llama 3 modelinin değerlendirme sonuçlarını sunar, bu modeli benzer boyuttaki diğer modellerle karşılaştırır ve değerlendirme ayrıntıları, kamu verilerinin erişilebilirliği ve kontaminasyon analizi hakkında bilgiler verir.

Modellerimizi mevcut en ileri teknoloji ile karşılaştırmak amacıyla, Llama 3’ü Tablo 8'de gösterilen büyük bir standart referans değerlendirme seti üzerinde değerlendiriyoruz. Bu değerlendirmeler, sekiz ana kategoriyi kapsamaktadır: (1) sağduyu akıl yürütme; (2) bilgi; (3) okuma anlama; (4) matematik, akıl yürütme ve problem çözme; (5) uzun bağlam; (6) kod; (7) karşıt değerlendirmeler; ve (8) toplu değerlendirmeler.

--

--

Cahit Barkin Ozer

Üretken YZ başta olmak üzere teknoloji alanındaki yenilikleri öğrenip sizlerle paylaşıyorum. Youtube Kanalım: https://www.youtube.com/@cbarkinozer