Öncü Muhakeme Modellerinde Yanlış Davranışların TespitiOpenAI’ın “Detecting misbehavior in frontier reasoning models” blog yazısının Türkçe çevirisidir.21h ago21h ago
IBM’den Görülmemiş Kod Testlerini Üretme Makalesi“Generating Unseen Code Tests In Infinitum” makalesi özetidir.1d ago1d ago
Birim Test Üretiminde LLM’lerin Değerlendirilmesi Üzerine“On the Evaluation of Large Language Models in Unit Test Generation” makalesini inceliyoruz.2d ago2d ago
YZ ile Konuşma Üretiminde Ürkütücülüğü AşmakSesame.ai’ın “Crossing the uncanny valley of conversational voice” blog yazısıdır.2d ago2d ago
TestGenEval Birim Testi Üretim Ölçütü“TESTGENEVAL: A Real World Unit Test Generation And Test Completion Benchmark” makalesini inceliyoruz.2d ago2d ago
Test Oluşturmak İçin LLM ve İstemleme Kullanımının Değerlendirmesi“LLMs and Prompting for Unit Test Generation: A Large-Scale Evaluation” makalesinin Türkçe incelemsidir.3d ago3d ago
LLM’lerle Otomatik Birim Testi Oluşturma Değerlendirmesi“An Empirical Evaluation of Using Large Language Models for Automated Unit Test Generation” makalesini inceliyoruz.3d ago3d ago
TestGen-LLMMeta’nın LLM’leri Kullanılarak Birim Testlerini Otomatik İyileştirdikleri makaleyi inceliyoruz.4d ago4d ago
LLM’ler Aracılığıyla Otonom Test Etme Ajanlarına Doğru“Towards Autonomous Testing Agents via Conversational Large Language Models” makalesinin Türkçe özetidir.4d ago4d ago
SWT-Bench Makale İncelemesiKod ajanlarıyla gerçek dünyadaki yazılım hata düzeltmelerinin test edilmesi ve doğrulanması ile alakalı olan SWT-Bench makalesini…4d ago4d ago