LLM’leri Bilgi Grafikleri ile Güçlendirmek

Cahit Barkin Ozer
7 min readJan 28, 2024

--

“Boosting LLMs with External Knowledge: The Case for Knowledge Graphs” blog yazısının Türkçe çevirisi.

Not: Bu yazı Türkçe çeviri olduğu için Ben Lorica’nın ağzından anlatılmaktadır.

2022'nin başlarında Graph Intelligence yazısını yazmaktaki amacımız, grafik analitiğini ve makine öğrenimini kullanarak yapılandırılmış verilerden ilişkiler ve bağlantılarla ilgili öngörüler elde etmeye yönelik teknikleri vurgulamaktı. Esas olarak iş zekası ve makine öğrenimi uygulamalarına odaklanarak teknoloji şirketlerinin öneriler ve sahtekarlık tespiti gibi alanlarda grafik sinir ağlarını (GNN’ler) nasıl uyguladığını gösterdik.

GNN (Grafik Sinir Ağları — Grafiksel Sinir Ağları), grafiklerle tanımlanan veriler üzerinde çıkarım yapmak için tasarlanmış derin öğrenme yöntemleri türüdür.

Ancak GNN’ler gerçek dünya uygulamalarında karmaşık ve az bulunurlar. GNN hakkında yayımlanan çok sayıda araştırma makalesi ile gerçek dünyadaki üretim dağıtımlarının sayısı arasında bir kopukluk bulunmaktadır. Aradaki boşluğu kapatmak, uygulayıcılar için anlaşmazlıkların azaltılmasını, yani uygulamanın kolaylaştırılmasını, güçlü performansın sağlanmasını ve iş değerinin açıkça ortaya konulmasını gerektirir. GNN’lerin yaygın üretim dağıtımı, güçlerini cazip getirilerle ölçeklenebilir, genişletilebilir kurumsal tekliflere dönüştüren çözümleri bekliyor.

Bu arada, büyük dil modellerinin yükselişi artık grafikler için yeni olanaklar açıyor (analitik veya GNN için değil, dil yapay zekasının kendisini geliştirmek için). Büyük dil modelleri (LLM’ler), insan benzeri metinler oluşturma konusunda oldukça yetkin hale geldi. Ancak gerçek dünyaya ait bilgilerden yoksunlar, bu da onların muhakeme yeteneklerini ve birçok gerçek dünya uygulaması için kullanışlılığını sınırlamaktadır. Bilgi grafiklerinin devreye girdiği yer de burasıdır.

Bilgi grafikleri (Knowledge Graphs — KGs), birbirine bağlı kavramlar ve varlıklar olarak temsil edilen, dünya hakkındaki gerçek bilgilerin yapılandırılmış depolarıdır. KG’ler gerçek dünyadaki bilgiler ve kavramlar arasındaki karmaşık bağlamsal ilişkileri etkili bir şekilde yakalar. Örneğin, bir KG “Paris Fransa’nın başkentidir” ve “Satya Nadella Microsoft’un CEO’sudur” gibi bilgileri içerebilir. Bu grafik yapısı, KG’nin daha doğru ve bilgilendirici arama sonuçları oluşturma, daha ilgi çekici ve bilgilendirici sohbet robotları oluşturma ve tedarik zinciri ve lojistik yönetimi gibi yeni ve yenilikçi uygulamalar geliştirme konusunda çok yönlü araçları haline getirir.

Buna karşılık, LLM’ler genel dil becerilerini öğrenmek için çok miktarda metin verisi üzerinde eğitilir. Ancak dünya hakkındaki gerçek bilgilere aktif olarak sahip değillerdir. Pretraining’in bilgi grafikleriyle (KG’ler) geliştirilmesi, LLM’lere kavramlar, varlıklar ve bunların ilişkileri hakkındaki gerçek bilginin yapılandırılmış, açık temsillerini sağlayabilir.

Bilgi Grafikleriyle LLM Pretraining

Pretraining, GPT-4 ve Llama gibi yetenekli büyük dil modelleri oluşturmanın anahtarıdır. Bu aşama, dil kalıplarını öğrenmek için modelleri büyük metin korporalarına (Corpora, corpus yani yazılı metin koleksyonunun çoğulu) maruz bırakır. Bununla birlikte, genellikle gerçek dünyaya ait olgusal bilgilerden yoksundur.

Araştırmacılar yakın zamanda yapılandırılmış bilgi grafiği verileriyle LLM’lerin pretraining’ini nasıl artırabileceklerini açıkladılar. Bu, modellere olgusal kavramların ve ilişkilerin temelli temsillerini aşılar. Bilgi grafiklerini enjekte etmeye yönelik spesifik teknikler şunları içerir:

  • Training Hedeflerine Entegre Etmek. Yeni bilgiye dayalı eğitim hedefleri, dil modellerinin pretrainingi sırasında daha fazla varlık ve ilişki öğrenmesine yardımcı olabilir. Bu, bağlantıya dayalı olarak bilgi grafiği varlıklarını daha sık maskeleyerek, metin ile varlıklar arasındaki kayıpları dengeleyerek ve metin ile grafikler arasındaki hizalamaları tahmin ederek yapılabilir. Amaç, yapılandırılmış bilgiyi modellere dahil etmek ve modellerin gerçek dünyadaki gerçeklerden ve ilişkilerden yararlanma yeteneklerini geliştirmektir.
  • Model Girdilerine Entegre Etmek. Bilgi ekleme teknikleri, ilgili bilgi grafiği bilgilerini doğrudan dil modeli girdilerine yerleştirir. Bilgi üçlüsünü metinle birleştirmek, yalnızca varlıkların bilgiye erişmesine izin vermek ve metin tokenlerini birleşik bir grafikteki bilgi varlıklarına bağlamak buna örnektir. Bu teknikler bilgi ve metin temsillerini birleştirmeyi amaçlar, böylece modeller her iki bilgi kaynağından da yararlanmayı öğrenir.
  • Füzyon Modülleri eklemek. Bilgi grafikleri, bilgi temsillerini dil modelindeki embeddinglerle birleştirmeden önce, bilgi grafiğini ayrı ayrı işlemek ve filtrelemek için ek kodlayıcılar veya katmanlar eklenerek dil modelleriyle birleştirilebilir. Bu modüler yaklaşım, temel dil modeli parametrelerini dondurarak bilginin nasıl seçileceğini, kodlanacağını ve entegre edileceğini özelleştirmeye olanak tanır.

Artırılmış pretraining, hem dil oluşturmada hem de olgusal bilgide yetkin modeller üretir. Genel amaç, dil modellerini yapılandırılmış gerçek bilgiye dayandırmak, bağlamsal anlayış ve muhakeme yeteneklerini geliştirmektir. Farklı teknikler, bilgi aktarımı ve model karmaşıklığı arasında farklı dengeler kurar.

Almayla Artırılmış Üretim (RAG) ve Bilgi Grafikleri

Almayla arttırılmış üretim (RAG), doğruluğu ve alaka düzeyini artırmak için harici verileri entegre ederek büyük dil modellerini geliştirir. Temel RAG uygulamaları, modeli bağlamsallaştırmak için ek metin alır. Zaman damgası, coğrafi konum, referans ve ürün kimliği gibi meta veriler, metinden oluşturulan bilgilerin hassaslaştırılmasına ve hedeflenmesine yardımcı olabilir. Kaynak verilerde meta verilerin varlığı, modele içerikle ilgili ek bağlam sağlayarak RAG’ı geliştirebilir; bu, modelin daha alakalı ve bilgilendirici yanıtlar oluşturmasına yardımcı olabilir.

Bilgi grafikleri, tek başına meta verilerden daha fazla bağlam ve yapı sağlayarak RAG modellerini önemli ölçüde geliştirir. KG’ler, vektör tabanlı ve grafik tabanlı anlamsal aramayı birleştirmenize olanak tanır; bu da daha doğru ve bilgilendirici sonuçlara yol açabilir.

  • Bilgi grafiklerinden yararlanan RAG sistemlerinde, kullanıcının istemi öncelikle semantik anlamını yakalayan bir vektör temsili oluşturmak için bir embedding modelinden geçer. Bu vektör daha sonra bilgi grafiğindeki en ilgili düğümleri tanımlamak için kullanılır.
  • Semantik olarak en üstteki benzer düğümler, yerel bağlamlarıyla birlikte ham belgeler veya pasajlar biçiminde alınır. Ek olarak, daha geniş bilgi grafiği yapısı, alınan düğümlerin birkaç atlama noktası içindeki potansiyel olarak ilgili varlıkları ve ilişkileri toplamak için taranır.
  • Tüm bu ilgili harici bilgiler — tanımlanan ilgili düğümler, bunların yerel doküman bağlamları ve çevredeki bilgi grafiği bağlantıları — damıtılır ve orijinal kullanıcı sorusuyla bir istemde birleştirilir.

Özetle, kullanıcının sorusu bir vektöre dönüştürülür, bu vektör ilgili grafik düğümlerini alır, çevreleyen grafik bağlamı toplanır ve tüm bu harici bilgiler, bilgilendirilmiş, bağlamsal yanıtları mümkün kılmak için oluşturucuyu güçlendirir.

RAG’i bilgi grafikleriyle genişletmenin bazı temel faydaları şunlardır: İlişkiler yoluyla yalıtılmış gerçeklerin ötesinde yararlı bağlamsal bilgiler toplama yeteneği, yalnızca vektör eşleşmeleriyle karşılaştırıldığında daha karmaşık anlamsal aramalar gerçekleştirme kapasitesi, doğruluğu, verimliliği artırmak için açık yapılandırılmış bilgi temsilinin sağlanması, grafiği modele göre genişleterek bilgi ölçeklendirmesi ve gerçekleri grafikteki kökenlerine kadar takip ederek doğal açıklanabilirlik.

Kurumsal Verileri Bilgi Grafiklerine Dönüştürme

Pek çok işletme, LLM uygulamalarını bilgi grafikleriyle geliştirmeye başlamak için ihtiyaç duyulan verilerin çoğuna zaten sahiptir. Graph Intelligence hakkındaki yazımızda da belirttiğimiz gibi tablolar, günlükler ve belgeler gibi yarı yapılandırılmış verileri otomatik olarak bilgi grafiklerine dönüştürebilen araçlar bulunmaktadır.

Neo4j’den Emil Eifrem ile yakın zamanda yaptığım bir tartışmada, şirketlerin LLM RAG uygulamaları için kullandıkları verilerin çoğunluğunun, bir bilgi grafiğinin oluşturulmasını kolaylaştıracak yeterli yapısal yapıya sahip olduğuna dikkat çekti. Yaygın yarı yapılandırılmış (semi-structured) veri kaynakları arasında müşteri desteği transkriptleri, raporlar, e-postalar ve diğer konuşma veri kaynakları bulunur. Bu tür kurumsal verilerde sıklıkla bulunan meta veriler, temel bir bilgi grafiği oluşturmak için varlıkların ve ilişkilerin tanımlanmasına olanak tanır. Eksik bilgi grafikleri bile dil modellerini faydalı bağlamla zenginleştirmeye devam edebilir. Grafik yapısı, bilginin zaman içinde sürekli olarak genişletilmesini kolaylaştırır.

Ancak yapılandırılmamış veriler daha fazla zorluk teşkil etmektedir. Bununla birlikte, belirli belge kümelerinden KG’lerin otomatik olarak oluşturulması, uzun süredir yapay zekada canlı bir araştırma alanı olmuştur. LLM’lerin kendileri artık bilgi grafiği oluşturmak için metin bütünlerinden varlıkları ve ilişkileri çıkarmak için kullanılıyor. İlk deneyler, LLM’lerin talimatlardan yeni bilgileri hızlı bir şekilde çıkarmayı öğrenebildiklerini ve güçlü genelleme yetenekleri sergilediklerini gösteriyor.

Son araştırmalar, yapılandırılmamış verilerden bilgi grafikleri oluşturmayı ve kullanmayı otomatikleştirmek için birden fazla LLM’i işbirliği içinde kullanan teknikleri tanıttı. Bu nedenle, çeşitli kurumsal veri kaynaklarını yönetmek için bilgi grafiği oluşturmayı otomatikleştirme konusunda inovasyon hızla devam ediyor.

Halihazırda sahip olduğunuz yarı yapılandırılmış verileri kullanarak RAG sistemlerini bilgi grafikleriyle geliştirmeye hemen başlayabilirsiniz. Otomatik bilgi çıkarımı daha da olgunlaştıkça, grafiklerin doğrudan yapılandırılmamış içerikten türetilmesi, daha geniş LLM verilerinden yararlanılmasını sağlayacaktır. Bilgi grafikleri, hemen hemen tüm LLM uygulamalarını daha akıllı hale getirmek için yapı ve bağlam eklemenin güçlü bir yolunu sağlar.

Yapay Zekanın Geleceği Grafikseldir

LLM’lerin ortaya çıkışı, konuşma verilerine ulaşmak için Graph Intelligence’ın kapsamını genişletiyor. Örneğin, bilgi grafikleri, LLM’lere genişleyen yapılandırılmış bilgi sağlamak, bunların doğruluğunu, alaka düzeyini ve açıklanabilirliğini geliştirmek için esnek bir yöntemdir.

İşletmelerin LLM tabanlı uygulamalar için kullandığı çoğu veri, bilgi grafiğine dönüştürülmek için yeterli yapıya sahiptir. Otomatik grafik oluşturma için LLM’lerin kullanılmasındaki hızlı yenilik, aynı zamanda yapılandırılmamış verilerin kilidini de açacaktır. Tamamlanmamış grafikler bile bağlamsal açıdan yararlı bir zenginleştirme sağlayabilir.

Neo4j gibi şirketlerin kullanılabilirliğe öncelik vermesiyle LLM sorguları kolaylaşmaktadır. Cypher grafik sorgulama dili, grafik geçişlerini optimize ederken SQL’e benzer şekilde çalışır. Erişilebilir veri dönüştürme, depolama ve sorgulama araçlarıyla, kurumsal LLM ve AI uygulamalarını bilgi grafikleriyle güçlendirmeye bugün başlamak çok kolaydır.

Grafikle güçlendirilmiş LLM’ler, ön eğitimi ve çıkarımı birbirine bağlı, esnek bilgilerle geliştirerek yeni pratik fayda seviyelerine ulaşabilir. Dil yeterliliklerini yapılandırılmış gerçek bilgilerle eşleştirmek, yapay zeka uygulamalarının daha geniş bağlamı anlamasını sağlar.

Bilgi grafikleri, kavramları birbirine bağlayarak ve içgörüleri ortaya çıkararak RAG uygulamalarını zenginleştirebilir. Fazla abartmak istemiyorum — bu teknoloji hâlâ gelişiyor. Ancak küçükten başlamaya, verilerinizi keşfetmeye, meta veriler eklemeye, önemli varlıkları ve ilişkileri haritalandırmaya değer. Yapabileceğiniz yüksek değerli bilgiyi kodlayın. Basit grafiklerin bile modellerinizi nasıl güçlendirdiğini görmek için deneyler yapın. Teknoloji geliştikçe aşamalı olarak inşa edin. RAG uygulamanızı bir sonraki seviyeye taşımak için bugün bilginin haritasını çıkarmaya başlayın. Bilgi grafikleri büyük dil modelleriyle birleştikçe gelecekteki olanaklar heyecan vericidir.

Pahalı ve az bulunan Nvidia GPU’larla karşı karşıya kalan yapay zeka ekipleri, LLM yeteneklerine erişimi genişleten alternatifleri benimsiyor. BigDL-LLM, Intel donanımındaki model performansını optimize eden ve yeni AI uygulamalarının kilidini açan açık kaynaklı bir kitaplıktır. Lamini, AMD’nin açık ROCm yazılım yığınından ve Instinct GPU’larından yararlanan yapay zekalı bir süper bilgisayar olan LLM Superstation’ı oluşturmak için AMD ile işbirliği yaptı. Bu sistem, büyük modellerde azaltılmış bilgi işlem yoğunluğuyla verimli bir şekilde ince ayar yapmayı amaçlamaktadır.

Kaynak

[1] Ben Lorica 罗瑞卡, (Nov 2, 2023), Charting the Graphical Roadmap to Smarter AI:

[https://gradientflow.substack.com/p/charting-the-graphical-roadmap-to]

--

--

Cahit Barkin Ozer
Cahit Barkin Ozer

Written by Cahit Barkin Ozer

Üretken YZ başta olmak üzere teknoloji alanındaki yenilikleri öğrenip sizlerle paylaşıyorum. Youtube Kanalım: https://www.youtube.com/@cbarkinozer

No responses yet