Teknoloji & Yapay Zeka
Büyük dil modellerini eğitmenin yeni yolu: TLoRA+ ile daha verimli yapay zeka
Araştırmacılar, büyük dil modellerinin belirli görevler için eğitimini daha verimli hale getiren TLoRA+ adlı yeni bir yöntem geliştirdi. Bu teknik, modellerin performansını artırırken hesaplama maliyetini minimum düzeyde tutuyor. ChatGPT ve benzeri büyük dil modellerinin özelleştirilmesi için kullanılan mevcut LoRA yöntemini geliştiren bu yaklaşım, daha az kaynak kullanarak daha iyi sonuçlar elde etmeyi mümkün kılıyor. GLUE benchmark testlerinde yapılan denemeler, yöntemin farklı model mimarilerinde tutarlı bir şekilde başarılı olduğunu gösterdi. Bu gelişme, yapay zeka modellerinin daha geniş kitlelere ve küçük şirketlere açılması açısından önemli bir adım olarak değerlendiriliyor.