Türkçe boşluğu
Global benchmark'ların büyük çoğunluğu İngilizce. Türkçe halüsinasyon, tarafsızlık ve akıl yürütme performansı sistematik olarak ölçülmüyor.
LLMTurkey Network, Türkiye'nin yapay zekâ değerlendirme topluluğudur. Aramıza katılın.
Binlerce kurum yapay zekâyı operasyona alıyor — ama hangi modelin Türkçe'de doğru, güvenli ve tutarlı çalıştığı bağımsız bir kaynaktan ölçülmüyor.
Global benchmark'ların büyük çoğunluğu İngilizce. Türkçe halüsinasyon, tarafsızlık ve akıl yürütme performansı sistematik olarak ölçülmüyor.
Model sağlayıcılarının kendi yayınladığı skorlar bağımsız değil. Kurumlar üreticiye değil, üçüncü tarafa güvenmek istiyor.
Bir model üretime alındıktan sonra Türkçe'de nasıl davrandığını sürekli ölçecek altyapı çoğu kurumda yok.
Önümüzdeki üç yılda Türkçe yapay zekânın bağımsız ölçüm referansı olmayı; akademi, sanayi ve kamu için ortak bir değerlendirme dili kurmayı hedefliyoruz.
Sağlayıcıdan, projeden ve siyasetten bağımsız, sürekli güncellenen Türkçe odaklı skor tabloları.
Kurumların kendi modellerini sürekli ölçebileceği, üretime entegre edilebilen değerlendirme operasyonları.
Türkçe LLM güvenliği, tarafsızlığı ve dayanıklılığı üzerine açık raporlar üreten araştırma ağı.
Ağa katılanlar bu çıktıların altında ismiyle yer alır — manifestoyla değil, ölçümle anılırız.
Üç ayda bir güncellenen, 8 parametrede 12 senaryoyla ölçülmüş açık leaderboard.
Banka, kamu, sağlık ve eğitim alanlarında özelleşmiş değerlendirme raporları.
Kurumların kendi içinde ölçüm hattı kurması için açık metodoloji ve şablon kitleri.
Topluluk tarafından genişletilen, GitHub'da yayınlanan Türkçe değerlendirme senaryoları.
Türkiye'de yapay zekâ değerlendirme kültürünü şekillendirecek seçilmiş akademisyenler, araştırmacılar ve sektör liderlerinden oluşan uzman ağı.
Network sembolik bir aidiyet değil — açık projelerimizde gerçek katkı arıyoruz. Aşağıdaki rollere uyduğunuzu düşünüyorsanız başvurunuz öncelik sırasına girer.
Bias & Fairness ve Truthfulness senaryolarının Türkçe veri setlerini genişletmek için.
Sürekli benchmark hattının altyapısını kurmak ve API entegrasyonlarını yönetmek için.
Sektörel senaryoların gerçek hayata uygunluğunu denetlemek için.
Etkinlikler, açık çağrılar ve partner iletişimini yürütmek için.
AI değerlendirme, benchmark mantığı ve EvalOps alanında kendini geliştirmek isteyenler.
Benchmark, AI güvenliği, etik ve model değerlendirme araştırmalarına katkı sunmak isteyenler.
Yapay zekâyı iş süreçlerinde kullanan veya bu alanda uzmanlaşmak isteyenler.
Kurumlarında güvenilir AI dönüşümüne yön vermek isteyen yöneticiler.
Üniversiteler, şirketler, teknoloji girişimleri ve topluluklar.
12 haftalık EvalOps Specialist programı + canlı projelerde uygulama.
Judex'te yayınlanan değerlendirme çalışmalarına katkı; sonuçlar isminizle anılır.
Banka, kamu ve teknoloji şirketlerinin değerlendirme projelerinde sahada deneyim.
Türkçe LLM güvenliği ve tarafsızlığı üzerine çalışan araştırmacılarla doğrudan iş birliği.
Partner kurumların iş ve danışmanlık ilanlarına Network'e özel referans hattı.
Aylık kapalı oturumlar, founding üyelere erişim, partner kurumlarla tanışma.
Yapay zekâ değerlendirme alanındaki en güncel konuları küçük ve odaklı gruplarla ele alıyoruz.
Akademi, sanayi ve toplulukla kurduğumuz uzun soluklu iş birlikleri, LLMTurkey Network'ün omurgasını oluşturur.
Üniversiteler, araştırma merkezleri ve enstitüler için ortak benchmark çalışmaları, yayın ve müfredat iş birlikleri.
Model sağlayıcıları, altyapı şirketleri ve AI girişimleriyle entegrasyon ve değerlendirme ortaklıkları.
AI dönüşümünü ölçülebilir kılmak isteyen kurumlar için özel benchmark ve EvalOps programları.
Topluluklar, dernekler ve etkinlikler için ortak içerik, etkinlik ve görünürlük iş birlikleri.