Weka, makine öğrenimi amacıyla Waikato Üniversitesinde geliştirilmiş ve "Waikato Environment for Knowledge Analysis" kelimelerinin baş harflerinden oluşmuş yazılımın ismidir. Günümüzde yaygın kullanımı olan çoğu makine öğrenimi algoritmalarını ve metotlarını içermektedir.
Java dilinde geliştirilmiş olması ve kütüphanelerinin .jar dosyaları halinde geliyor olması sayesinde, Java dilinde yazılan projelere kolayce entegre edilebilmesi kullanımını daha da yaygınlaştırmıştır 1.
Yazılım, GNU Genel Kamu Lisansı ile dağıtılmaktadır.
Weka, tamamen modüler bir tasarıma sahip olup, içerdiği özelliklerle veri kümeleri üzerinde görselleştirme, veri analizi, iş zekası uygulamaları, :veri madenciliği gibi işlemler yapabilmektedir.
Weka yazılımı, kendisine özgü olarak bir .arff uzantısı desteği ile gelmektedir. Ancak Weka yazılımının içerisinde CSV dosyalarını da ARFF formatına çevirmeye yarayan araçlar mevcuttur.
Temel olarak aşağıdaki 3 Veri Madenciliği işlemi Weka ile yapılabilir:
Ayrıca yukarıdaki işlemlere ilave olarak, veri kümeleri üzerinde ön ve son işlemler yapılabilir
Son olarak Weka Kütüphanesi'nde veri kümelerini içeren dosyalar üzerinde çalışan çok sayıda hazır fonksiyon bulunmaktadır.
Weka, iş zekası alanında en çok kullanılan 10 yazılımdan birisi olup, yine iş zekası konusunda en çok kullanılan özgür yazılımlar sıralamasında ilk 3 sırada yer almaktadır.2
Weka, 200'e yakın IEEE makalesinde doğrudan geçmekte olup 3 5,700 civarında ACM makalesinde de ismi doğrudan geçmektedir.4
Weka, 2011 Ağustos ayı itibarıyla sadece sourceforge.net sitesinden, 2.5 milyona yakın indirme sayısı ile en çok indirilen ilk 200 Sourceforge Projesi arasında girmiştir.
İngilizce, Attribute Relationship File Format kelimelerinin baş harflerinden oluşmuştur. ARFF dosya yapısı, Weka'ya özel olarak geliştirilmiştir ve dosya, metin yapısında tutulmaktadır. Dosyanın ilk satırında, dosyadaki ilişki tipi (relation) tutulmakta olup ikinci satırdan itibaren veri kümesindeki özellikler (attributes) yazılmaktadır. Özelliklerin hemen ardından veri kümesi yer alır ve veri kümesindeki her satır bir örneğe (instance) işaret etmektedir. Ayrıca veri kümesindeki her örneğin her özelliği arasında da virgül ayıracı kullanılmaktadır.
@relation havatahmini
@attribute nem numeric
@attribute sıcaklık numeric
@attribute basınç numeric
@attribute tahmin numeric
@data
53,25,1013,1
41,22,1011,-1
54,18,1012,-1
67,23,1000,1
Yukarıdaki örnek dosyada, hava tahmini için kullanılan nem, sıcaklık ve basınç değerleri bir dosya içerisinde 4 örnek içerecek şekilde gösterilmiştir. Bu değerler tip olarak sayısal değerler olduğundan "numeric" olarak ifade edilmiştir. Ancak bu değerler aşağıdaki tiplerde olabilir:
Orijinal kaynak: weka. Creative Commons Atıf-BenzerPaylaşım Lisansı ile paylaşılmıştır.
|erişimtarihi=6 Temmuz 2013 |arşivurl=https://web.archive.org/web/20200809011325/https://ieeexplore.ieee.org/search/searchresult.jsp?queryText=weka |arşivtarihi=9 Ağustos 2020 |ölüurl=hayır }} ↩
|erişimtarihi=6 Temmuz 2013 |arşivurl=https://web.archive.org/web/20200809011325/https://ieeexplore.ieee.org/search/searchresult.jsp?queryText=weka |arşivtarihi=9 Ağustos 2020 |ölüurl=hayır }} ↩
Ne Demek sitesindeki bilgiler kullanıcılar vasıtasıyla veya otomatik oluşturulmuştur. Buradaki bilgilerin doğru olduğu garanti edilmez. Düzeltilmesi gereken bilgi olduğunu düşünüyorsanız bizimle iletişime geçiniz. Her türlü görüş, destek ve önerileriniz için iletisim@nedemek.page