class

Sınıflandırma (Classification) Nedir? – #1

Bir veri kümesinde bulunan değerlerin sınıflara ayrılmasıdır. Sınıflandırma algoritmaları, eğitim verisi (Training Data) üzerinden öğrenir. Sınıfının belirli olmadığı test verilerini sınıflandırmaya çalışırlar.

Makine Öğrenmesi’nde Model Nedir ?

Input (x) ->  Model (y = f(ax+b)) -> Output (y)

Sınıflandırma Modeli Oluşturma:

Aşağıdaki grafikte görüldüğü gibi farklı veri türlerini birbirinden ayırmak için bu veri türleri arasına sınırlar konulmuştur. Hedef sınıfı diğer sınıflardan ayırt etmek için kullanılır.Amaç hata oranını en aza indirgemektir.

 

Sınıflandırma Modelinin Uygulanması:

Eğitim (Traning)  ve  Test (Testing) Olmak üzere 2 aşamadan oluşur. 

Sınıflandırma konusu daha iyi anlamak için bir örneğe bakalım. Aşağıda sıcaklık, nem ve rüzgar hızı kullanılarak oluşturulmuş hava durumu kümesi olsun:

 

Sıcaklık Nem Rüzgar Hızı Hava Durumu
62 83 5.76 Yağmurlu
79 48 2.7 Güneşli
60 80 3.8 Yağmurlu
57 85 4.2 Yağmurlu
80 46 1.2 Güneşli
85 57 1.5 Güneşli
86 52 0.7 Güneşli
50 92 3.75 Yağmurlu
45 78 5.6 Yağmurlu
77 32 3.28 Güneşli

Yukarıdaki  tabloda bulunan değerlerin ortalamalarını  güneşli  ve yağmurlu havalar için ayrı ayrı alalım.

Hava Durumu Ortalama Sıcaklık Ort. Nem Ort. Rüzgar
Yağmurlu 54.8 83.6 4.622
Güneşli 81.4 47 1.876

Farzedelimki elimizde bir adet test versi var bunun hangi sınıfa ait olduğunu bulmak istiyoruz. Yani hava yağmurlu mu yoksa güneşli mi?

Test_data =(59,85,2.2)

Şimdi tek tek iki nokta arasındaki uzaklık formulunu kullanarak sınıflandırma yapalım

Yağmurlu hava durumu verileri ile hesaplama sqrt( (54.8-59)**2   +  (83.6 – 85)**2  +  (4.622-2.2)) = 4.69

Güneşli hava durumu verileri ile hesaplama sqrt( (81.4-59)**2   +  (47 – 85)**2  +  (1.876-2.2)) = 44.10 

Yukarıdaki hesaplamardan da anlaşılacağı üzere hava durmumuzun yağmurlu olduğunu anlıyoruz.

Bir sonraki yazıda Karar Ağaçları  (Decison Tree) ile sınıflandırma işlemi nasıl yapılır onu göstereceğim?

 

Kaynaklar:

1- Python for Data Science (University of San Diego)

1 Paylaşımlar
Sınıflandırma (Classification) Nedir?
Sınıflandırma (Classification) Nedir?
CSVeri