veri türü

Veri Türleri Nümerik, Kategorik, Ordinal ML #1

Eğer veri bilimiyle uğraşıyorsanız her veride farklı nüanslar olduğundan hangi tür veri ile uğraştığınızı bilmeniz gerekiyor. Veri türleri temelde 3’e ayrılır.

1-Numerical data

En yaygın olarak kullanılan veri türüdür. Temel olarak ölçülebilir şeyleri temsil eder. İnsanların boyları, sensörlerden gelen değerler, 1 kitaptaki sayfa sayısı vs. Numerik veri tipide kendi içinde 2’ye ayrılır. Discrite ve Continuous.

  • Discrete:

    Bu veri türü integer (tam sayı) tiptedir. Örneğin, bir kişi bir kafe ye gittiğin 2 barda 3 bardak çay içebilir fakat 2,23 bardak çay içemez. Bu tür veri tipi integer kısıtlamalıdır.

  • Continuous:

    Discrete veri tipinin aksine integer tabanlı değillerdir. Örneğin bir kişinin boyu 1.775 cm olabilir.Bu yüzden sonsuz sayı üretilebilir.

2-Categorical Data

Numeric olarak herhangi bir anlam teşkil etmez. Cinsiyet, evet/hayır sorularına verilen cevaplar, ülke isimleri, kategori isimleri olarak vs. kategorik türde verilerdir. Örneğin; İstanbul’ un plakası 34; Ankara 06 . Bu demek değildir ki  Ankara İstanbul’dan üstündür. Sadece plakası alfabetik sıraya göre daha önde gelmektedir.  Sonuç olarak bu veri türleri numerik olarak ölçülemez.

3- Ordinal Data

Bu veri türleri, veri setinde kategorik olarak gözükebilir. Örneğin insanların boyları, kiloları, cinsiyetleri ve giydikleri kazağın bedenini gösteren bir veri setiniz olsun.  Beden kategoriside XS’ ten XL’ a kadar bir aralıkta olsun. Veri kategorik gözükmesine karşın aslında matematiksel bir bağıntı içerisindedir.

XL = L+1 =M+2= S+3 =XS+4

Bu durumda biz XS’ e bir dersek diğer değerleride numerik olarak değiştirmiş oluruz.

0 Paylaşımlar
Veri Türleri ML Nümerik, Kategorik, Ordinal #1
Veri Türleri ML Nümerik, Kategorik, Ordinal #1
Eğer veri bilimiyle uğraşıyorsanız her veride farklı nüanslar olduğundan hangi tür veri ile uğraştığınızı bilmeniz gerekiyor.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir