imageedit_66_5307556074

Makine Öğrenmesi Nedir? – ML#1

Son zamanlarda adını sıklıkla duyduğumuz Makine Öğrenmesi, Bir takım analiz algoritmaların tasarımını ve gelişimini konu edinen bilim dalıdır. Bu algoritmaları kullanarak veriden anlamlı sonuçlar çıkarmaya yarar. Büyük miktardaki verinin el ile analiz edilmesi mümkün değildir. Amacımız elimizde var olan veriden yararlanarak gelecek için anlamlı tahminlerde bulunmaktır. Eski veriyi kullanarak en iyi modeli bulmaya çalışır.

Uygulama Alanları:

Makine öğreniminin başlıca uygulamaları makine algılamasıbilgisayarlı görmedoğal dil işlemesözdizimsel örüntü tanımaarama motorlarıtıbbi tanıbiyoinformatikbeyin-makine arayüzleri ve kiminformatikkredi kartı dolandırıcılığı denetimi, borsa çözümlemesi, DNA dizilerinin sınıflandırılması, konuşma ve elyazısı tanıma, bilgisayarlı görmede nesne tanımaoyun oynamayazılım mühendisliğiuyarlamalı web siteleri ve robot gezisidir.

Terminolojiler:

Gözlemler (Samples,Row,Instance,Observation,Record,Example): Öğrenmek için kullanılan veri parçasına denir. Örneğin; Kredi Kartı Bilgileri

 

Özellikler (Variable,Features,Attribute,Field,Column,Dimension): Gözlemi temsil eden verinin değerleridir. Örneğin; Kart üzerindeki isim, kartın numarası, geçerlilik tarihi, cvv kodu.

 

Etiketler (Labels): Gözlemler sonuçu ortaya çıkan kategoriler. Örn: fraud (sahtekarlık), not-fraud

 

Eğitim Verisi (Training Data): Gözlemlerden oluşan diziler, algoritmaya öğrenmesi için gönderilir. Algoritma bu veri dizisinden çıkarımlarda bulunur ve bir model oluşturur. Fraud ya da not Fraud diye etiketler oluşturur.

 

Test Verisi (Test Data): Elde ettiğimiz modelin gerçek değerlere ne kadar yakın olduğunu saptamak için kullanılan test verileridir. Eğitim sırasında algoritma test verilerini görmez .Eğitim verilerinde ürettiği çıkarımı test verileri üzerinde kullanır. Aslında burada sistemin ne kadar başarı sağladığı saptanır.

Öğrenme Türleri:

Gözetimli(Supervised):

Eğitim verileri algoritmaya gönderildikten sonra etiketlenir.Böylece hangi girdi için hangi çıktıyı alacağımızı öğrenmiş oluruz. Bu öğrenme türüne Gözetimli Öğrenme (Supervised Learning)  diyoruz.

Mesela son zamanlarda insan olup olmadığınızı anlamak için resimdeki binaları vs. işaretlememiz isteniyor.Eğer böyle bir sistem tasarlamak istiyorsak ilk önce farklı bina tiplerni bulup bunları bina şeklinde işaretlelmiz aksi durumlaruıda tam tersi  olarak işaretlememiz gerekiyor. Bu da gözetimli (supervised) öğrenme tipi oluyor. Bu öğrenme türü de kendi arasında sınıflandırma (classification) ve regresyon (regression) olmak üzere ikiye ayrılıyor.

Sınıflandırma (Classification): Amaç kategoriyi tahmin etmektir.Örneğin; Ferrari pahalı araçlar sınıfına aitken, renault clio ucuz araçlar sınıfındadır. 

Regresyon (Regression): Regresyonda amaç sayısal bir değeri tahmin etmektir. Örneğin Ferrari 430Spider 2010 model 15.000 km’ de  250.000$ civarı olmalıdır

Gözetimsiz(Unsupervised):

Etiketsiz verilerle algoritmanın öğrenmesidir. Algoritmanın kendi kendine ilişki kurar ve, bilinmeyen yapıları keşfetmesi beklenir.

Kümeleme (Clustering): Benzer özelliklerdeki verileri bir grupta toplar. Örneğin; Senior,Junior Yazılım Mühendislerini iki ayrı grupta toplar. Homojen bir dağılım yapar.

İlişki Analizi (Association Analysis): Öğeler arasında ilişkiler yakalamak için kurallar bulur. Örneğin, bir e-commerce sitesinden alışveriş yaparken, bu ürüne alanlar bunlara da baktı şeklinde ilişkilendirme yapar.

Makine Öğrenmesi Nedir?
Makine Öğrenmesi Nedir?
CSVeri