"One-hot encoding" tekniğinin amacı, diğer tekniklerde olduğu gibi "string" veri tipinde olan etiketleri sayısal ifadelere çevirmektir. Başka bir ifadeyle, bilgisayarların anlayabileceği matematiksel ifadelere dönüştürmektir. Tahmin edebileceğin gibi matematik bilgisayarların kullandığı dildir.
Kategorik etiketleri temel olarak "sıralı" ve "sırasız" olarak iki ana alt başlığa ayırabiliriz. Örneğin, "kırmızı", "yeşil", "mavi" gibi etiketlerin birbiriyle herhangi bir sıralama ilişkisi yoktur. Fakat diyelim ki elimizde "az kilolu", "çok kilolu", "aşırı kilolu" gibi etiketler olsun. Bu durumda bahsi geçen etiketler arasında sıralılık özelliği vardır. Örneğin, "az kilolu" demek 65kg'a kadar olan kiloları temsil ediyorsa, "çok kilolu" biri kesinlikle 65kg'dan fazladır, vb. Eğer "one-hot encoding" tekniğini uygulamazsak, "integer encoding" ile etiketleri 1, 2, 3 vb. gibi ardışık sayılara çevirirsek, modelimiz istemediğimiz bir yanlılığa (=bias) sahip olabilir. Ayrıca girdi verilerini modeli uygun bir şekilde eğitebilmek için belirli bir standarta sokman gerektiği gibi, çıktıda da benzer bir standartlaştırmayı yapman gerekmektedir. Yukarıda bahsettiğim sebeplerden dolayı "one-hot encoding" tekniğini kullanmak gereklidir.
Anladım 2 sinide denedim iki model arasında 0.05 gibi bir acc farkı var yani one-hot az da olsa fayda sağlamış. Tabi binary ile mulit class'ı sadece acc ile karşılaştırmak ne kadar mantıklı.
Anladım 2 sinide denedim iki model arasında 0.05 gibi bir acc farkı var yani one-hot az da olsa fayda sağlamış. Tabi binary ile mulit class'ı sadece acc ile karşılaştırmak ne kadar mantıklı.
iki model kurup test ettim on-hot lı model 0.05 acc daha başarılı çıktı. Bu noktada sadece acc ye bakarak kıyaslamak ne kadar mantıklı bilmiyorum.
iki model kurup test ettim on-hot lı model 0.05 acc daha başarılı çıktı. Bu noktada sadece acc ye bakarak kıyaslamak ne kadar mantıklı bilmiyorum.