Soru & Cevap

Veri OkurYazarlığı eğitiminde Veri Tanımlama Örneği Hk.

02.11.2020 - 10:51

"Veri OkurYazarlığı" eğitiminin "Veri Tanımlama" bölümünün son sayfasındaki örnek senaryoda %64.ve %44.6 gibi oranlarda cinsiyet bilgisi girilmiş.  Bu bile verilen istatistiki bilgileri baştan güvensiz kılmakta. Zira yaklaşık 10% luk bir kısım hem erkek hem kadın olma olasılığını mümkün kılıyor. Bu tarz bir örneğe gerçek hayatta karşılaşırsak nasıl yorumlamamız gerekiyor?

2 Cevap

Sitedeki sorulara cevap verebilmek için giriş yapın ya da üye olun.

picture-311890-1603830998.png
bahadiru72
04.11.2020 - 03:08

Öncelikle ilginiz ve yorumunuz için teşekkürler, 

İşin gerçeği eğitim sırasında yapılmış bir hata olduğunda hemfikirim. Ancak eğitim materyalinde özellikle veri bilimi ve istatistik söz konusu olduğunda bu tarz bir hata kabul edilemez. Bu eğitimler yayınlanma öncesi test edilip denetlenmesi gerekir. Öyle ki eğitmen eğitim metninde senaryoyu okuyup değerlendirilmesini üstüne basa basa dile getirmekte. 

Gerçek hayatta bu senaryo gündeme geldiği taktirde verinin en başta güvensiz olduğu algısı kaçınılmazdır. 

Bu sadece veri bilimi ve istatistikte değil, bilişimin tüm alanlarında geçerlidir. Örneğimizdeki ufak hata olarak değerlendirdiğimiz konuyu bir web projesinde ya da bilişim güvenliğinde yapıldığını varsayalım her şekilde insan Kevin Mitnick'in de dediği gibi en zayıf halkadır. Yazılım projelerinde söz konusu olan SDLC (Software Development Life Cycle) projelerde TEST olgusunun önemini her geçen gün arttırmaktadır.

picture-301075-1597229685.png
fatihafsin
04.11.2020 - 02:48

Sanırım eğitim sırasında yapılan küçük bir hataya benziyor. Gerçek hayatta ise böyle bir problem ile karşılaşmamız halinde veriyi hazırlayan kişiler ile görüşülüp olayın içeriğini ve detay bilgi almalıyız veya veri setinden verileri silme işlemini gerçekleştirebiliriz. Tabi veriyi silme işlemi ne kadar sağlıklı olacağı tartışılır fakat elimizde büyük bir veri varsa ve veri setini homojen dağıtmak istiyor isek , veri setinin detaylarına bağlı olarak veriyi düzenlemek güzel bir yöntem olabilir.