Geleceği Yazanlar

Python Kütüphanesi: Pandas Kolon ve Satır Sorgulama

Önceki yazımızda pandas kütüphanesine basit bir giriş yaparak küçük bir veri setinin yüklenmesi ve temel fonksiyonlar ile izlenmesini göstermiştik. Bu yazıya başlamadan önce de pandas kütüphanesinin aslında yine Python’ın “numpy” kütüphanesi üzerine geliştirildiğini ve veri işlemlerini daha kolay ele alabilmeyi sağladığını söylemek isterim. Bu yazımızda tanımladığımız veri setinin üzerind...

Zehra Can |

19.12.2019

Önceki yazımızda pandas kütüphanesine basit bir giriş yaparak küçük bir veri setinin yüklenmesi ve temel fonksiyonlar ile izlenmesini göstermiştik. Bu yazıya başlamadan önce de pandas kütüphanesinin aslında yine Python’ın “numpy” kütüphanesi üzerine geliştirildiğini ve veri işlemlerini daha kolay ele alabilmeyi sağladığını söylemek isterim. 

Bu yazımızda tanımladığımız veri setinin üzerinde bir takım sorgulama işlemleri yapacağız. Bunlar nedir;

  • Satırları filtrelemek
  • Kolon seçmek

Daha önceki yazıda yapılan yükleme işlemlerini bu yazıda tekrar etmeyeceğim. Önceki yazımı referans alabilirsiniz. Verileri yükleme adımından sonra aşağıdaki komut ile verinizin kolon ve satır sayısını görebilirsiniz. 

Buna göre satır sayımız 5, kolon sayımız 6 diyebiliriz. Verilerin satırlarına ve kolonlarına erişmek için de index ve columns özellikleri kullanılır.

Buna göre satır indexlerinin 0 dan başlayıp 5’te bittiğini ve 1’er adım ile ilerlediğini yorumlayabiliriz. Ulaşmak istediğimiz satıra index numarası ile ulaşabiliriz. Aşağıda bunun için örnek bir kod satırı bulabilirsiniz. Buna göre 1 dâhil, 3 hariç olmak üzere 1 ve 2. Veri satırlarını listelemiş olursunuz.

iloc fonksiyonunda ilk parametreyi vermezseniz ilk kayıttan itibaren tüm satırları alır (veri.iloc[:3]) gibi, ikinci parametreyi vermezseniz (veri.iloc[2:]) sonuna kadar olan verileri alır. Bu fonksiyonu model çalışmalarınızda eğitim ve kontrol veri setlerinizi gerektiği durumlarda ayırma işlemleri için kullanabilirsiniz. Örneğin eğitim ve kontrol setlerinizi de eksik verileri tamamlamak istiyorsunuz. Her iki setinizi birleştirip bu veri temizliği işlemlerinizi yaptıktan sonra bu fonksiyon ile tekrar veri setlerinizi ikiye ayırabilirsiniz. Tabii bu durumlarda veri setlerinin indexlerini değiştirmeden işlem yapmak gerekiyor. Aksi halde verilerinizin satırları kayabilir bu durumda modeliniz doğru sonuçlar üretmez. 

iloc fonksiyonu dizi de kabul etmektedir. Buna göre seçmek istediğiniz satırları aşağıdaki gibi tek tek dizi içerisinde de de verebilirsiniz.

Yukarıdaki çıktı ile veri setinizin 1,3 ve 4.satırlarına erişmiş olursunuz. Burada dikkat edilmesi gereken indexlemenin 0’dan başladığını unutmamak gerekir. iloc fonksiyonuyla kolonlarınızı da seçebilirsiniz. Bunun için komut aşağıdaki gibi kullanılmalıdır.

 

Yukarıdaki komuta göre 1. ve 2. satırlar, 2. ve 3. kolonlar sonuç olarak gelir. 

Indexleri update de edebiliriz. İstediğimiz kolon üzerinden indexleme yapabilir ve buna göre verilere ulaşabiliriz. Buna da diğer yazımda devam edeceğim.

Kaynak dosyalar buraya tıklayarak erişebilirsiniz. 

 

 


 

 

 

 


 

 

 

Zehra Can |

19.12.2019

Yorumlar

Umut Günel
18.02.2020 - 10:40

Bilgilendirici bir içerik tebrik ederim başarılar.

Koray Bilge
24.12.2019 - 04:13

Teşekkürler bilgilendirici bir içerik olmuş :)

Geleceği Yazanlar Kullanıcısı
27.12.2019 - 04:50

güzel paylaşım

Mehmet Ali Çakmak
12.01.2021 - 03:30
  1. Güzel paylaşım 
Mehmet Ali Çakmak
12.01.2021 - 03:32

Ama keşke resim ler küçük olsaymis çünkü telefondan giriş yapan arkadaşlar görüntüyü tam almak için buyuttuklerinde site 'nın görünümü kötüleşiyor 

İRFAN YAKUT
18.03.2022 - 10:06

Teşekkürler

Mertkan Akay
26.10.2022 - 10:51

Teşekkürler 

nursel akkaş
11.11.2022 - 11:25

Teşekkürler

Ebru Karacan
27.11.2022 - 11:21

Teşekkür ederiz.

ALİCAN BAŞOĞLU
06.01.2023 - 12:19

teşekkürler

Berfu Deniz Kara
14.12.2024 - 04:58

Emeğiniz için teşekkürler.