Soru & Cevap

Veri setini test ve train olarak ayırdığımızda indexler aynı ...

30.08.2021 - 12:12

Ayrışan bu setlerin indexlerini sıfırlamamız için nasıl bir yöntem kullanabiliriz?  

Örneğin,  X_train verisinin indexleri 7,12,25,32... olarak devam ediyor. Bu veriyi yeni 

29 Görüntülenme

3 Cevap

Sitedeki sorulara cevap verebilmek için giriş yapın ya da üye olun.

Profile picture for user murad9949
murad9949
27.09.2021 - 02:38

Dataframe için set_index fonksiyonunu kullanabilirsiniz.

Train için:

X_train.set_index(range(len(X_train)))

Test için: 

X_test.set_index(range(len(X_test)))

picture-270049-1576530203.png
agraliozgur
06.09.2021 - 09:36

Belki snaa yardımcı olabilir.

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.reset_index.html

picture-305174-1599755814.png
serkankarakusdr
30.08.2021 - 08:12

Veri setini eğer kendi algoritmanizla ayırma işlemi yapamayacaksaniz size scikit-learn.org kütüphanesinin model selection modülü çok yardımcı olacaktır.

Aldığı parametleri incelerseniz hem random_state ile hemde shuffle ile indexleri çok rahat tekrar manipule etme işlemini gerçekleştirebilirsiniz. Dokümantasyon için aşağıya linki bırakıyorum

https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html