Pandade Reindeks

Pandade Reindeks



'Pandas' saame salvestada palju teavet tabeli kujul, mida tuntakse ka kui DataFrame. 'Pandad' hõlbustavad meid DataFrame'i konstrueerimise meetodiga 'DataFrame()'. DataFrame sisaldab indekseid ja me saame muuta ka DataFrame'i indekseid, kasutades 'panda' funktsioone. Meetod, mida me DataFrame'i uuesti indekseerimiseks kasutame, on 'reindex()' meetod. See meetod aitab muuta nii rea indeksi väärtusi kui ka veergude indeksi väärtusi. Seda meetodit kasutades saame muuta DataFrame'i vaikeindeksit, samuti saame muuta DataFrame'i loomisel määratud indeksit. Me kasutame selles õpetuses oma pandanäidetes meetodit 'reindex()' ja selgitame seda mõistet siin põhjalikult.

Näide nr 01

Tööriist 'Spyder' aitab meil selles õpetuses 'pandade' koodi välja töötada ja me alustame oma koodi märksõnaga 'import', mis aitab importida funktsiooni 'pandad'. Pärast sõna 'import' sisestamist asetame 'pandas as pd'. Pärast seda loome DataFrame'i, tippides 'pd.DataFrame()'. Kirjutame siia selle 'pd', kuna 'DataFrame()' on 'panda' meetod. 'value_df' on muutuja nimi, millesse DataFrame salvestatakse. Lisame 'RandomName', mis on veeru nimi, ja 'RandomName' sisaldab 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander ja Samuel'.







Seejärel on meil 'Väärtus_1', kuhu oleme sisestanud '16, 29, 24, 35, 44, 50, 69, 74 ja 88'. Seejärel tuleb 'Väärtus_2' ja oleme lisanud '25, 38, 42, 56, 54, 65, 78, 89 ja 99'. Nüüd tuleb järgmine väärtus 'Väärtus_3' ja me paigutame sellesse '36, 48, 52, 69, 74, 75, 87, 91 ja 69'. Pärast seda on veerg 'Value_4', kuhu oleme sisestanud '52, 64, 72, 88, 82, 95, 97, 21 ja 39'. Viimane veerg on siin veerg 'Value_5' ja sellesse veergu on lisatud väärtused '66, 78, 82, 99, 34, 45, 57, 61 ja 89'. Pärast seda kasutame funktsiooni 'print()', kuhu lisatakse 'Values_df'. See prinditakse terminali.




Pärast klahvikombinatsiooni 'Shift+Enter' vajutamist saame hõlpsasti oma koodide tulemuse rakenduses 'Spyder'. Siin tagastab see kood DataFrame'i vaikeindeksiga. Nüüd rakendame selle DataFrame'i uuesti indekseerimiseks 'pandas' meetodit 'reindex()'.




Funktsiooni 'reindex()' kasutatakse siin rea indeksi väärtuse uuesti indekseerimiseks. Ülaltoodud DataFrame'is näete, et kuvatakse rea indeksi vaikeväärtused ja nüüd rakendame nende reaindeksite uuesti indekseerimiseks meetodit 'reindex()'. Asetame DataFrame'i nime ja seejärel meetodi 'reindex()', millesse asetame need indeksi väärtused, mida tahame ülaltoodud DataFrame'ile lisada. Funktsiooni 'reindex()' paneme 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H ja ind_I'. Seega värskendatakse nende ridade indekseid DataFrame'is selle koodi täitmisel.






Selles tulemuses kuvatakse rea indeksi väärtused ja võite märkida, et DataFrame'i väärtusi siin ei kuvata ja kuvatud on 'NaN' väärtused. Selle põhjuseks on asjaolu, et uued indeksi väärtused ei ühti DataFrame'i eelmiste indeksiväärtustega. Kui uus ja vana indeks ei ühti, kuvatakse seal 'Nan'. Need 'NaN' väärtused kuvatakse vaikimisi indeksi muutmisel ja see ei ühti eelmise indeksiga.



Näide nr 02

Nüüd muudame veeruindeksi väärtusi 'Value_df', mille oleme varem näites 1 loonud. Pärast 'Value_df' printimist panime muutuja 'veerg' ja lisasime sellele mõned väärtused. Lisame 'a_1, b_1, c_1, d_1 ja e_1'. Nüüd tahame neid väärtusi kohandada veergude indeksina, nii et selleks kasutame meetodit 'reindex()' ja asetame muutuja nime 'colum', kuhu uued veeruindeksi väärtused salvestatakse ja määrake ka 'telje' väärtuseks 'veerud', nii et see värskendab veeru telje indeksit. Panime meetodi “reindex()” lahtrisse “print()”, nii et see renderdatakse ka terminalis.


Kuna oleme kasutanud meetodit 'reindex()', värskendatakse esimeses DataFrame'is olevaid veeruindeksi väärtusi ja värskendatud DataFrame'i lisatakse uued väärtused. Samuti võite märkida, et kõik DataFrame'i väärtused teisendatakse 'NaN'-iks, kuna mõlemad veergude indeksi väärtused on erinevad.

Näide nr 03

Selle koodi „Programmimise_andmed” sisaldab „P_Languages”, kuhu oleme lisanud „JavaScript, CSS, Web Engineering, OOP, C#, AI, Java ja JavaScript”. Seejärel on meil 'tunnid', kuhu paigutame '4_h, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs ja 6_hrs'. Pärast seda sisestatakse 'P_Code' ja sisestame '11523, 12423, 12321, 11456, 11454, 12267, 13106 ja 14123'. Lisame muutuja 'p_index' ja paneme 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G ja Pro_H'.

Neid väärtusi kasutatakse ridade indeksiväärtustena. Muudame andmeraamis 'Programming_df' väärtust 'Programming_data'. Lisame sellele DataFrame'ile ka 'p_index', kasutades 'indeksi' meetodit. Panime 'Programming_df' ja seejärel 'index' meetodi ja määrame sellele 'p_index'. Nüüd lisatakse ülaltoodud indeksi väärtused DataFrame'i ridade indeksi väärtustena. Trükime ka 'Programmeerimine_df'.

Pärast seda lisame muutujasse 'new_index' mõned uued indeksi väärtused ja need on 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 ja P_8'. Kuna soovime värskendada ridade indeksi väärtusi, kasutame meetodit 'reindex()' ja selle funktsiooni parameetriks lisame 'new_index' ning salvestame värskendatud DataFrame'i kausta 'newProgramming_df' ja asetame 'newProgramming_df' kausta ' print()” kuvamiseks.


Indeksi väärtusi värskendatakse ja võime ka öelda, et oleme loodud DataFrame'i uuesti indekseerinud. Kõik DataFrame'i väärtused teisendatakse ka 'NaN'-iks, kuna mõlemad indeksi väärtused on erinevad.

Näide # 04

Hetkel muudame veergude “Programming_df’s” indeksi väärtusi, mille oleme varem välja töötanud näites 3. Asetame muutuja “veerg” ja sisestame sellesse uued väärtused. Muutujale 'veerg' lisatakse 'P_Code, P_languages, Hours ja New'. Seejärel kasutame taas meetodit 'reindex()', milles määrame muutuja 'veerg', mis värskendab eelmise veeru indeksi väärtusi ja lisab need uued veeruindeksi väärtused DataFrame'i.

Siin võite märkida, et uued väärtused, mille oleme lisanud veergu, on samad, mis lisasime ülaltoodud DataFrame'i, kuid järjestus on erinev, seega muudab see veergude jada ja kohandab kõiki veerge, nagu me mainitakse muutujas 'veerus'. Lisaks lisame veel ühe indeksi väärtuse, mida ülaltoodud DataFrame'is ei ole, mis on siin 'Uus', nii et selles veerus kuvatakse 'NaN' väärtused.


Siin muudetakse veergude järjestust ja kõik väärtused kuvatakse nii, nagu need on esialgses DataFrame'i veergudes, ja värskendatud DataFrame'i veerg 'New' sisaldab kõiki 'NaN' väärtusi, kuna seda veergu algses DataFrame'is ei ole.

Järeldus

Oleme tutvustanud seda õpetust, mis aitab meil 'pandade uuesti indekseerimise' mõistet üksikasjalikult mõista. Oleme arutanud, kuidas saame DataFrame'i veeru ja rea ​​indeksi väärtusi uuesti indekseerida. Oleme selgitanud, et selleks kasutatakse 'panda' funktsiooni 'reindex()'. Oleme teinud erinevaid näiteid, milles oleme muutnud DataFrame'i ridade indeksi väärtusi ja ka DataFrame'i veeruindeksi indeksi väärtusi. Oleme selles õpetuses renderdanud kõigi siin tehtud koodide tulemused ja selgitanud neid ka põhjalikult.