Pandad täitke Nan 0-ga

Pandad Taitke Nan 0 Ga



Andmeteadus hõlmab tavaliselt puuduvaid andmeid. Kas tervest reast saab loobuda või lisada rea-veeru kombinatsioonile väärtuse. Rea/veeru mahajätmine oleks absurdne, sest see välistab iga rea ​​jaoks teatud mõõdiku. NaN, mis tähistab 'mitte numbrit', on üks tüüpilisi viise andmekomplektist puuduva väärtuse kuvamiseks. Soovitud tulemuste saavutamiseks on NaN-i käsitlemine üsna oluline. Niisiis, uurime välja, kuidas muuta Panda DataFrame'i rea või veeru NaN väärtused 0-ks.

Pandad täidavad NaN väärtused

Kui teie andmeraami veerus on väärtused NaN või None, saate funktsioonide „fillna()” või „replace()” abil täita need nulliga (0).

täida ()







NA/NaN väärtused täidetakse pakutud lähenemisviisiga, kasutades funktsiooni 'fillna()'. Seda saab kasutada, võttes arvesse järgmist süntaksit:



Kui soovite täita ühe veeru NaN väärtused, on süntaks järgmine:




Kui peate täitma kogu DataFrame'i NaN-i väärtused, on süntaks järgmine:






Asenda ()

NaN väärtuste ühe veeru asendamiseks esitatakse järgmine süntaks:




Arvestades, et kogu DataFrame'i NaN väärtuste asendamiseks peame kasutama järgmist mainitud süntaksit:


Selles kirjatükis uurime nüüd ja õpime mõlema meetodi praktilist rakendamist meie Panda DataFrame'i NaN-väärtuste täitmiseks.

Näide 1: täitke NaN-i väärtused, kasutades Pandase “Fillna()” meetodit

See illustratsioon demonstreerib Panda funktsiooni 'DataFrame.fillna()' rakendamist antud DataFrame'i NaN-väärtuste täitmiseks 0-ga. Võite täita puuduvad väärtused ühes veerus või täita need kogu DataFrame'i jaoks. Siin näeme mõlemat tehnikat.

Nende strateegiate elluviimiseks peame saama programmi täitmiseks sobiva platvormi. Niisiis otsustasime kasutada tööriista 'Spyder'. Alustasime oma Pythoni koodiga, importides programmi 'pandade' tööriistakomplekti, kuna peame kasutama Panda funktsiooni nii DataFrame'i loomiseks kui ka selles DataFrame'is puuduvate väärtuste täitmiseks. Pd-d kasutatakse kogu programmis panda varjunimena.

Nüüd on meil juurdepääs Panda funktsioonidele. Esmalt kasutame selle funktsiooni 'pd.DataFrame()' oma DataFrame'i loomiseks. Kasutasime seda meetodit ja initsialiseerisime selle kolme veeruga. Nende veergude pealkirjad on “M1”, “M2” ja “M3”. Väärtused veerus 'M1' on '1', 'None', '5', '9' ja '3'. M2-s olevad kirjed on 'Puudub', '3', '8', '4' ja '6'. Kui 'M3' salvestab andmed kui '1', '2', '3', '5' ja 'Puudub'. Me vajame DataFrame'i objekti, kuhu saaksime selle DataFrame'i salvestada, kui kutsutakse meetod 'pd.DataFrame()'. Lõime 'puuduva' DataFrame'i objekti ja määrasime selle funktsiooni 'pd.DataFrame()' tulemuse järgi. Seejärel kasutasime Pythoni konsoolis DataFrame'i kuvamiseks Pythoni print() meetodit.


Kui käivitame selle koodilõigu, saab terminalis vaadata kolme veeruga DataFrame'i. Siin näeme, et kõik kolm veergu sisaldavad nullväärtusi.


Lõime mõne nullväärtusega DataFrame'i, et rakendada Pandase funktsiooni 'fillna()', et täita puuduvad väärtused 0-ga. Õppime, kuidas seda teha.

Pärast DataFrame'i kuvamist käivitasime Pandase funktsiooni 'fillna()'. Siin õpime täitma puuduvad väärtused ühes veerus. Selle süntaksit on juba mainitud õpetuse alguses. Andsime DataFrame'i nime ja määrasime konkreetse veeru pealkirja funktsiooniga „.fillna()”. Selle meetodi sulgude vahele andsime väärtuse, mis pannakse nullkohta. DataFrame'i nimi on 'puudub' ja veerg, mille valisime siin, on 'M2'. 'fillna()' sulgude vahel olev väärtus on '0'. Lõpuks kutsusime värskendatud DataFrame'i vaatamiseks funktsiooni 'print()'.


Siin näete, et DataFrame'i veerus M2 ei ole praegu ühtegi puuduvat väärtust, kuna NaN väärtus on täidetud 0-ga.


Terve DataFrame'i NaN-väärtuste täitmiseks sama meetodiga nimetasime 'fillna()'. See on üsna lihtne. Andsime DataFrame'i nime koos funktsiooniga 'fillna()' ja määrasime sulgude vahele funktsiooni väärtuse '0'. Lõpuks näitas funktsioon 'print()' meile täidetud DataFrame'i.


See annab meile ilma NaN-väärtusteta DataFrame'i, kuna kõik väärtused täidetakse nüüd uuesti 0-ga.

Näide 2: täitke NaN-i väärtused, kasutades Pandade 'Replace()' meetodit

Artikli see osa demonstreerib teist meetodit NaN väärtuste täitmiseks DataFrame'is. Väärtuste täitmiseks ühes veerus ja terves DataFrame'is kasutame Pandade funktsiooni 'asendada()'.

Alustame koodi kirjutamist tööriistas 'Spyder'. Esiteks importisime vajalikud teegid. Siin laadisime Pandase teegi, et võimaldada Pythoni programmil kasutada Panda meetodeid. Teine teek, mille laadisime, on NumPy ja selle varjunimega 'np'. NumPy käsitleb puuduvaid andmeid meetodiga „replace()”.

Seejärel genereerisime kolme veeruga DataFrame'i – 'kruvi', 'nael' ja 'puur'. Igas veerus olevad väärtused on antud vastavalt. Veerul 'kruvi' on väärtused '112', '234', 'Puudub' ja '650'. Veerus 'nael' on '123', '145', 'Puudub' ja '711'. Lõpuks on veerus 'drill' väärtused '312', 'Puudub', '500' ja 'Puudub'. DataFrame salvestatakse DataFrame objekti 'tööriist' ja kuvatakse meetodi print() abil.


Andmeraami nelja NaN-väärtusega kirjes on näha järgmisel väljundpildil:


Nüüd kasutame Pandade 'replace()' meetodit, et täita nullväärtused DataFrame'i ühes veerus. Ülesande jaoks kasutasime funktsiooni 'asendada ()'. Andsime DataFrame'i nime 'tööriist' ja veeru 'screw' meetodiga '.replace()'. Selle sulgude vahele määrame DataFrame'i kirjete 'np.nan' jaoks väärtuse '0'. Väljundi kuvamiseks kasutatakse meetodit 'print()'.


Saadud DataFrame näitab meile esimest veergu, kus NaN-kirjed on „kruvi” veerus asendatud 0-ga.


Nüüd õpime täitma väärtusi kogu DataFrame'is. Nimetasime meetodi „replace()” DataFrame'i nimega ja esitasime väärtuse, mille tahame asendada kirjetega np.nan. Lõpuks printisime värskendatud DataFrame'i funktsiooniga 'print()'.


See annab tulemuseks DataFrame'i, millel puuduvad puuduvad kirjed.

Järeldus

DataFrame'i puuduvate kirjetega tegelemine on põhiline ja vajalik nõue, et vähendada andmeanalüüsi keerukust ja käsitleda andmeid trotslikult. Pandas pakub meile mõned võimalused selle probleemiga toimetulemiseks. Oleme selles juhendis toonud kaks käepärast strateegiat. Mõlemad tehnikad rakendame 'Spyder' tööriista abil näidiskoodide täitmiseks, et muuta asjad teile arusaadavaks ja lihtsamaks. Nende funktsioonide tundmine täiustab teie Panda oskusi.