Unikaalne Panda andmeraam

Unikaalne Panda Andmeraam



Kõige populaarsemat Pythoni raamatukogu, mida andmeteaduses kasutatakse, nimetatakse Pandadeks. See pakub Pythoni programmeerijatele suure jõudlusega, kasutajasõbralikke ja andmeanalüüsi tööriistu. Kui olete aru saanud põhifunktsioonidest ja nende kasutamisest, on Pandas võimas tööriist andmete muutmiseks. Pandades on andmete tabelina salvestamise standardmeetodid DataFrames. Saame kasutada mõnda 'panda' meetodit unikaalsete väärtuste hankimiseks DataFrame'i veerus 'pandas'. Kui meil on vaja DataFrame'i veergudes saada kordumatuid väärtusi ja me ei soovi väärtuste dubleerimist DataFrame'i veerus 'pandad', saame kasutada 'panda' poolt selleks ette nähtud meetodeid. Vaatame selles juhendis selliseid meetodeid koos mõne näite ja väljundiga, et saada DataFrame'i pandade veerus ainulaadsed väärtused.

Unikaalsete väärtuste hankimise meetodid DataFrame'i veergudes 'pandad'.

Saame kasutada kahte meetodit unikaalsete väärtuste hankimiseks DataFrame'i 'panda' veergudes. Loobume dubleerivad väärtused ja saame DataFramesi veergudesse ainult kordumatud väärtused. Pandad selle ülesande täitmiseks pakuvad:







  • Kasutades ainulaadset () meetodit.
  • Kasutades meetodit drop_dupliactes().

Nüüd kasutame pandade koodides mõlemat meetodit unikaalsete väärtuste hankimiseks DataFrame'i pandade veergudes.



Näide nr 01

Rakendust 'Spyder' kasutatakse siin nende 'pandade' koodide genereerimiseks, et kasutada meetodeid, mis aitavad meil saada unikaalseid väärtusi 'panda' DataFrame'i veergudes. Enne DataFrame'i loomist peame importima moodulid 'panda', mis on 'panda' koodi jaoks vajalikud. Kasutades terminit 'import' ja asetades 'pandad pd-na', impordime need moodulid.



Nüüd saame 'pd' abil kiiresti hankida 'panda' funktsioonid või meetodid. Seejärel lisame 'Subject_data', kuhu lisame 'Nimi' ja 'Nimi', lisame nime andmed, milleks on 'Roman, William, Peter, Smith, John, Milli, Thomas ja James'. Seejärel lisame jaotisesse 'Subj' aineandmed, milleks on 'Matemaatika, majandus, loodusteadused, matemaatika, statistika, statistika, statistika ja arvuti'. Seejärel teisendame selle 'Subject_data' meetodi 'pd.DataFrame()' abil 'Subject_df' DataFrame'iks. Asetame 'Subject_df' meetodisse 'print()', nii et see kuvatakse terminalis.





Nüüd tahame saada ainulaadsed väärtused DataFrame'i 'panda' veerus 'Subj'. Selleks kasutame siin meetodit 'unikaalne()' ja lisame veeru nime ja ka DataFrame'i nime, nagu allpool näidatud. Lisame selle meetodi väljale 'print()', nii et tulemus kuvatakse ka terminalis.



Nüüd vajutame selle koodi tulemuse saamiseks klahvikombinatsiooni Shift+Enter ja see renderdub terminalis ja on ka siin näidatud, mis sisaldab DataFrame'i kõigi väärtustega. See on algne DataFrame, mille oleme koodi lisanud ja selle all kuvatakse veeru „Subj” kordumatud väärtused. See loobub duplikaatväärtustest ja kuvab DataFrame'i veeru „Subj” kordumatud väärtused.

Näide nr 02

Loome 'Sample_list', mis sisaldab teatud teavet. Sisestame 'Layla, 21, 28, 31, 14 ja 39', mis kuvatakse esimese veeruna, kui teisendame selle loendi DataFrame'iks. Seejärel lisame DataFrame'i teise reana 'Lusy, 31, 25, 34, 26 ja 21'. Pärast seda on meil 'Peeter, 38, 20, 20, 35 ja 24' ja 'Layla 38, 23, 39 24, 23', mis on DataFrame'i kolmas ja neljas rida. Sisestame ka veel kolm andmeid, milleks on 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' ja ka 'Peeter, 21, 21, 31, 21, 29' .

Nüüd teisendame 'Sample_list' 'DF_Sample'-ks, mis on siin DataFrame'i nimi, lisades funktsiooni 'pd.DataFrame()'. Samuti määrame selle DataFrame'i veergude nimed ja need nimed on 'Nimi, Ass_1, Ass_2, Ass_3, Ass_4 ja Ass_5'. Seejärel kasutame 'print()', mis aitab kuvada DataFrame'i 'DF_Sample'. Nüüd kasutame selles näites teist meetodit unikaalsete väärtuste hankimiseks DataFrame'i veerus. See meetod on 'panda' meetod 'drop_duplicates()'.

Meetodis 'drop_duplicates()' määrame veeru nime, kust tahame DataFrame'i veerus kordumatuid väärtusi hankida. Saame veeru „Nimi” kordumatud väärtused, kui kukutame sellesse veergu duplikaatväärtused meetodi „drop_duplicates()” abil ja renderdame need kordumatud väärtused ka siin funktsiooni „print()” abil.

Dubleeritud nimed tühistatakse ja kordumatud väärtused renderdatakse pärast meetodi „drop_duplicates()” rakendamist. Pange tähele, et nimi „Layla” kuvatakse veeru „Nimi” kolmes lahtris. Kuid kui sellele veerule rakendatakse meetodit 'drop_duplicates()', jäetakse kõik duplikaatväärtused välja ja ekraanile ilmub üks 'Layla' nimi. Pärast duplikaatväärtuste eemaldamist ilmus uus DataFrame, mis sisaldab unikaalseid väärtusi selles veerus „Nimi”. Nii saame duplikaatväärtustest loobuda ja meetodi 'drop_duplicates()' abil saada DataFrame'i veerus kordumatu väärtuse.

Näide # 03

Sama DataFrame'i kasutatakse uuesti ja nüüd rakendame siin meetodit 'unikaalne()'. Meetodiga 'unikaalne ()' asetame veeru nime ja ka DataFrame'i nime, millele soovime unikaalsete väärtuste saamiseks seda 'unique()' meetodit rakendada. See renderdab ainult selle veeru kordumatud väärtused ja ei näita neid väärtusi DataFrame'i kujul.

Siin sisaldab DataFrame veerus „Nimi” seitset väärtust, kuid kui rakendame sellele veerule meetodit „unique()”, on ilmunud ainult neli väärtust ja need on selle veeru kordumatud väärtused. See ei renderda dubleerivaid väärtusi.

Näide # 04

Andmeraam, mille selles näites loome, on 'F_G_df'. Sisestame sellesse andmeraami 'My_fruits' ja 'my_Vegs'. Veerg 'Minu_puuviljad' sisaldab 'Õun, apelsin, õun, pirn, litši, õun, õun, pirn ja õun'. Järgmisena on meil 'My_Vegs', mis sisaldab köögiviljade nimetusi, milleks on 'tšilli, bringle, porgand, kartul, kartul, porgand, sibul, küüslauk ja ingver'. See DataFrame sisaldab ainult kahte veergu.

Nüüd saame unikaalsed väärtused mõlemas veerus meetodi „unikaalne()” abil. Mainime DataFrame'i nime. Seejärel sisestage veeru esimese veeru nimi. Pärast seda kasutame meetodit append(). Sellesse lisasse asetame uuesti DataFrame'i nime ja teise veeru nime ning asetame meetodi 'unikaalne ()'. See hangib mõlema veeru kordumatud väärtused ja lisab seejärel mõlema veeru kordumatud väärtused ja kuvab need ekraanil.

Kõigepealt renderdatakse DataFrame, mis sisaldab kõiki väärtusi. Pärast seda rakendatakse meetodit 'unikaalne()' ja mõlema veeru kordumatud väärtused renderdatakse allpool. Selles koodis saame unikaalsed väärtused DataFrame'i mitmes veerus, kasutades meetodit 'unique()'.

Järeldus

Täieliku selgituse DataFrame'i veerus ainulaadsete väärtuste hankimise kohta leiate sellest juhendist. Oleme arutanud meetodeid 'unique ()' ja 'drop_duplicates ()', mis aitavad meil saada DataFrame'i veeru kordumatuid väärtusi. Oleme uurinud, kuidas neid meetodeid 'panda' koodis kasutada, kasutades neid meetodeid siin oma koodides. Oleme selles juhendis illustreerinud erinevaid näiteid ja näidanud, kuidas hankida ühe veeru kordumatuid väärtusi, kasutades meetodit „unique()” ja meetodit „drop_duplicates()”. Samuti oleme uurinud, kuidas saada kordumatuid väärtusi mitmesse veergu, kasutades selles juhendis meetodit „unikaalne()”.