Pandade summa veerg

Pandade Summa Veerg



'See artikkel näitab, kuidas Pythoni abil Panda DataFrame'i kõiki või teatud veerge summeerida. Funktsiooni DataFrame.sum() kasutatakse koos mõne kasuliku parameetriga selle õpetuse arvukates näidetes.

Kui see õpetus on läbi, võite teada, kuidas:







    • Leidke Pandas andmeraami veeru summa.
    • Andmeraami veergude liitmine
    • Lisage Panda andmeraamile veerud, mis vastavad määratud tingimusele.
    • Määrake summa pärast andmeraami andmete rühmitamist.

Kuidas määrata andmeraami veergude summat?

Funktsioon “dataframe.sum()” Pandases tagastab määratud telje kogusumma. Kui sisend on indeksi telg, lisab funktsioon iga veeru väärtused eraldi ja teeb sama iga veeru puhul, tagastades seeria, mis salvestab iga veeru andmete/väärtuste summa. Lisaks toetab see andmeraami summa arvutamist, ignoreerides puuduvaid väärtusi.



Süntaks: DataFrame.sum(telg = puudub, skipna = puudub, tase = puudub, ainult numbriline_ = puudub, min_count = 0, **kwargs)



kus,





telg: {veerud (1), register (0)}

tellida: Ignoreeri tulemuse arvutamisel NA/null väärtusi.



tase: Kui määratud telg on hierarhiline (mitme indeks), loendage enne seeriaks teisendamist konkreetse indeksi tasemeni.

numeric_only: Lihtsalt float, int ja Boolean veerud on vastuvõetavad. Kui Puudub, proovige kasutada kõike; kui ei, siis ainult arvandmed. Seeria jaoks, pole rakendatud.

min_count: Toimingu lõpuleviimiseks vajalike võimalike väärtuste arv. Tulemuseks on NA, kui mitte-NA väärtusi on vähem kui min_count.

Tagastab: DataFrame (kui tase on määratud) või seeria.

Näide # 01: määrake andmeraami veeru ja kõigi veergude summa

Esmalt oleme nõudnud andmeraami koos kehtivate andmetüüpidega, st int, float jne, veergu või veerud, mille kohta saame andmete summa leida. Andmeraam luuakse funktsiooni pd.DataFrame() abil.


Oleme loonud vajaliku andmeraami pythoni sõnastikust funktsiooni pd.DataFrame() sees. Ülaltoodud andmeraamis on neli veergu 'Nimi', 'day1', 'day2' ja 'day3'. Neljast veerust kolm veergu, st 'day1', 'day2' ja 'day3' on numbrilised veerud andmeväärtustega (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) ja (7, 4, 3, 5, 6, 2, 1, 4) vastavalt. Leiame ainult nende kolme veeru summa. Mõlema seeria (st veeru) ja kogu andmekaadri summa saab määrata summa() meetodi abil. Alustuseks õpetame, kuidas Pandade veerus olevaid andmeid kokku võtta.


Summa määramiseks kasutasime veerus “day2” meetodit summa(). Funktsioon on tagastanud summa väärtuse 28. Sarnaselt sellele võime määrata iga andmeraami veeru summa. See saavutatakse lihtsalt meetodi summa() kasutamisega kogu andmekaadris.


Nagu näha, on veeru “day1” summa 31; “day2” puhul on summa väärtus 28, samas kui veeru “day3” puhul on summa väärtus 32.

Näide # 02: Funktsiooni sum() kasutamine andmeraami veeru väärtuste kokkuvõtmiseks

Nagu eelmise näite väljundist näha, ei tagastanud funktsioon tegelikke andmeraami veeru andmeid, mis moodustasid summa. Kuid määrates DataFrame'i veerule meetodi „DataFrame.sum()”, pääsete juurde DataFrame'i igale veerule, sealhulgas summa veerule. Esiteks loome selle näite jaoks teise andmeraami.


Pd.DataFrame() abil on meie andmeraam loodud. Oleme loonud kolme veeruga andmeraami: artikkel, hind ja maks. Stringiväärtusi sisaldav veeru element ('pliiats', 'marker', 'joonlaud', 'kustutuskumm', 'pliiats', 'lõikelaud', 'klammerdaja', 'nööpnõelad'), väärtusi salvestav veeru hind (20, 15, 10, 3, 5, 30, 35, 10) ja veerg „maks” koosneb väärtustest (8, 5, 3, 3, 4, 10, 5, 2). Nüüd liidame kokku hinna ja maksu veeru väärtused ning salvestame tulemused uude veergu, säilitades algsed andmeraami veerud.


Nagu on märgata koos uue veeruga “kokku”, tagastab funktsioon ka antud andmeraami algsed veerud. Veerus „kokku” salvestatakse veergude „hind” ja „maks” väärtuste summa iga kaubaandmete suhtes.

Näide # 03: Funktsiooni sum() kasutamine määratud andmekaadri veergude summa määramiseks

Andmeraami mitme veeru summeerimiseks saame määrata veergude siltidega loendi ja seejärel rakendada loendis summa leidmiseks meetodit sum(). Sarnaselt eelmiste näidetega loome esmalt andmeraami.


Oleme loonud oma andmeraami nelja veeruga “õpilased”, “märgid1”, “märgid2” ja “märgid3”. Veerg „õpilased” salvestab andmed („Larry”, „James”, „Rob”, „Arya”, „Max”, „Ben”, „Gwen”, „Bill”) ja veerg „marks1” väärtused (8, 9, 6, 8, 10, 7, 9, 9), samas kui veerud “marks2” ja “marks3” salvestavad arvväärtusi (6, 6, 8, 6, 7, 9, 10, 9). ) ja (7, 6, 9, 7, 8, 7, 10, 10) vastavalt.


Esiteks oleme loonud loendiobjekti veergude siltidega “õpilased”, “märgid1” ja “märgid3”. Seejärel rakendatakse loendile meetodit summa(). Funktsioon on summeerinud veergude marks1 ja marks3 väärtused ainult seetõttu, et veerg “õpilased” ei ole numbriline, mistõttu funktsioon sum() ei leia veeru “õpilased” väärtuste summat. Veergude “marks1” ja “marks3” väärtuste summa oleme salvestanud veergu “summa”.

Näide # 04: lisage Panda andmeraami veerud, mis vastavad kindlaksmääratud tingimusele

Selles näites lisame määratud veergude väärtused, kui need vastavad määratud tingimusele.


Värskelt loodud andmeraamis on 5 veergu, st 'ettevõte', 'nädal1_müük', 'nädal2_müük', 'nädal_müük' ja 'filiaalid'. Oletame nüüd, et me ei taha lisada viimase veeru väärtust, kui lisame või leiame antud andmeraami ridade väärtuste summat. Oletame, et tahtsime lihtsalt lisada veergude väärtused, mille siltidesse on sõna „nädal”. Saate luua loendi mõistmise, et teha kindlaks, kas sõna 'nädal' on veerusildis olemas või mitte.


Nüüd oleme toonud veerud, mille siltidel on sõna 'nädal'. Saame sõna 'nädal' sisaldavad veerud kokku võtta, kasutades funktsiooni sum() argumenti axis=1.


Sel viisil saame veergude andmeid turvaliselt ridade kaupa summeerida, lisamata veerge, mida me ei soovi.

Näide # 5: Määrake summa pärast andmeraami andmete rühmitamist

Andmeraami veergude summa leiame ka pärast ühe või mitme veeru andmete rühmitamist. Meetodit groupby() kasutatakse andmete rühmitamiseks veerus kategooriatesse. Loome andmeraami, et saaksime selle ühe veeru andmed rühmitada.


Nüüd rühmitame andmed veerus 'vanus' ja liidame veergude 'score1' ja 'score2' väärtused rühma iga kategooria jaoks.


Näeme, et andmeraamis olevate andmete summeerimine pärast andmeväärtuste esmast rühmitamist vanuse järgi annab veergude kaupa summa, mis sõltub vanuserühmadest.

Järeldus

Selles õpetuses püüdsime teile õpetada, kuidas arvutada Pandase summa meetodit kasutades andmekaadrite summat. Oleme arutanud väärtuste rea- ja veerupõhist lisamist selle postituse näidetes. Lisaks õppisite, kuidas lisada veerge tingimuslikult ja kuidas väärtusi summeerida pärast andmeraami veeru rühmitamist. Nüüd saate andmeraami veerud kokku liita või andmeraami veerus olevad väärtused ise kokku võtta.