Panda liitumine vs ühinemine

Panda Liitumine Vs Uhinemine



'Pandas' on suure jõudlusega tööriist pythoni keskkonna jaoks. See on 'avatud' lähtekood andmete analüüsimiseks. Pandade ühendamise ja pandade liitmise meetodit kasutatakse kahe andmekaadri ühendamiseks üheks andmekaadriks. Mõlema pandameetodi puhul on erinevus selles, et pandade liitumisfunktsioon ühendab andmeraami indeksi abil. Pandade ühendamise funktsioon ühendab andmeraami indeksi ja veerumeetodi abil, mille abil saame ise soovitud veeru valida. Pandade liitmismeetodit kasutatakse enamasti võrreldes pandade liitumismeetodiga. Tarkvara, mida me juurutamiseks kasutame, on pythoni keskkonnas asuv tarkvara 'spyder', mis pakub meile eeliseid pandade liitumismeetodi () ja panda merge() meetodi funktsiooni koodi rakendamisel.

Panda Join() meetodi süntaks

'df1. liituda ( df2 )

Ülaltoodud süntaksis olev 'df' on 'andmeraami' lühend. Süntaksis on kaks andmekaadrit funktsiooniga 'dot join', mis on meetodi kutsumiseks. See on pandade meetod kahe andmeraami ühendamiseks. See töötab indeksi abil, et ühendada andmeraamid üheks.







Pandas Merge() meetodi süntaks

'df1. liita ( df2 , peal = 'veeru_nimi' )

Pandade liitmismeetodi süntaksil on kaks andmeraami 'df1' ja 'df2'. Funktsioon 'Punktide ühendamine' kutsub esile meetodi mõlema andmeraami ühendamiseks ümberpööratud veergude välimusega.



Käsitleme järgmisi kahe andmeraami kombineerimise viise, et kasutada pandade liitmise ja liitmise meetodeid:



  • Pandas Join meetod kattub.
  • Pandad liituvad meetodiga indeksi lähtestamise abil.
  • Pandade ühendamise meetod (veerg 'vasak ja parem').
  • Pandade liitmismeetod on selgesõnaline.

Andmeraamide loomine Pandade ühendamise ja Pandade liitumise meetodi rakendamiseks

Esiteks peame looma andmeraami. Selleks kasutame tööriista 'spyder'. Pärast selle avamist alustage koodi kirjutamist. Importige pandad pandade raamatukogu ühenduse jaoks 'pd'-na. Meil on andmeraami muutujad vastavalt 'x', 'y', 'p' ja 'q' ning 'a' väärtustega '1' ja 'b', mille väärtus on määratud kui '2'.





Väljund on 'df', mis on loodud määratud väärtustega. Saame selle muuta nii suureks, kuivõrd andmed on.



Teise andmeraami loomine

Peame tegema veel ühe andmeraami, et mõista selgelt pandade ühinemise ja liitmise meetodeid. Siin oleme 'df' loonud sama, mis ülaltoodud 'df', erinevad on ainult määratud muutujatele määratud väärtused. Meil on 'h', 'j', 's' ja 'd', samas kui määrake väärtused 'b' väärtusega '8' ja 'Y' väärtusega '3'.

Väljund näitab loodud lihtsat 'df-i'.

Näide # 01: Pandade liitumismeetod (kattuv)

Nüüd näeme, kuidas ühendada kaks andmekaadrit pandade liitumismeetodiga. Selle meetodi puhul saame andmeraamist valida teie valitud veeru, millega soovime töötada. Võtsime näite kattuva veeruga 'df'-st 'vasakul', nii et saame selle parandada 'sufiksiga', et ületada andmete kattumist. Siin kasutatakse muutujaid “x”, “z”, “v”, “d”. 'p', 'o', 'l' ja 'y' väärtustega '3', '6', '7' ja '9'. '.join' kutsub välja meetodi, kusjuures joondus on seatud vasakule ühendamiseks parempoolse järelliitega 'df'. ”. Koodis kasutatav järelliide tuleneb sellest, et andmeraamis on kaks veergu, millel on sama nimi, mis on 'võti' ja mis ei kattu andmetega.

Väljund ei näita kattuvaid andmeid kahe 'df' ühendamise meetodil pandade ühendamise meetodil.

Näide # 02: Pandade liitumismeetod indeksi lähtestamise abil

Selles näites täpsustame eraldi veeru parameetriga 'sees', mida kasutatakse 'võtmena' meetodi ühendamisel, mis aitab kahte andmekaadrit ühendada. kombineeritud asi tehakse selle parameetriga. Samuti peaks kahest df-ist ühe indeks olema nende ühendamiseks sarnane. Samalaadseid andmeid või samal eesmärgil kasutatavaid andmeid võib töötlemiseks kasutada koos. See kasutab indeksit endiselt, kasutades paremalt poolt. Muutujad on 's', 't', 'u', 'v', 'n', 'w', 'k' ja 'q'. Määratud väärtused on '3', '6', '7' ja '9'. 'Reset dot index' on pandade meetod 'df' indeksi lähtestamiseks. Lähtestamisindeks seab kõik teie andmeraami loendi täisarvud nullist kuni andmekaadri andmete pikenemiseni.

Siin on väljund, mis kuvatakse pandade indeksiga 'võti' liitumismeetodiga.

Näide # 03: Pandade ühendamise meetod (veerg 'vasak ja parem')

Ühendamismeetod teeb sarnase toimingu nagu pandade liitumismeetod. Mõlemad meetodid on mõeldud andmete kombineerimiseks sarnases andmeraamis. Ühendamismeetod on mitmekülgsem, mis nõuab võtme täpsustamist. Sõltuvalt teie andmeraami tööst saame selle määrata ka vasak- ja parempoolses veerus. Koodi muutujad on 's', 'd', 'g', 'f', 'k', 'j', 'b' ja 'q'. määratud väärtused on '9', '5', '6' ja '7'. Väline 'liitmine' toimub mõlema 'df' puhul, kasutades pandade liitmismeetodi funktsiooni parameetrit 'how'.

Väljund, mida näeme, näitab kahe andmeraami ühendatud andmeid. 'NaN' tähistab 'mitte numbrit', mis tähendab, et kui andmetes pole numbrit määratud, kuvatakse 'NaN'.

Näide # 04: Ühendamismeetod selgesõnaliselt

Siin on selles näites liitmismeetodiks indeksi hävitamine ja indeksi väärtust andmeraamil ei eeldata. Teeme seda meetodit vastavalt vajaminevale tööle, mille puhul on selgesõnaline järelmeetmete võtmine. See liidab andmed vasakpoolse indeksi või parempoolse indeksi alusel parameetriga. Muutujad selles andmeraamis on 't', 'r', 'I', 'u', 'h', 'o', 'e' ja 'e'. Määratud väärtused on “2”, “4”, “6” ja “4”. Ülaltoodud näide pandade liitmismeetodist veeruvalikuga vastavalt vajadusele on kõige esinduslikum ja väärtuslikum kahe andmekaadri ühendamise meetod. Koodirea lõpus kontrollitakse, kas ühendamisvõti on andmestikus ainulaadne.

Allolevas väljundis ei kuvata indeksit ilma indeksita, vaid funktsioon toimub parem- ja vasakpoolse indeksi alusel.

Järeldus

Meetodid merge() ja join() on mõlemad väga mugavad ja tõhusad meetodid. Mõlemat funktsiooni kasutatakse kahe erineva andmeraami ühendamiseks samas andmekaadris, kuid neil on olenevalt juhtumist erinev kasutus. Selles artiklis oleme õppinud peamisi erinevusi pandade liitumis- ja liitmismeetodi vahel. Pärast näidete tegemist ja pandade liitumismeetodi mõistmist lõpetame selle teadmisega, et kui soovime paindlikumat ja andmebaasi stiilis liitumist, on eelistatav kasutada pandade liitmise meetodit. Teisest küljest, kui tahame andmekaadrit indeksiga ulatuslikult kombineerida, võime kasutada pandas join() meetodi funktsiooni.