Tühjendage Pandas DataFrame

Tuhjendage Pandas Dataframe



Andmete eemaldamine Pandas DataFrame'ist toimub funktsiooni pandas.DataFrame.drop() abil. Peale selle funktsiooni saame valida DataFrame'i ridu veerge/ridu arvestamata. Seda saab teha ka nurksulgude abil. Selles juhendis kasutame kõigi ridade kustutamiseks ka märksõna 'del' ja funktsiooni pop(), itereerides DataFrame'i tsükliga 'for'.

Pandas.DataFrame.Drop kasutamine

Kasutame funktsiooni pandas.DataFrame.drop() Panda DataFrame'i konkreetsete ridade või veergude eemaldamiseks. Kasutame seda funktsiooni kõigi ridade ja veergude tühistamiseks.

Süntaks :







Järgmine on funktsiooni pandas.DataFrame.drop() süntaks. Kasutame ainult kolme parameetrit ja käsitleme selles juhendis ainult neid kolme. Selle funktsiooni kohta on üksikasjalik õpetus:



pandad. DataFrame . tilk ( sildid , telg , indeks , veerud , tasemel , kohas , vead )
  1. Kõigi DataFrame'i ridade kustutamiseks peame parameetrile „labels” edastama reaindeksite loendi. Samuti saame edastada atribuudi DataFrame.index, mis valib kõik reaindeksid. Samamoodi peame sellele parameetrile edastama kõik veergude nimed või edastama atribuudi DataFrame.columns.
  2. Kui edastate veerud parameetrile 'sildid', määrake parameetri „telg” väärtuseks 1. Vaikimisi on telg = 0, mis viitab ridadele.
  3. Operatsiooni (Delete) saame teha olemasoleva DataFrame'iga. Määrake parameeter 'inplace' väärtuseks 'True'.

Näide 1:

Mõelge nelja rea ​​ja kahe veeruga andmeraamile „Campaign1”. Esmalt kukutage kõik read, edastades ridade indeksid parameetrile 'labels', ja seejärel kukutage kõik veerud, edastades veerusildid parameetrile 'labels'.



importida pandad

# Loo DataFrame – kampaania1 2 veeru ja 4 kirjega
Kampaania 1 = pandad. DataFrame ( [ [ 'java laager' , 'India' ] , [ 'linuxi laager' , 'USA' ] , [ 'c/c++ laager' , 'India' ] , [ 'püütoni laager' , 'USA' ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' ] )
printida ( Kampaania 1 , ' \n ' )

# Loobuge kõik read
Kampaania 1. tilk ( sildid = [ 0 , 1 , 2 , 3 ] , kohas = Tõsi )
printida ( Kampaania 1 , ' \n ' )

# Loobuge kõik veerud
Kampaania 1. tilk ( sildid = [ 'Campaign_Name' , 'Asukoht' ] , kohas = Tõsi , telg = 1 )
printida ( Kampaania 1 , ' \n ' )

Väljund :





Pärast ridade mahajätmist read eemaldatakse, kuid veerud on olemas. Pärast veergude eemaldamist on „Campaign1” tühi.



Näide 2:

Kasutage eelmist „Campaign1” DataFrame'i ja pukseerige read, edastades parameetri „Campaign1.index” parameetrile „labels”, ja seejärel pukseerige veerud, edastades parameetri „Campaign.columns” parameetrile „labels”.

importida pandad

# Loo DataFrame – kampaania1 2 veeru ja 4 kirjega
Kampaania 1 = pandad. DataFrame ( [ [ 'java laager' , 'India' ] , [ 'linuxi laager' , 'USA' ] , [ 'c/c++ laager' , 'India' ] , [ 'püütoni laager' , 'USA' ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' ] )
printida ( Kampaania 1 , ' \n ' )

# Loobuge kõik read
Kampaania 1. tilk ( sildid = Kampaania 1. indeks , kohas = Tõsi )

# Loobuge kõik veerud
Kampaania 1. tilk ( sildid = Kampaania 1. veerud , kohas = Tõsi , telg = 1 )
printida ( Kampaania 1 )

Väljund :

Pärast ridade mahajätmist read eemaldatakse, kuid veerud on olemas. Pärast veergude eemaldamist on „Campaign1” tühi.

Iloci kasutamine[]

Atribuuti pandas.DataFrame.iloc[] kasutatakse andmete valimiseks indeksi positsiooni alusel. Saame kasutada seda atribuuti, et valida DataFrame'ist 0 rida ja 0 veergu. Siin me ei kustuta tegelikku DataFrame'i, vaid valime 0 kirjet.

Süntaks :

Esiteks peame kustutama veerud ja seejärel read.

  1. Valige 0 veergu – DataFrame.iloc[:,0:0]
  2. Valige 0 rida – DataFrame.iloc[0:0]

Näide :

Kasutage sama DataFrame'i ja valige atribuudi iloc[] abil tühi DataFrame.

importida pandad

# Loo DataFrame – kampaania1 2 veeru ja 4 kirjega
Kampaania 1 = pandad. DataFrame ( [ [ 'java laager' , 'India' ] , [ 'linuxi laager' , 'USA' ] , [ 'c/c++ laager' , 'India' ] , [ 'püütoni laager' , 'USA' ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' ] )
printida ( Kampaania 1 , ' \n ' )

# Loobuge kõik read
Kampaania 1. tilk ( sildid = [ 0 , 1 , 2 , 3 ] , kohas = Tõsi )
printida ( Kampaania 1 , ' \n ' )

# Loobuge kõik veerud
Kampaania 1. tilk ( sildid = [ 'Campaign_Name' , 'Asukoht' ] , kohas = Tõsi , telg = 1 )
printida ( Kampaania 1 , ' \n ' )

Väljund :

Märksõna Del kasutamine

Kõik andmed kustutatakse DataFrame'ist, kasutades märksõna 'del', itereerides kõiki ridu tsüklis 'for'.

importida pandad

# Loo DataFrame – kampaania1 4 veeru ja 4 kirjega
Kampaania 1 = pandad. DataFrame ( [ [ 'java laager' , 'India' ] , [ 'linuxi laager' , 'USA' ] , [ 'c/c++ laager' , 'India' ] , [ 'püütoni laager' , 'USA' ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' ] )
printida ( Kampaania 1 , ' \n ' )

# Kasutades del märksõna
jaoks i sisse Kampaania1:
selle Kampaania 1 [ i ]
printida ( Kampaania 1 )

Väljund :

Nüüd on DataFrame tühi.

Funktsiooni Pop() kasutamine

Kõik andmed kustutatakse DataFrame'ist, kasutades funktsiooni pop(), itereerides kõiki ridu tsüklis 'for'. See funktsioon on määratud tsüklis 'for'.

importida pandad

# Loo DataFrame – kampaania1 4 veeru ja 4 kirjega
Kampaania 1 = pandad. DataFrame ( [ [ 'java laager' , 'India' ] , [ 'linuxi laager' , 'USA' ] , [ 'c/c++ laager' , 'India' ] , [ 'püütoni laager' , 'USA' ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' ] )
printida ( Kampaania 1 , ' \n ' )

# Kasutades pop()
jaoks i sisse Kampaania1:
Kampaania 1. pop ( i )
printida ( Kampaania 1 )

Väljund :

Nüüd on DataFrame tühi.

Järeldus

Õppisime, kuidas tühjendada Panda DataFrame, eemaldades read ja veerud. Esiteks eemaldasime DataFrame'ist read, kasutades funktsiooni drop() ja seejärel veerud pärast seda, kui kasutasime atribuuti iloc[], et valida 0 rida. Lõpuks arutasime, kuidas kustutada kirjeid DataFrame'ist, kasutades märksõna 'del' ja funktsiooni pop().