Lisage Pandas DataFrame'ile Dict

Lisage Pandas Dataframe Ile Dict



Arutame, kuidas lisada olemasolevale Panda DataFrame'ile sõnastikku, kasutades funktsioone pandas.DataFrame.append() ja pandas.concat() koos näidetega. Siin viitab sõnastik võti:väärtus paarile, nii et võti viitab olemasolevatele veeru siltidele, mis on DataFrame'is ja väärtused lisatakse reale. Samuti näeme näiteid, mis lisavad Panda DataFrame'ile mitu sõnaraamatut.

Pandas.DataFrame.Append kasutamine

Funktsiooni pandas.DataFrame.append() kasutatakse teise DataFrame'i ridade lisamiseks olemasolevasse DataFrame'i. Kui olemasolevas DataFrame'is olevaid veerge ei eksisteeri, luuakse teised DataFrame'i veerud olemasolevasse DataFrame'i. Kasutage seda funktsiooni nii, et rida tuleb sisestada DataFrame'i sõnastikku lisades.

Süntaks :







Funktsiooni pandas.DataFrame.append() tegelik süntaks on järgmine:



pandad. DataFrame . lisama ( muud , ignore_index , verify_integrity , sorteerida )
  1. muud : see viitab teisele DataFrame'ile, milles selle DataFrame'i read on lisatud olemasolevale DataFrame'ile. Kui soovite lisada ühe rea, peate parameetrina edastama väärtuste sõnastiku.
  2. ignore_index (vaikimisi = Väär): seda parameetrit kasutatakse, kui lisate ridu DataFrame'i, millel juba on ridu. Kui see on 'False', lisatakse ka olemasolevate ridade indeksid. Kui see on 'True', on read tähistatud 0 kuni n-1. Veenduge, et selle parameetri väärtuseks on määratud 'True', kui lisate DataFrame'ile sõnastiku. Vastasel juhul kuvatakse vea tüüp - 'TypeError: saab lisada diktaadi ainult siis, kui ignore_index=True'.
  3. Duplikaatindeksite olemasolu saame kontrollida parameetri verify_integrity abil (vaikimisi = False). Kui indeksid on dubleeritud ja verify_integrity on seatud väärtusele 'True', tagastab see teate 'ValueError: Indexes on kattuvad väärtused'.
  4. Kui olemasoleva DataFrame'i ja mõne muu DataFrame'i veerud ei ole joondatud, on võimalik veerge sortida, kasutades sortimisparameetrit, määrates selle väärtuseks 'True' (vaikimisi = False).

Näide 1: lisage üks sõnaraamat

Loo Panda DataFrame nelja veeruga – „Campaign_Name“, „Location“, „StartDate“ ja „Budget“ – ja kolme reaga. Lisage sellele DataFrame'ile sõnastik.



importida pandad

# Loo DataFrame – 4 veeru ja 3 reaga kampaania
Kampaania = pandad. DataFrame ( [ [ 'Turunduslaager' , 'India' , '01/12/2023' , 8000 ] ,
[ 'Müügilaager' , 'Itaalia' , '25.01.2022' , 10 000 ] ,
[ 'Teine laager' , 'USA' , '17.04.2023' , 2000 ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' , 'Algus kuupäev' , 'Eelarve' ] )
printida ( Kampaania , ' \n ' )

# Lisa üks rida
Kampaania = Kampaania. lisama ( { 'Campaign_Name' : 'Tehniline laager' , 'Asukoht' : 'USA' , 'Algus kuupäev' : '05/12/2023' , 'Eelarve' : 2000 } , ignore_index = Tõsi )
printida ( Kampaania , ' \n ' )

Väljund :





Näeme, et sõnastik on lisatud andmeraamile 'Kampaania'. Selle uue rea indeks on 3, kuna indeksit eiratakse.



Näide 2: lisage mitu sõnaraamatut

Kasutage sama DataFrame'i, mis loodi näites 1, ja lisage funktsiooni pandas.DataFrame.append() abil korraga kolm rida. Määrake parameetri ignore_index väärtuseks 'True'.

importida pandad

# Loo DataFrame – 4 veeru ja 3 reaga kampaania
Kampaania = pandad. DataFrame ( [ [ 'Turunduslaager' , 'India' , '01/12/2023' , 8000 ] ,
[ 'Müügilaager' , 'Itaalia' , '25.01.2022' , 10 000 ] ,
[ 'Teine laager' , 'USA' , '17.04.2023' , 2000 ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' , 'Algus kuupäev' , 'Eelarve' ] )
printida ( Kampaania , ' \n ' )

Kampaania = Kampaania. lisama ( { 'Campaign_Name' : 'Tehniline laager' , 'Asukoht' : 'USA' , 'Algus kuupäev' : '05/12/2023' , 'Eelarve' : 2000 } , ignore_index = Tõsi )
Kampaania = Kampaania. lisama ( { 'Campaign_Name' : 'Turunduslaager' , 'Asukoht' : 'India' , 'Algus kuupäev' : '23.06.2023' , 'Eelarve' : 9000 } , ignore_index = Tõsi )
Kampaania = Kampaania. lisama ( { 'Campaign_Name' : 'Müügilaager' , 'Asukoht' : 'Itaalia' , 'Algus kuupäev' : '24.01.2023' , 'Eelarve' : 1200 } , ignore_index = Tõsi )
printida ( Kampaania )

Väljund :

Olemasolevale DataFrame'ile lisatakse üksteise järel kolm rida 3, 4 ja 5 indeksiga.

Pandas.Concati kasutamine

Funktsioon pandas.concat() ühendab piki ridu või veerge kaks või enam DataFrame'i. Seega peame muutma sõnastiku DataFrame'iks ja andma sellele funktsioonile kaks DataFrame'i.

Süntaks :

Lisage olemasolevale DataFrame'ile sõnastik:

pandad. concat ( [ Olemasolev_andmeraam , Transformed_Dictionary ] , telg = 0 , ignore_index , verify_integrity )
  1. Kui telg = 0, toimub konkateneerimine mööda ridu. Kui see on määratud, ühendatakse piki veerge. Rakendatud on vajalik suurtähtede kasutamine, kuna see on alampealkiri. Lühiduse huvides on lisatud vajalik artikkel.1.
  2. Ignoreeri_index (vaikimisi = False): seda parameetrit kasutatakse siis, kui lisate ridu DataFrame'i, millel juba on ridu. Kui see on 'False', lisatakse ka olemasolevate ridade indeksid. Kui see on 'True', on read tähistatud 0 kuni n-1.
  3. Duplikaatindeksite olemasolu saame kontrollida parameetri verify_integrity abil (vaikimisi = False). Kui indeksid on dubleeritud ja verify_integrity on seatud väärtusele 'True', tagastab see teate 'ValueError: Indexes on kattuvad väärtused'.

Näide 1: lisage üks sõnaraamat

Loo Panda DataFrame nelja veeruga – „Campaign_Name“, „Location“, „StartDate“ ja „Budget“ – ja kolme reaga. Funktsiooni pandas.concat() abil lisage sellele DataFrame'ile reana üks sõnastik (DataFrame).

importida pandad


# Loo DataFrame – 4 veeru ja 3 reaga kampaania
Kampaania = pandad. DataFrame ( [ [ 'Turunduslaager' , 'India' , '01/12/2023' , 8000 ] ,
[ 'Müügilaager' , 'Itaalia' , '25.01.2022' , 10 000 ] ,
[ 'Teine laager' , 'USA' , '17.04.2023' , 2000 ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' , 'Algus kuupäev' , 'Eelarve' ] )
printida ( Kampaania , ' \n ' )

dictionary_from_DataFrame = pandad. DataFrame ( [ { 'Campaign_Name' : 'Teenistuslaager' , 'Asukoht' : 'USA' , 'Algus kuupäev' : '17.04.2023' , 'Eelarve' : 1000 } ] )

# Lisa üks rida
Kampaania = pandad. concat ( [ Kampaania , dictionary_from_DataFrame ] , telg = 0 )
printida ( Kampaania , ' \n ' )

Väljund :

Näeme, et sõnastik on lisatud andmeraamile 'Kampaania'. Selle uue rea indeks on 0, kuna indeksit ei ignoreerita.

Näide 2: lisage mitu sõnaraamatut

Kasutage eelmist DataFrame'i ja lisage indeksit ignoreerides kolm sõnastikku (DataFrame).

importida pandad


# Loo DataFrame – 4 veeru ja 3 reaga kampaania
Kampaania = pandad. DataFrame ( [ [ 'Turunduslaager' , 'India' , '01/12/2023' , 8000 ] ,
[ 'Müügilaager' , 'Itaalia' , '25.01.2022' , 10 000 ] ,
[ 'Teine laager' , 'USA' , '17.04.2023' , 2000 ] ] ,
veerud = [ 'Campaign_Name' , 'Asukoht' , 'Algus kuupäev' , 'Eelarve' ] )
printida ( Kampaania , ' \n ' )

dictionary_from_DataFrame = pandad. DataFrame ( [ { 'Campaign_Name' : 'Tehnikalaager' , 'Asukoht' : 'USA' , 'Algus kuupäev' : '17.05.2023' , 'Eelarve' : 1000 } ,
{ 'Campaign_Name' : 'sotsiaalteenused' , 'Asukoht' : 'Jaapan' , 'Algus kuupäev' : '17.04.2023' , 'Eelarve' : 200 } ,
{ 'Campaign_Name' : 'Müügilaager' , 'Asukoht' : 'USA' , 'Algus kuupäev' : '18.04.2023' , 'Eelarve' : 500 } ] )

# Lisage mitu rida
Kampaania = pandad. concat ( [ Kampaania , dictionary_from_DataFrame ] , telg = 0 , ignore_index = Tõsi )
printida ( Kampaania , ' \n ' )

Väljund :

Näeme, et „Kampaania” andmeraamile on lisatud kolm sõnastikku. Nende sõnaraamatute indeksid on 3, 4 ja 5, kuna parameeter ignore_index on seatud väärtusele 'False'.

Järeldus

Üksik-/mitu sõnastikud lisatakse DataFrame'i funktsioonide pandas.DataFrame.append() ja pandas.concat() abil. Uute ridade indeksid võivad olla ainulaadsed, kui määrate funktsioonis pandas.concat() parameetri ignore_index väärtuseks 'True'. Funktsiooni pandas.DataFrame.append() kasutamisel määrake parameetri ignore_index väärtuseks 'True'. Vastasel juhul tõstatatakse TypeError.