Kuidas lugeda Excel (xlsx) faili pythonis

How Read Excel File Python

The .xlsx on Exceli dokumendi laiend, mis suudab salvestada suure hulga andmeid tabelina ning mitut tüüpi aritmeetilisi ja loogilisi arvutusi saab hõlpsasti teha Exceli arvutustabeliga. Mõnikord on programmeerimise eesmärgil vaja lugeda Exceli dokumendi andmeid, kasutades Pythoni skripti. Exceli dokumendi lugemiseks on Pythonis palju mooduleid. Mõned kasulikud moodulid on xlrd , openpyxl ja pandad . Selles juhendis on näidatud nende moodulite kasutamise viisid Exceli faili lugemiseks Pythonis.

Eeltingimus:

Selle õpetuse näidete kontrollimiseks on vaja dummy Exceli faili laiendiga .xlsx. Saate kasutada mis tahes olemasolevat Exceli faili või luua uue. Siin on uus Exceli fail nimega müük.xlsx fail on loodud järgmiste andmetega. Seda faili on kasutatud lugemiseks, kasutades selle õpetuse järgmises osas erinevaid pythoni mooduleid.



müük.xlsx



Müügikuupäev Müügiinimene Kogus
12.05.18 Sila Ahmed 60000
06.06.19 Mina Hossain 50 000
08.09.20 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Näide 1: lugege Exceli faili, kasutades xlrd

Xlrd -moodul pole vaikimisi Pythoni installitud. Seetõttu peate enne selle kasutamist mooduli installima. Selle mooduli uusim versioon ei toeta .xlsx laiendiga Exceli faili. Niisiis, peate xlsx -faili lugemiseks installima selle mooduli 1.2.0 versiooni. Nõutava versiooni installimiseks käivitage terminalist järgmine käsk xlrd .



$pippaigaldada xlrd== 1.2.0

Pärast installiprotsessi lõpuleviimist looge selle lugemiseks järgmise skriptiga pythoni fail müük.xlsx faili kasutades xlrd moodul. open_workbook () funktsiooni kasutatakse skriptis, avage lugemiseks xlsx -fail. See Exceli fail sisaldab ainult ühte lehte. Seega workbook.sheet_by_index () funktsiooni on skriptis kasutatud argumendi väärtusega 0. Järgmisena pesastatakse 'Eest' loop on kasutanud töölehe lahtriväärtuste lugemiseks rea ja veeru väärtuste abil. Skriptis on rida ja veeru suuruse määratlemiseks leheandmete põhjal kasutatud kahte vahemiku () funktsiooni. The cell_value () funktsioon on kasutanud lehe konkreetse lahtri väärtuse lugemist silmuse igas iteratsioonis. Väljundi iga väli eraldatakse ühe vahelehega.

# Importige xlrd moodul
importida xlrd

# Avage töövihik
töövihik = xlrd.open_tybook('sales.xlsx')

# Avage tööleht
tööleht = töövihik.sheet_by_index(0)

# Korda ridu ja veerge
eestisissevahemik(0,5):
eestjsissevahemik(0,3):
# Printige lahtrite väärtused vahekaardiga
printida(tööleht.raku_väärtus(mina, j),lõpp=' t')
printida('')

Väljund:

Pärast ülaltoodud skripti täitmist ilmub järgmine väljund.



Näide-2: lugege Exceli faili openpyxl abil

The openpyxl on veel üks pythoni moodul xlsx -faili lugemiseks, samuti pole seda vaikimisi Pythoni installitud. Selle mooduli installimiseks käivitage terminalist järgmine käsk enne selle kasutamist.

$pippaigaldadaopenpyxl

Pärast installiprotsessi lõpuleviimist looge selle lugemiseks järgmise skriptiga pythoni fail müük.xlsx faili. Nagu xlrd moodul, openpyxl moodulil on koormustöövihik () funktsioon xlsx -faili lugemiseks avamiseks. The müük.xlsx faili kasutatakse selle funktsiooni argumendiväärtusena. Objekt wookbook.aktiivne on loodud skripti väärtuste lugemiseks max_row ja max_veerg omadused. Neid atribuute on kasutatud pesade jaoks silmuste lugemiseks müük.xlsx faili. Funktsiooni vahemik () on kasutatud lehe ridade lugemiseks ja funktsiooni iter_cols () lehe veergude lugemiseks. Väljundi iga väli eraldatakse kahe vahelehega.

# Impordi openyxl moodul
importida openpyxl

# Määrake muutuja, mis laadib wookbooki
wookbook = openpyxl.load_workbook('sales.xlsx')

# Määrake muutuja aktiivse lehe lugemiseks:
tööleht = wookbook.aktiivne

# Lahtrite väärtuste lugemiseks korrake tsüklit
eestisissevahemik(0, tööleht.max_row):
eest koos sissetööleht.iter_cols(1, tööleht.max_column):
printida(koos[i].väärtus,lõpp=' t t')
printida('')

Väljund:

Pärast ülaltoodud skripti täitmist ilmub järgmine väljund.

Näide-3: lugege Exceli faili, kasutades pandasid

Pandamoodulit ei installita eelmise mooduliga sarnase pythoniga. Seega, kui te pole seda varem installinud, peate selle installima. Installimiseks käivitage järgmine käsk pandad terminalist.

$pippaigaldadapandad

Pärast installiprotsessi lõpuleviimist looge selle lugemiseks järgmise skriptiga pythoni fail müük.xlsx faili. The read_excel () funktsiooni pandas kasutatakse xlsx -faili lugemiseks. Seda funktsiooni on skriptis kasutatud teksti lugemiseks müük.xlsx faili. The DataFrame () funktsioon on siin kasutanud xlsx -faili sisu lugemist andmekaadris ja väärtuste salvestamist nimega muutujale andmed . Andmete väärtus on hiljem trükitud.

# Impordi pandad
importida pandasidnagupd

# Laadige xlsx -fail
excel_data = pd.read_excel('sales.xlsx')
# Lugege andmekaadris oleva faili väärtusi
andmed = pd.DataFrame(excel_data,veerud=['Müügikuupäev','Müügiinimene','Summa'])
# Printige sisu
printida('Faili sisu on järgmine: n', andmed)

Väljund:

Pärast ülaltoodud skripti täitmist ilmub järgmine väljund. Selle skripti väljund erineb kahest eelmisest näitest. Reanumbrid trükitakse esimesse veergu, kus rea väärtus on loetud alates 0. Kuupäeva väärtused joondatakse tsentraalselt. Müüjate nimed on paremale joondatud. Summa joondatakse vasakule.

Järeldus:

Pythoni kasutajad peavad erinevatel programmeerimise eesmärkidel töötama xlsx -failidega. Selles õpetuses on näidatud kolme erinevat viisi xlsx -faili lugemiseks, kasutades kolme pythoni moodulit. Igal moodulil on xlsx -faili lugemiseks erinevad funktsioonid ja omadused. See õpetus aitab pythoni kasutajatel pärast selle õpetuse lugemist pythoni skripti abil hõlpsalt xlsx -faili lugeda.