Pandas loe tekstifaili

Pandas Loe Tekstifaili



'Pandas' saame tekstifaili hõlpsalt lugeda 'panda' meetodi abil. “Pandas” annab meile võimaluse tekstifaili lugeda. “Pandas” pakub tekstifaili lugemiseks erinevaid sisseehitatud meetodeid. Selles õpetuses käsitleme kõiki meetodeid koos kõigi siinsete parameetritega ja selgitame neid üksikasjalikult. Samuti loeme tekstifaili 'pandades', kasutades meie koodides 'panda' meetodeid.

Meetodid tekstifaili lugemiseks 'pandas'

Pandades on meil kolm meetodit, mis aitavad meil tekstifaili lugeda. Oleme siin teinud ka mõned näited, milles loeme tekstifaili. Pandade pakutavaid meetodeid käsitletakse allpool:







    • Kasutades meetodit pd.read_csv().
    • Kasutades meetodit pd.read_table().
    • Kasutades meetodit pd.read_fwf().

Nüüd selgitame selles õpetuses kõigi nende meetodite süntaksit ja käsitleme üksikasjalikult kõigi meetodite parameetreid.



Read_csv() süntaks



pd.read_csv ( 'failinimi.txt', sept =' ', päis = mitte ühtegi, nimed = [ 'Veeru_nimi1', 'Veeru_nimi2, 'Veeru_nimi2', ………….. ] )


Selle meetodi puhul lisame esmalt tekstifaili nime, mille andmeid tahame lugeda ja see on selle meetodi esimene parameeter. Seejärel asetame selle meetodi puhul eraldajaks 'sept' ja asetame siia tähemärgiks tühiku, nii et see käsitleb tühikut eraldajana. Pärast seda on meil päise parameeter ja kasutatakse selle parameetri väärtust 'Puudub', nii et see loob vaikepäise ja kui me seda parameetrit ei lisa, võtab see arvesse tekstifaili esimest rida päisena. Parameetris 'names' saame lisada veergude nimed, mille peame lisama päisena.





Tabeli read_table() süntaks

pd.read_table ( 'failinimi.txt' , eraldaja = '' )


Selle meetodi puhul paneme esimeseks parameetriks tekstifaili failinime. Kui asetame eraldajasse ' ', siis eraldajaks on tühik.



Read_fwf() süntaks

pd.read_fwf ( 'failinimi.txt' )


See meetod võtab ainult ühe parameetri, milleks on tekstifaili nimi.

Nüüd kasutame neid meetodeid 'panda' koodide tekstifailide lugemiseks ja tekstifaili andmete kuvamiseks terminalis.

Näide nr 01

Rakendus 'Spyder' on siin, kus oleme teinud kõik need selles õpetuses esitatud koodid. Tekstifail, mille andmeid tahame lugeda, on näidatud allpool. Selle tekstifaili lugemiseks 'pandas' kasutame meetodit 'read_csv()'.


Esmalt impordime 'pandade' teegi, kuna tahame kasutada meetodit 'read_csv()' ja see on 'panda' meetod. Me pääseme sellele meetodile juurde ainult siis, kui oleme importinud pandade raamatukogu. Siin mainime 'pandasid pd-na', seega asetatakse see 'pd' selle kasutamise meetodi nime juurde. Pärast seda loome siia muutuja “df”, mida kasutatakse tekstifaili andmete salvestamiseks pärast lugemist. Siia paigutame meetodi “pd.read_csv()”, mis aitab tekstifaili lugeda ja tekstifaili andmeid DataFrame’i teisendada ning muutujasse “df” salvestada.

Oleme siin edastanud failinime, mis on 'myData.txt', ja seejärel kasutame 'sep' ja määrame sellele 'sep' tühja märgi. Seega töötab see tühi märk tekstifailis eraldajana. Seejärel kasutasime allpool olevat 'print()', mida kasutatakse tekstifaili andmete printimiseks. See kuvab tekstifaili andmed DataFrame'i vormis.


Selle koodi täitmiseks peame vajutama 'Shift+Enter' ja väljund renderdatakse 'Spyderi' terminalis. Antud ekraanipildil kuvatakse ülaltoodud koodi tulemus ja näete, et tekstifaili andmed kuvatakse DataFrame'ina ja meie tekstifaili esimene rida on siin selle DataFrame'i veergude nimedena. Samuti eraldab see andmed, kus tekstifailis on tühik.

Näide # 02

Siin on näidatud tekstifail, mida me selles näites loeme, ja me kasutame taas meetodit 'read_csv()', kuid erinevate parameetritega.


Kasutatakse 'panda' meetodit 'pd.read_csv()' ja siin edastame kolm parameetrit. Esiteks paneme failinime, milleks on 'Record.txt'. Teine parameeter on 'sep' parameeter ja määrab sellele tühja tähemärgi ja siis on meil kolmas parameeter, milles määrame 'päise' ja kohandame selle väärtusele 'Puudub', nii et see loob DataFrame'i vaikepäise. kui me seda koodi käivitame. Oleme kõik selle salvestanud muutujasse “My_Record” ja lisanud printimiseks funktsiooni “print()” ka “My_Record”.


Kõik andmed salvestatakse DataFrame'i ja see eraldab andmed, kus tekstifaili andmetes on tühik. Samuti lõi see siin DataFrame'i vaikepäise, kuna muutsime parameetri 'header' väärtuseks 'Puudub'.

Näide # 03

Kuvatakse selle näite tekstifail ja me kasutame veel kord muudetud parameetritega meetodit 'read_csv()'.


Selles koodis edastatakse neli parameetrit 'panda' meetodile 'pd.read_csv()'. Tekstifaili nimi on esimene parameeter. Parameetrile 'sep' antakse teises parameetris tühi märk. Parameeter 'header' on kolmandas argumendis seatud väärtusele 'Puudub' ja neljanda parameetrina oleme määranud 'nimed', mis kuvatakse pärast tekstifaili lugemist DataFrame'i veerunimedena ja need veerunimed on 'COL_1, COL_2, COL_3, COL_4 ja COL_5'. Kogu see teave on salvestatud muutujasse 'My_Record' ja 'My_Record' on lisatud ka 'print()' meetodile, nii et see trükitakse terminalis.


Siin renderdatakse kogu tekstifaili teave DataFrame'ina, samuti eraldatakse need andmed, kuhu tekstifailis on tühikud lisatud. Samuti lisab see vastavalt veergude nimed, mille oleme koodi eespool lisanud.

Näide # 04

See on tekstifail, mida me selles näites loeme, kasutades teist meetodit, meetodit 'pd.read_table()'.


Siin lisatakse tekstifaili lugemiseks meetod 'pd.read_table()' ja lisame 'ABC.txt', mis on tekstifaili nimi. See meetod aitab tekstifaili lugeda, samuti oleme kohandanud parameetri 'eraldaja' tühikule, nii et see töötab ka nagu eraldaja, mida oleme eespool selgitanud. Seejärel salvestatakse kõik tekstifaili andmed muutujasse 'My_Data' ja prinditakse ka siia.


Meie tekstifaili esialgne rida kuvatakse siin DataFrame'i veerunimedena ja tekstifaili andmed prinditakse DataFrame'ina. Lisaks eraldab see tekstifaili andmed, kus selles on tühikumärk.

Näide nr 05

Nüüd sisaldab tekstifail andmeid, mis kuvatakse allpool. Seekord rakendame 'read_fwf()' ja näitame, kuidas see pärast tekstifaili lugemist andmeid renderdab.


Nagu me teame, võtab see 'read_fwf()' meetod ainult ühe parameetri, mis on failinimi, mida tahame lugeda. Lisame siia 'tekstifail.txt', mis on meie tekstifaili nimi, ja määrame selle panda meetodi muutujale 'File_Data', mis salvestab selle tekstifaili andmed. Seejärel paneme 'print(File_Data)', nii et see prindib ka need andmed.


Siin kuvatakse kõik tekstifaili andmed. See ei eraldanud andmeid, kus on tühikumärgid, kuna selles funktsioonis pole parameetreid nagu 'Sep' või 'eraldaja'.

Järeldus

See õpetus selgitab, kuidas lugeda tekstifaili 'pandas' ja milliseid meetodeid kasutatakse tekstifaili lugemiseks 'pandades'. Oleme arutanud kõiki meetodeid, mis aitavad meil 'pandas' tekstifaili lugeda. Oleme selles õpetuses uurinud kolme erinevat pandade meetodit oma tekstifailide lugemiseks pandades. Samuti oleme siin üksikasjalikult selgitanud kõigi meetodite süntaksit ja kõigi meetodite parameetreid ning lugenud paljusid tekstifaile, rakendades selles õpetuses erinevaid meetodeid koos kõigi võimalike parameetritega.