Kuidas saada seleeni abil praegust URL -i

How Get Current Url With Selenium



Selenium on tööriist brauseri testimiseks, veebi automatiseerimiseks ja veebi kraapimiseks. Seleeniprojektide kallal töötades peate võib -olla teadma selle lehe URL -i, mida teie seleeni juhitav veebibrauser kuvab. See teave võib olla kasulik URL -i jälgimiseks, kust olete mõned andmed välja võtnud, et saaksite andmeid mõne skripti abil automaatselt värskendada.

Selles artiklis näitan teile, kuidas saada seleeni abil brauseri praegune URL. Niisiis, alustame.





Eeltingimused:

Selle artikli käskude ja näidete proovimiseks peab teil olema,



1) Teie arvutisse installitud Linuxi distributsioon (eelistatavalt Ubuntu).
2) arvutisse installitud Python 3.
3) PIP 3 on teie arvutisse installitud.
4) Python virtualenv teie arvutisse installitud pakett.
5) arvutisse installitud Mozilla Firefoxi või Google Chrome'i veebibrauserid.
6) Peab teadma, kuidas Firefox Gecko draiverit või Chrome'i veebidraiverit installida.



Nõuete 4, 5 ja 6 täitmiseks lugege palun minu artiklit Sissejuhatus seleeni koos Pythoniga 3 saidil Linuxhint.com.





Teiste teemade kohta leiate palju artikleid LinuxHint.com . Kontrollige neid kindlasti, kui vajate abi.

Projekti kataloogi seadistamine:

Kõigi organiseeritud hoidmiseks looge uus projektikataloog selenium-url/ järgnevalt:



$mkdir -lkseleen-url/autojuhid

Liikuge lehele selenium-url/ projekti kataloog järgmiselt:

$CDseleen-url/

Looge Pythoni virtuaalne keskkond projekti kataloogis järgmiselt.

$virtualenv .venv

Aktiveerige virtuaalne keskkond järgmiselt.

$allikas.venv/olen/aktiveerida

Installige Selenium Pythoni teek oma virtuaalsesse keskkonda PIP3 abil järgmiselt.

$ pip3 install seleen

Laadige alla ja installige kõik vajalikud veebidraiverid autojuhid/ projekti kataloog. Olen oma artiklis selgitanud veebidraiverite allalaadimise ja installimise protsessi Sissejuhatus seleeni koos Pythoniga 3 . Kui vajate abi, otsige LinuxHint.com selle artikli jaoks.

Kasutan selles artiklis tutvustamiseks Google Chrome'i veebibrauserit. Niisiis, ma kasutan kroomitud draiver binaarne koos seleeniga. Peaksite kasutama geko juht binaarne, kui soovite kasutada Firefoxi veebibrauserit.

Looge Pythoni skript ex01.py oma projekti kataloogis ja sisestage sellesse järgmised koodiridad.

alatesseleenimportveebidraiver
alatesseleen.veebidraiver.levinud.võtmed importVõtmed
võimalusi=veebidraiver.ChromeOptions()
võimalusi.peata = Tõsi
brauser=veebidraiver.Chrome(käivitatav_tee='./drivers/chromedriver',võimalusi=võimalusi)
brauser.saada('https://duckduckgo.com/')
printida(brauser.praegune_url)
brauser.Sulge()

Kui olete lõpetanud, salvestage ex01.py Pythoni skript.

Siin impordivad read 1 ja 2 kõik vajalikud komponendid Pythoni seleeniteegist.

Rida 4 loob Chrome'i suvandite objekti ja rida 5 lubab Chrome'i veebibrauseris peata režiimi.

Rida 7 loob Chrome'i brauser objekti kasutades kroomitud draiver binaarne alates autojuhid/ projekti kataloog.

9. rida käsib brauseril laadida veebisaidi duckduckgo.com.

Rida 10 prindib brauseri praeguse URL -i. Siin, browser.current_url atribuuti kasutatakse brauseri praegusele URL -ile juurdepääsuks.

Rida 12 sulgeb brauseri.

Käivitage Pythoni skript ex01.py järgnevalt:

$ python3 ex01.py

Nagu näete, on praegune URL ( https://duckduckgo.com ) on trükitud konsoolile.

Varasemas näites olen külastanud veebisaiti duckduckgo.com ja printinud praeguse URL -i konsoolile. See tagastab külastatava lehe URL -i. Pole eriti uhke, kuna me juba teame lehe URL -i. Otsime nüüd DuckDuckGo -st midagi ja proovime konsooli otsingutulemuste lehe URL -i printida.

Looge Pythoni skript ex02.py oma projekti kataloogis ja sisestage sellesse järgmised koodiridad.

alatesseleenimportveebidraiver
alatesseleen.veebidraiver.levinud.võtmed importVõtmed
võimalusi=veebidraiver.ChromeOptions()
võimalusi.peata = Tõsi
brauser=veebidraiver.Chrome(käivitatav_tee='./drivers/chromedriver',võimalusi=võimalusi)
brauser.saada('https://duckduckgo.com/')
printida(brauser.praegune_url)
searchInput=brauser.find_element_by_id('search_form_input_homepage')
searchInput.send_keys('seleeni hq'+ Võtmed.SISENEMA)
printida(brauser.praegune_url)
brauser.Sulge()

Kui olete lõpetanud, salvestage ex02.py Pythoni skript.

Siin on read 1-10 samad, mis ex01.py . Niisiis, ma ei seleta neid uuesti.

Rida 12 leiab otsingu tekstikasti ja salvestab selle kausta searchInput muutuja.

Rida 13 saadab otsingupäringu seleen hq aastal searchInput tekstikasti ja vajutab võtit kasutades Võtmed.SISEND .

Kui otsinguleht on laaditud, browser.current_url kasutatakse värskendatud praegusele URL -ile juurdepääsuks.

Rida 15 prindib värskendatud praeguse URL -i konsoolile.

Rida 17 sulgeb brauseri.

Käivitage ex02.py Pythoni skript järgmiselt:

$ python3 ex02.py

Nagu näete, on Pythoni skript ex02.py prindib 2 URL -i.

Esimene neist on DuckDuckGo otsingumootori kodulehe URL.

Teine on värskendatud praegune URL pärast DuckDuckGo otsingumootoris otsingu tegemist päringu abil seleen hq .

Järeldus:

Selles artiklis olen näidanud teile, kuidas saada Selenium Pythoni kogu abil veebibrauseri praegune URL. Nüüd peaksite saama oma seleeniprojekte huvitavamaks muuta.