実行環境
linux ubuntu 22.04
Python 3.12.3
selenium 4.25.0
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
import time
options = Options()
options.add_argument("--headless=new")
options.add_argument('--disable-dev-shm-usage')
driver = webdriver.Chrome(options = options)
driver.implicitly_wait(10)
# googleにアクセス
driver.get('https://www.google.co.jp/')
time.sleep(5)
driver.quit()
ドライバーオプションにはヘッドレスモードの有無と、メモリの使用場所などを指定しています
とりあえずこれだけでブラウザが立ち上がります
最新のseleniumはchromedriverのインストールは必要ないようです
プログラミングを実行すると /home/user/.cache/selenium/chromedriver のフォルダが作成されて
自動的にインストールされます
driver.implicitly_wait(10) は待機処理です
最初に一回書けば、その後 find_element等のたびに要素が見つかるまで最大10秒待機します
time.sleep(5) は強制的に5秒待機させます
サーバーに負荷をかけないように、処理ごとに time.sleep(1) を入れたりします
コメント