有勇气的牛排博客

selenium4.3 网页长截屏

有勇气的牛排 356 Python 2023-05-18 21:05:30

1 网页整体长截屏

模式:headless
缺点:无法看到浏览器,遇到特殊场景人工无法辅助。

# -*- coding: utf-8 -*- from selenium import webdriver from selenium.webdriver.chrome.options import Options import os import time def get_image(url, pic_name): # 设置chrome开启的模式,headless就是无界面模式 # 一定要使用这个模式,不然截不了全页面,只能截到你电脑的高度 chrome_options = Options() chrome_options.add_argument('headless') driver = webdriver.Chrome(options=chrome_options) # 控制浏览器写入并转到链接 driver.get(url) time.sleep(1) # 接下来是全屏的关键,用js获取页面的宽高,如果有其他需要用js的部分也可以用这个方法 width = driver.execute_script("return document.documentElement.scrollWidth") height = driver.execute_script("return document.documentElement.scrollHeight") print(width, height) # 将浏览器的宽高设置成刚刚获取的宽高 driver.set_window_size(width, height) time.sleep(1) driver.save_screenshot(pic_name) if __name__ == "__main__": url = "https://www.baidu.com/s?wd=人工智能" pic_name = "image3.png" get_image(url, pic_name)

留言

专栏
文章
加入群聊