当前位置:首页 > python > 正文内容

用python写个selenium爬虫

zhangsir3年前 (2023-03-29)python262

下面是一个使用Python和Selenium的基本爬虫示例。这个爬虫将打开谷歌浏览器并访问一个指定的网站,然后提取特定元素的信息并打印出来。


首先,您需要安装Selenium和ChromeDriver。您可以使用以下命令安装它们:

pip install selenium

接下来,您需要下载适用于您的Chrome浏览器版本的ChromeDriver。您可以在此处下载:http://chromedriver.chromium.org/downloads


下载完成后,将ChromeDriver.exe文件放在您的工作目录下或添加到系统PATH中。


下面是代码示例:


from selenium import webdriver
from selenium.webdriver.common.by import By

# 初始化ChromeDriver
driver = webdriver.Chrome()

# 打开要爬取的网站
driver.get("https://www.example.com")

# 找到特定元素并提取信息
element = driver.find_element(By.XPATH, "//h1")
print(element.text)

# 关闭浏览器
driver.quit()

这个示例将打开谷歌浏览器并访问https://www.example.com。然后,它将查找网站上的第一个`<h1>`元素并将其文本打印到控制台中。最后,它将关闭浏览器。


您可以根据自己的需要修改这个示例。例如,您可以使用不同的浏览器,找到不同的元素或在找到元素后执行其他操作。


zhangsir版权f2防采集https://mianka.xyz

扫描二维码推送至手机访问。

版权声明:本文由zhangsir or zhangmaam发布,如需转载请注明出处。

本文链接:https://www.mianka.xyz/post/153.html

分享给朋友:

“用python写个selenium爬虫” 的相关文章

python scrapy库安装

(1)安装pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scrapy (2) 报错1: building 'twisted.test.raiser' extension...

Python怎么获取命令行参数

输入:“ import sys”,导入 sys 模块。插入语句:“print(sys.argv)”,打印获取的命令行参数。...

Python三方库ddddocr实现验证码识别

Python三方库ddddocr实现验证码识别环境要求python >= 3.8安装三方库pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple参数说明:参数名参数类型默认值说明us...

使用pyautogui进行屏幕捕捉实现自动化操作

import pyautogui import time # # 获取基本信息 # # 屏幕大小 # size = pyautogui.size() # print(size) #&nbs...

python 实现彩色图转素描图

python可以把彩色图片转化为铅笔素描草图,对人像、景色都有很好的效果。而且只需几行代码就可以一键生成,适合批量操作,非常的快捷。需要的第三方库:Opencv - 计算机视觉工具,可以实现多元化的图像视频处理,有Python接口""" Photo ...

python 给电脑设置闹钟

python会自动触发windows桌面通知,提示重要事项,比如说:您已工作两小时,该休息了我们可以设定固定时间提示,比如隔10分钟、1小时等用到的第三方库:win10toast - 用于发送桌面通知的工具from win10toast import ToastNoti...