当前位置:首页 > python > 正文内容

python+selenium元素定位的8种方法

zhangsir3年前 (2022-09-21)python305

定位元素,selenium提供了8中元素定位方法:


(1)find_element_by_id() :html规定,id在html中必须是唯一的,有点类似于身份证号


(2)find_element_by_name() :html规定,name用来指定元素的名称,有点类似于人名


(3)find_element_by_tag_name() :通过元素的签名来定位


(4)find_element_by_class_name() :html规定,class指定元素的类名


(5)find_element_by_link_text() :专门用来定位文本链接


(6)find_element_by_partial_link_text() :是对link_text的一种补充,有些文字链接比较长,可以取一部分链接文字进行定位,只要这部分文字是唯一标志这个链接的


(7)find_element_by_css_selector()


(8)find_element_by_xpath()



=================================================================================================


http://www.baidu.com 首页html源代码


输入框: <input id="kw" name="wd" class="s_ipt" value="" maxlength="255" autocomplete="off">


确定按钮: <input type="submit" id="su" value="百度一下" class="bg s_btn">


上面一行链接:


<a href="https://www.hao123.com" name="tj_trhao123" class="mnav">hao123</a>


<a href="http://news.baidu.com" name="tj_trnews" class="mnav">新闻</a>


<a href="http://map.baidu.com" name="tj_trmap" class="mnav">地图</a>


<a href="http://v.baidu.com" name="tj_trvideo" class="mnav">视频</a>


<a href="http://tieba.baidu.com" name="tj_trtieba" class="mnav">贴吧</a>


<a href="http://xueshu.baidu.com" name="tj_trxueshu" class="mnav">学术</a>


<a href="https://passport.baidu.com/v2/?login&amp;tpl=mn&amp;u=http%3A%2F%2Fwww.baidu.com%2F" name="tj_login" class="lb" onclick="return false;">登录</a>


<a href="http://www.baidu.com/gaoji/preferences.html" name="tj_settingicon" class="pf">设置</a>


<a href="http://www.baidu.com/more/" name="tj_briicon" class="bri" style="display: block;">更多产品</a>

----------------------------------------------------------------------------------------------------------------------------------------

(1)id定位

find_element_by_id('kw') :输入框
find_element_by_id('su') :'百度搜索'按钮


(2)name定位

find_element_by_name('wd') :输入框


(3)class_name定位

find_element_by_class_name('s_ipt') :输入框


(4)tag_name定位

find_element_by_tag_name('input') :输入框


(5)link_text定位


find_element_by_link_text('新闻')
find_element_by_link_text('地图')
find_element_by_link_text('视频')
find_element_by_link_text('贴吧')


(6)partial_link_text定位

find_element_by_partial_link_text('新')


++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++


(7)XPath定位

(一)、绝对路径

driver.find_element_by_xpath("/html/body/div[1]/div[1]/div/div[1]/div/form/span[1]/input").send_keys('中国')


注意:我先找最后一个span的路径,再加上input的,直接在最后的input上面复制不了路径


(二)、利用元素属性定位: 输入框: <input id="kw" name="wd" class="s_ipt" value="" maxlength="255" autocomplete="off">

确定按钮: <input type="submit" id="su" value="百度一下" class="bg s_btn">


driver.find_element_by_xpath("//input[@id='kw']") 输入框
driver.find_element_by_xpath("//input[@id='su']") 搜索确定按钮


//input表示当前页面某个input标签;


id='kw'表示这个元素的id值是kw;


也可以通过name和class来定位:


driver.find_element_by_xpath("//*[@name='kw']") 输入框
driver.find_element_by_xpath("//*[@class='s_ipt']") 输入框


如果不想指定标签名,也可以用*号代替,当然,XPath不局限于id、name、class这3个属性值,元素的任意属性都可以使用,只要其能标志唯一的一个元素;


driver.find_element_by_xpath("//input[@maxlength='255']") 输入框
driver.find_element_by_xpath("//input[@autocomplete='off']") 输入框
driver.find_element_by_xpath("//input[@type='submit']") 搜索确定按钮


(三)、层级与属性结合


如果一个元素本身没有可以唯一标识这个元素的属性值,那么我们可以查找其上一级元素。如果上一级元素可以唯一标识,则可以拿来用。


加上百度输入框没有可以利用的属性值,那么可以查找它的上一级属性:


driver.find_element_by_xpath("//span[@class='bg s_ipt_wr quickdelete-wrap']/input").send_keys('中国') 输入框
driver.find_element_by_xpath("//span[@class='bg s_btn_wr']/input").click() 搜索确定按钮


注意:此种方法有问题注,使用该路径查询提示找不到(原因未知)


如果父元素也没有利用价值,那么可以继续向上查找父元素的父元素:


driver.find_element_by_xpath("//form[@id='form']/span[1]/input").send_keys('中国') 输入框
driver.find_element_by_xpath("//form[@id='form']/span[2]/input").click() 搜索确定按钮


(四)、使用逻辑运算符


如果一个属性不能唯一确定一个元素,那么可以用逻辑运算符连接多个属性来查找:


driver.find_element_by_xpath("//input[@id='kw' and @class='s_ipt']").send_keys('中国') 输入框
driver.find_element_by_xpath("//input[@id='su' and @type='submit']").click() 搜索确定按钮


(五)、使用contains方法


contains方法用于匹配一个属性中包含的字符串:


driver.find_element_by_xpath("//span[contains(@class,'s_ipt_wr')]/input").send_keys('中国') 输入框
driver.find_element_by_xpath("//input[contains(@id,'su')]").click() 搜索确定按钮


(六)、使用text()方法


text()方法,用于匹配显示的文本信息,类似实现了link_text定位


driver.find_element_by_xpath("//a[text(),'新闻']")
driver.find_element_by_xpath("//a[contains(text(),'新闻')]") #两个配合使用

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

选择器 示例 示例说明


.class .intro 选择所有class="intro"的元素


#id #firstname 选择所有id="firstname"的元素


* * 选择所有元素


element p 选择所有<p>元素


element,element div,p 选择所有<div>元素和<p>元素


element element div p 选择<div>元素内的所有<p>元素


element>element div>p 选择所有父级是 <div> 元素的 <p> 元素


element+element div+p 选择所有紧接着<div>元素之后的<p>元素


[attribute] [target] 选择所有带有target属性元素


[attribute=value] [target=-blank] 选择所有使用target="-blank"的元素


(8)CSS定位


(一)、通过class定位


点( . )号表示通过class来定位元素


driver.find_element_by_css_selector(".s_ipt").send_keys('中国') 输入框
driver.find_element_by_css_selector(".bg.s_btn").click() 搜索确定按钮


注:bg s_btn中间的空格用 . 代替

注:class='bg s_ipt_wr quickdelete-wrap',类似这种叫复合class,由多个类选择器组成,

定位的写法则是: .bg.s_ipt_wr.quickdelete-wrap,所有空格用.(点)代替


(二)、通过id定位


driver.find_element_by_css_selector("#kw").send_keys('中国') 输入框
driver.find_element_by_css_selector("#su").click() 搜索确定按钮


(三)、通过标签名定位


在CSS中,用标签名定位元素时,不需要任何标识符号,直接使用标签名即可


driver.find_element_by_css_selector("input[name=wd]").send_keys('中国') 输入框
driver.find_element_by_css_selector("input[id=su]").click() 搜索确定按钮


(四)、通过属性定位


CSS中可以使用元素的任意属性定位,只要这些属性可以唯一标识这个元素;


对属性值来说,可以加引号,也可以不加,但是要注意和整个字符的引号进行取费。


driver.find_element_by_css_selector("[autocomplete=off]").send_keys('中国') 输入框
driver.find_element_by_css_selector("[name='wd']").send_keys('中国') 输入框
driver.find_element_by_css_selector('[type="submit"]').click() 搜索确定按钮


(五)、通过标签层级关系定位


driver.find_element_by_css_selector("span > input#kw").send_keys('中国')
driver.find_element_by_css_selector('span > input#su').click()


(六)、组合定位


driver.find_element_by_css_selector("form.fm > span > input.s_ipt").send_keys('中国')
driver.find_element_by_css_selector("form#form > span > input#kw").send_keys('中国')


(七)、更多定位用法

===============================================================================

有时候我们定位不到元素可能的原因:


1.检查搜索对象是否忘记打引号;


2.Frame/Iframe原因定位不到元素;


3.Xpath描述错误原因: 解决办法:编写好Xpath路径,chrome的F12->html,ctrl+F进行查找,看是否能查找到。


4.页面还没有加载出来,就对页面上的元素进行的操作: 解决办法:导入time模块设置等待时间。


5.动态id定位不到元素: 解决办法:如果是动态的id,最好不要使用,转而使用xpath或其它方式定位


6.二次定位,如弹出框登录: 解决办法:先定位到弹出框,再定位到弹出框内的元素。


7.不可见元素定位:


[emoji:00a0] [emoji:00a0] [emoji:00a0]如上百度登录代码,通过名称为tj_login查找的登录元素,有些是不可见的,


所以加一个循环判断,找到可见元素(is_displayed())点击登录即可。


8.浏览器兼容问题,比如SPACE空格操作Firefox就识别不了,而Chrome就能够识别做出响应。


9.页面刷新或者后退后找不到元素


页面刷新或者后退后,不能直接采用之前定位的元素进行操作,需要重新定位再进行操作。


zhangsir版权k3防采集https://mianka.xyz

扫描二维码推送至手机访问。

版权声明:本文由zhangsir or zhangmaam发布,如需转载请注明出处。

本文链接:https://www.mianka.xyz/post/30.html

标签: pythonselenium
分享给朋友:

“python+selenium元素定位的8种方法” 的相关文章

django框架的安装和创建第一个项目

安装Djangopip install -i https://pypi.douban.com/simple django创建项目django-admin startproject 项目名称例如 django-admin startproje...

pip安装三方库 国内的一些镜像站点推荐

pip 国内的一些镜像站点推荐镜像套路:使用cmd;输入命令pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名 即可开始安装。清华:https://pypi.tuna.tsinghua.edu.cn/simple 阿里云:http...

使用pyautogui进行屏幕捕捉实现自动化操作

import pyautogui import time # # 获取基本信息 # # 屏幕大小 # size = pyautogui.size() # print(size) #&nbs...

权大师商标查询api

''' data:2022-10-15 autor:zhangsir 权大师商标查询api ''' import requests import json import time import h...

python selenium find_element_by_xpath 方法已经被弃用的解决办法

背景:在使用最新3.10.4Python版本时候,用selenium进行xpath定位元素,编译器提示:DeprecationWarning:find_element_by_xpath is deprecated. Please use find_element(by=By.XPATH, value...

python 爬虫 报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in position”解决方案

发现报错“UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1:invalid start byte”,方法一:根据报错提示,错误原因有一条是这样的:“'Accept-Encodi...