selenium 元素定位
selenium 元素定位
PupperSeleniumy元素定位
Chrome 浏览器元素定位插件 — Ranorex Selocity
地址 : https://chrome.google.com/webstore/detail/ranorex-selocity/ocgghcnnjekfpbmafindjmijdpopafoe
一、 webUI自动化
1. 什么是UI自动化测试
- 通过代码来模拟人的手工操作,执行测试内容
- 自动化是为了代替重复的手工操作,提高测试效率,不是为了装x
2. UI 自动化的价值
- 回归速度的对比,以前进行全量回归测试需要x天,现在有没有减少
- 负责功能测试的同事,是不是有更多的时间测试新需求了
- 自动化测试不是为了发现bug,而是为手工测试节省回归时间
3. UI 自动化原理 selenium 与 webdriver
selenium
是一个用于web测试的工具,测试运行在浏览器当中
webdriver
对浏览器原生的api进行封装,使用这套api可以操作浏览器的操作页面元素、截屏等
我们使用selenium进行自动化,主要涉及三个方面:
- 测试脚本,就是你我写的代码
- 浏览器,目前支持所有的主流浏览器
- 浏览器驱动,充当翻译官的角色
- 脚本将指令发给驱动,驱动操作浏览器
- 浏览器执行后将结果返回给驱动,驱动再告诉脚本
二、 元素定位
1. id定位
通过了解HTML可以知道 id 是唯 一表示,通过查找id的方法进行查找
1 | find_element_by_id() |
2. name 定位
name 在HTML中通常指元素的名称
1 | find_element_by_name() |
3. tag 定位(标签)
通过 HTML 可以了解到 tag 定义不同页面的元素。
1 | driver.find_element_by_tag_name("") |
4. class定位
通过HTML了解到class是指元素的类名
若 class 属性有空格,证明是复合类,多个值以空格区分
1 | find_element_by_class_name() |
5. link_text定位
link_text从字面意思上了解到是通过文本的形式进行定位的
text 可以获取元素的文本值
1 | find_element_by_link_text() |
6. partial_link定位
partial_link 是属于 link_text 的补充定位方法,定位一些文本比较长的内容
1 | find_element_by_partial_link_text() |
三、 xpath 高级语法
XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。
1. 标准语法
1 | Xpath=//tagname[@attribute='value'] |
//
: 选择当前节点Tagname
: 节点标签名@
: 选择属性Attribute
:节点属性名value
: 属性值
xpath 定位方式, webdriver 会将整个页面的 所有元素 进行扫描以定位我们所需要的元素, 这是个 非常费时 的操作, 如果脚本中大量使用 xpath 做元素定位的话, 脚本的执行速度会明显变慢。
2. xpath绝对路径定位元素
绝对路径 : 从根节点一层层地搜索到需要被定位的页面元素,
绝对路径 正斜杠(/)
开始,每一步均被斜杠分割。
xpath定位表达式:
1 | /html/body/div/input[@value="查询"] |
python定位语句:
1 | element = driver.find_element_by_xpath('/html/body/div/input[@value="查询"]') |
路径表达式
“/”
表示跟节点。使用绝对历经定位是十分脆弱的,因为即便页面代码结构只发生了微小的变化,也可能会造成原先有效的xpath定位表达式定位失败。
3. xpath相对路径定位元素
相对路径 :以 //
开始,可以从 HTML 任何位置开始
xpath定位表达式:
1 | //div[@value='查询'] |
python定位语句:
1 | element = driver.find_element_by_xpath('//div[@value='查询']') |
input[@value="查询"]
表示定位 value 值为 “查询” 两个字的 input 页面元素。相对路径的xpath定位表达式更加简洁,不管页面发生了何种变化,只要input标签的value属性值没变,始终都可以定位到。
4. xpath使用索引号定位元素
索引号 : 表示某个被定位的页面元素在其父元素节点下的同名元素中的位置符号,需要从1开始。
xpath定位表达式:
1 | //input[1] |
python定位语句:
1 | element=driver.find_element_by_xpath("//input[1]") |
上述 xpath 定位表达式表示查找页面中 第二个 出现的 input 元素
基于实例中的被测网页,下面给出更多的通过索引号定位的实例
预期定位圆面的元素 | 定位表达式实例 | 使用的属性值 |
---|---|---|
定位第二个div下的超链接 | //div[last()]/a | div[last()]表示最后一个div元素,last()函数获取的是指定元素的最后的索引号 |
定位第一个div中的超链接 | //div[last()-1]/a | div[last()-1]表示倒数第二个div元素 |
定位最前面一个属于div元素的子元素中的input元素 | //div/input[position()<2] | position()函数获取当前元素input的位置序号 |
5. xpath使用页面元素的属性值定位元素
xpath定位表达式:
1 | //input[@alt='div1-img1'] |
python定位语句:
1 | img = driver.find_element_by_xpath("//input[@alt='div1-img1']") |
下面给出更多的定位实例。
预定位的页面元素 | 定位表达式实例 | 使用的属性值 |
---|---|---|
定位页面的第一张图片 | //img[@href=”http://www.sogou.com“] | 使用img标签的属性href值 |
定位第二个div中第一个input输入框 | //div[@id=”div2”]/input[@name=”div2input”] 或者 //inuput[@name=”div2input”] | 使用div变迁的name值使用input标签的name属性值 |
定位第一个div中的第一个链接 | //div[@id=”div1”]/a[@href=”http://www.sogou.com“] | 使用div标签的ID属性值使用a标签的href属性值 |
定位页面的查询按钮 | //input[@type=”button”] | 使用input标签的type属性值 |
6. xpath使用模糊属性值定位元素
模糊属性值定位方式 : 表示使用属性值的一部分内容定位。
xpath函数 | 定位表达式实例 | 表达式解释 |
---|---|---|
starts-with(str1,str2) | //img[starts-with(@alt,”div1”)] | 查找属性alt的属性值以div1关键字开始的页面元素 |
contains(str1,str2) | //img[contains(@alt,”img”)] | 查找alt属性的属性值包含img关键字的页面元素,只要包含即可,无需考虑位置 |
contains函数属于xpath的高级用法,使用场景比较多,尽管页面元素的属性值经常变化,但只要其属性值有几个固定不变的关键词,就可以使用cotains函数进行定位。
7. xpath使用xpath轴定位元素
轴可以定义相对于当前节点的节点集。
使用xpath定位方式可以根据再文档树中的元素相对位置关系进行页面元素定位。先找到一个相对好定位的元素,让它作为轴,根据它和要定位元素间的相对位置关系进行定位,可解决一些点定位难的问题。
我们根据被测页面的代码来画一下结构图:
xpath常用轴关键字:
xpath轴关键字 | 轴的含义说明 | 定位表达式实例 | 表达式解释 |
---|---|---|---|
parent | 选择定钱节点的上一层父节点 | //img[@alt=’div2-img2’]/parent::div | 查找到属性alt的属性值为div2-img2的img元素,并基于该img元素的位置找到它上一级的div页面元素 |
child | 选择当前节点的下层所有子节点 | //div[@id=’div1’]/child::img | 查找到ID属性值为div1的div元素,并基于div的位置找到它下层节点中的img页面元素 |
ancestor | 选择当前节点所有上层节点 | //img[@alt=’div2-img2’]/ancestor::div | 查找到属性alt的属性值为div2-img2的img元素,并基于该img元素的位置找到它上级的div元素 |
descendant | 选择当前节点所有下层的节点(子,孙等) | //div[@name=’div2’]/descendant::img | 查找到属性name的属性值为div2的div元素,并基于该元素的位置找到它下级所有节点中的img页面元素 |
following | 选择当前节点之后显示的所有节点 | //div[@id=’div1’]/following::img | 查找到ID属性值为div1的div页面元素,并基于div的位置找到它后面节点中的img页面元素 |
following-sibling | 选择当前节点后续所有兄弟节点 | //a[@href=’http://www.sogou.com']/following-sibling::input | 查找到链接地址为http://www.sogou.com的链接页面元素a,并基于链接的位置找到它后续兄弟节点中的input页面元素 |
preceding | 选择当前节点前面的所有节点 | //img[@alt=’div2-img2’]/preceding::div | 查找到属性alt的属性值为div2-img2的图片页面元素img,并基于图片的位置找到它前面节点中的div页面元素 |
preceding-sibling | 选择当前节点前面的 所有兄弟节点 | //input[@value=’查询’]/preceding-sibling::a[1] | 查找到value属性值为“查询”的输入框页面元素,并基于该输入框的位置找到他前面同级节点中的第一个链接页面元素 |
有时候我们会再轴后面加一个星号, 便是通配符,如://input[@value=”查询”]/preceding::,它表示查找属性value的值为“查询”的输入框input元素前面所有的同级元素,但不包括input元素本身
8. xpath使用页面元素的文本定位元素
通过text()函数可以定位到元素文本包含某些关键内容的页面元素。
xpath表达式:
1 | //a[text()="搜狗搜索"] |
python定位语句:
1 | sogou_a=driver.find_element_by_xpath('//a[text()="搜狗搜索"]') |
代码解释
xpath表达式1和表达式2等价,都是查找文本内容为“搜狗搜索”的链接页面元素,使用的是精准匹配方式,也就是说文本内容必须完全匹配,不能多一个字也不能少一个字。第二个xpath语句中使用了以个点. 这里的点等价于text(),都指代的是当前节点的文本内容
xpath表达式3和表达式4等价,都是查找文本内容包含“百度”关键字的链接页面元素,使用的是模糊匹配方式,即可以根据部分文本关键字进行匹配。
xpath表达式5和表达式6等价,都是查找文本内容包含“百度”关键字的链接页面元素a的上层父元素div,6最后使用了两个点。。,它表示选取当前节点的父节点,等价于preceding::div。
使用文本内容匹配模式进行定位,为定位复杂元素又提供了一种强大的定位模式,再遇到定位困难时,可以优先考虑使用此方式进行定位。建议大家对此定位方式进行练习,一边做到随意定位页面的任意元素。
四、 css 定位
Css是一种语言,通常Css定位方法的速度比xpath的快,就是稍微有点难,爬虫中的pyquery就是通过Css的方法来实现的。
1 | find_element_by_css_selector() |
1. 使用绝对路径定位元素
CSS定位方式:
1 | html > body > div >input[value="查询"] |
Python定位语句:
1 | element = driver.find_element_by_css_selector('html > body > div >input[value="查询"]') |
从CSS定位表达式可以看出,步间通过“>”分割,区别于XPATH路径中的正”/“,并且也不再使用@符号选择属性。
2. 使用相对路径定位元素
CSS定位表达式:
1 | input[value="查询"] |
Python定位语句:
1 | element = driver.find_element_by_css_selector('input[value="查询"]') |
3. 使用class名称定位元素
CSS定位表达式:
1 | css.spread |
python定位语句:
1 | element = driver.find_element_by_css_selector('css.spread') |
用点.
分割元素名与class属性名,点号后面是 class属性名称
4. 使用ID属性值定位元素
CSS定位语句:
1 | input#div1input |
Python定位语句:
1 | element = driver.find_element_by_css_selector('input#div1input') |
使用#
号分割 元素名 和 ID属性值,# 后面是 ID属性值
5. 使用页面其他属性值定位元素
CSS定位表达式:
1 | img[alt="div1-img1"] |
Python定位语句:
1 | element = driver.find_element_by_css_selector('img[alt="div1-img1"]') |
表达式1和表达式2是等价的,都是定位第一个img元素
表达式1:表示使用img页面元素的alt元素的属性值div1-img1进行定位。
- 若定位的页面元素始终具有唯一的属性值,此定位方式可以解决很多频繁变动的页面元素
- 表达式2:表示同时使用了img页面元素的alt和href属性进行页面元素的定位。
- 在某些复杂的定位场景,可使用多个属性来确保定位元素的唯一性。
6. 使用属性值的一部分内容定位元素
CSS定位表达式:
1 | a[href^="http://www.so"] |
Python定位语句:
1 | element = driver.find_element_by_css_selector('a[href^="http://www.so"]') |
^
指明从字符串的开始匹配$
指明在字符串的结尾匹配*
指明在需要进行模糊查询
使用此模糊定位方式,可匹配动态变化的属性值的页面元素,只要找到属性值固定不变的关键部分,就可以进行模糊匹配定位。
7. 使用页面元素进行子页面元素的查找
CSS定位表达式:
1 | 1 div#div1>input#div1input |
Python定位语句:
1 | 1 element=driver.find_element_by_css_selector("div#div1>input#div1input") |
表达式1中的div#div1,表示在被测试网页上定位到ID属性值为div1的div页面元素,> 表示在以查找到的div元素的子页面元素中进行查找,input#div1input表示查找ID属性值为div1input的input页面元素,此方法可实现查找div下子页面元素的办法
表达式2表示匹配所有属于div元素后代的input元素,表达式中父元素div和子元素input中间需用空格分割,注意此表达式是定位一组input元素,并不是单个input元素
8. 使用伪类定位元素
CSS定位表达式:
1 | div#div1 :first-child |
Python定位语句:
1 | element=driver.find_element_by_css_selector("div#div1 :first-child") |
伪类表达式 :是CSS语法支持的定位方式,前3个表达式特别注意的是 在冒号前一定要有一个空格,否则定位不到想要定位的元素
表达式1表示查找ID属性值为div1的div页面元素下的第一个子元素,根据被测试网页定位的是div下的input元素,first-child表示查找某个页面元素下的第一个子页面元素
表达式2表示查找ID属性值为div1的div页面元素下的第二个子元素,参照被测网页,定位到的页面元素是一个链接元素
表达式3表示查找ID属性值为div1的div页面元素下的最后一个子元素,根据被测试网页定位的是一个按钮元素;last-child表示的是查找某个页面元素下的最后一个子页面元素
表达式4 表示查找当前获取焦点的input页面元素
表达式5表示查找可操作的input元素
表示查找处于勾选状态的checkbox页面元素
表示查找所有无id属性的input页面元素
9. 查找同级兄弟页面元素
CSS定位表达式:
1 | div1#div1 > input + a |
Python定位语句:
1 | element=driver.find_element_by_css_selector("div1#div1 > input + a") |
表达式1表示在ID属性值为div1的页面元素下,查找input页面元素后的同级的且相邻的链接元素 a
表达式2表示在ID属性值为div1的页面元素下,查找input元素和链接元素a后面相邻的图片元素img
表达式3表示在ID属性值为div1的页面元素下,创造找input页面元素和任意一种页面元素后面的同级且相邻的图片元素img,
*
表示任意类型的一个页面元素,只能表示一个元素,如果想用此方法查找第一个div下的最后一个input元素,表达式写法为1
2
3
4
5div#div1 > input + * + * + input
或
div#div1 > input + a + * + input
或
div#div1 > input + a + img + input
表达式4表示 ID 属性值为 recordlist 的 ul 页面元素下,查找 p 页面元素以后所有的 li 元素
10. 多元素选择器
CSS定位表达式支持多元素选择器,也就是一次可以同时选择多个相同的标签,也可以同时选择多个不同的标签,不同标签间用英文的逗号隔开
CSS定位表达式:
1 | div#div1,input,a |
Python定位语句:
1 | element=driver.find_elements_by_css_selector("div#div1,input,a') |
上面的css表达式表示同时查找所有ID属性值为 div1 的 div 元素,所有的 input 元素,所有的 a 元素
五、 另类定位方法
1. 导入 By 方法
1 | from selenium.webdriver.common.by import By |
2. 使用方法
1 | inputElement = driver.find_element(By.ID, "58680504-89fc-42d4-ab86-afc9456f880e") |
1 | # 同样也有对应的获取列表的方法 |