python selenium如何获取下一页的html网页源码

作者&投稿:仰孔 (若有异议请与网页底部的电邮联系)
python下用selenium的webdriver包如何取得打开页面的html源代码呢~

这个可以通过浏览器自带的f12 。
或者通过鼠标右键,审计元素获得当前html源代码。
步骤如下:
使用框架载入形式,代码如下:
代码解析:
src="123.htm" 载入的页面 。
scrolling=no 有3个选择 分别为yes no auto 这个就是设置下拉条的,yes为有下拉条,no
为没有,auto为自动识别。
width=500 载入页面的宽度 。
height=500 载入页面的高度 。
bordercolor="#000000" 载入页面的背景颜色 。
提示:只要复制我那句代码,然后再把宽度和高度设置成你想要的。

driver = webdriver.Chrome()
//driver获取下一页之后
driver.page_source

一开始,基本上很多人都是用selenium IDE录制脚本开始的,我也是!有一本书写得很不错:selenium初学者指南!So,从录制回放开始我的selenium,而在这个过程中,不断地去补充我的html css知识,熟悉selenium的api!

慢慢地,发现录制的脚本在回放的时候经常报错,通过检查发现,是定位上的错误,导致这种定位的错误的最大原因是系统前端采用了某种框架,如tigerUI,exj....所以HTML里面的标签很多都是动态的,比如id,class,name!这对selenium操作定位的元素而进行自动化来说是致命伤!

所以,开始自己写定位信息,这已经是必须的了!从而学习了xpth和css选择器,掌握了更加有效,快速和稳定地定位页面上的元素(定位的时候难免会碰到有iframe,这就得先切换到iframe中再进行定位了)!也就是,在selenium IDE上写脚本!

信心满满地在selenium IDE上写了长长地一段脚本,并且反复跑都能成功!总算尝到了一点点幸福的滋味!然后呢,问题来了,当我要修改和扩展这段的脚本的时候,才发现这效率是相当地低!一句句查!一句句改!多么痛的领悟!

另外,selenium IDE 默认启动的是火狐,在使用selenium RC 启动 IE 进行跑脚本时浏览器总是会报错!各种搞不定,各种不淡定!决定放弃使用IDE!

selenium有一个强大之处就是支持多种语方:java,C#,python等等,并且可以把录制的脚本转换成代码!我用的是java,果断走起!

不用说,当然是把脚本转为java代码了,在E www.hbbz08.com clipse中重新开始搞!

选择一个测试框架:有Junit和TestNg两个选择,公司用的是junit,所以,不用多说,我就用junit验证selenium脚本的运行结果!并且,Junit和TestNG都可以生成比较直观的测试报告!

写好一些代码,会看到整段代码中密密麻麻充斥着基本相同的代码:开始封装代码!把常用到API封装起来!封装好之后代码看着就舒服多了!

接下来,是不是也应该把代码中的定位信息用一个专门的文件放起来,再去读取里面的定位信息,这样,维护代码和维护定位信息就放在了两个地方,不用老是扎在代码和定位路径中,简单地分一下层!果断尝试!


麻江县18375759597: 如何运行python selenium -
楚花复方: 如何运行python selenium1、下载Python2.7版本,默认运行安装即可; 2、安装完成之后,设置Python环境变量C:\Python27(操作步骤: 电脑->属性->高级->环境变量->系统变量中的PATH为:变量值: ;C:\Python27 ) 3、在python的官方网站...

麻江县18375759597: 如何在Python中使用Selenium -
楚花复方: 在selenium当中,一个元素找不到时它会自动不变的寻找,你可以在Python中设置一定的时间或者次数,当执行完这N次之后事还是没有找到,则返回false;或者是selenium在找不到该元素时会抛出异常,你可以使用python捕捉异常,然后返回false

麻江县18375759597: 怎么使用python进行selenium -
楚花复方: 你的login方法在使用driver的时候要先导入或者把driver作为参数传给login方法,但是我建议在login的方法里面,初始化webDriver,另外就是建议你使用class封装,这样比较方便

麻江县18375759597: 如何在python中使用selenium -
楚花复方: 首先要确保已经安装了selenium,如果没有问度娘怎么安.代码使用方法from selenium import webdriverdriver=webdrive.Ie()......

麻江县18375759597: python怎么添加selenium模块 -
楚花复方: 1、下载Python2.7版本,默认运行安装即可; 2、安装完成之后,设置Python环境变量C:\Python27(操作步骤: 电脑->属性->高级->环境变量->系统变量中的PATH为:变量值: ;C:\Python27 )

麻江县18375759597: 如何搭建Python3.4+Selenium -
楚花复方: 详细步骤: 1.下载32位的python3.4 ,安装,注意在安装过程中,选择pip2.添加系统环境变量C:\Python34;C:\Python34\Scripts;C:\Program Files\Google\Chrome\Application(后面会用到)3.使用pip命令,安装selenium cd Python34 然后输入: ...

麻江县18375759597: 如何用python的selenium提取页面所有资源加载的链接 -
楚花复方: 最近需要写一个爬虫,逻辑上有一个环节是取得一个页面的所有资源加载链接(html5页面) (ps:python下的确是是有个第三方包叫Ghost.py可以取得,但是尝试后效果并不好,估计是因为Ghost.py的webkit对html5的支持并不好.) 选择用...

麻江县18375759597: python selenium自动化测试应该怎么 -
楚花复方: 使用python的单元测试框架,可以建立测试类,构造测试集. 测试类中包含了common的测试方法定义,包括测试开始前建立测试环境的setUp方法和测试完成后清理还原环境的tearDown方法,最好按照约定规则(以test开头)来命名所有的测试方法.

麻江县18375759597: Windows下怎么搭建Python+Selenium的自动化环境 -
楚花复方: 环境搭建步骤(Windows7,64位): 第一步:安装Python 第二步:安装Python的SetupTools 第三步:安装Python的包管理工具 pip 第四步:安装基于Python的Selenium包 第五步:验证Selenium安装是否成功 第六步:python的开发环境配置 第七步:kinitter框架依赖的第三方python包【64位】

麻江县18375759597: 如何用python的selenium提取页面所有资源加载的链接 -
楚花复方: 用浏览器打开你那个连接(完整加载),通过 查看源 找到你要的数据(记住标记,比如某个元素),selenium+python获取到页面代码再去判断查找你的标记就知道是否加载完了.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网