python selenium如何获取下一页的html网页源码

作者&投稿：仰孔（若有异议请与网页底部的电邮联系）

python下用selenium的webdriver包如何取得打开页面的html源代码呢~

这个可以通过浏览器自带的f12 。
或者通过鼠标右键，审计元素获得当前html源代码。
步骤如下:
使用框架载入形式，代码如下：
代码解析：
src=＂123.htm＂载入的页面。
scrolling=no 有3个选择分别为yes no auto 这个就是设置下拉条的，yes为有下拉条，no
为没有，auto为自动识别。
width=500 载入页面的宽度。
height=500 载入页面的高度。
bordercolor=＂#000000＂载入页面的背景颜色。
提示：只要复制我那句代码，然后再把宽度和高度设置成你想要的。

driver = webdriver.Chrome()
//driver获取下一页之后
driver.page_source

一开始，基本上很多人都是用selenium IDE录制脚本开始的，我也是！有一本书写得很不错:selenium初学者指南！So，从录制回放开始我的selenium，而在这个过程中，不断地去补充我的html css知识，熟悉selenium的api！

慢慢地，发现录制的脚本在回放的时候经常报错，通过检查发现，是定位上的错误，导致这种定位的错误的最大原因是系统前端采用了某种框架，如tigerUI,exj....所以HTML里面的标签很多都是动态的，比如id，class，name！这对selenium操作定位的元素而进行自动化来说是致命伤！

所以，开始自己写定位信息，这已经是必须的了！从而学习了xpth和css选择器，掌握了更加有效，快速和稳定地定位页面上的元素（定位的时候难免会碰到有iframe，这就得先切换到iframe中再进行定位了）！也就是，在selenium IDE上写脚本！

信心满满地在selenium IDE上写了长长地一段脚本，并且反复跑都能成功！总算尝到了一点点幸福的滋味！然后呢，问题来了，当我要修改和扩展这段的脚本的时候，才发现这效率是相当地低！一句句查！一句句改！多么痛的领悟！

另外，selenium IDE 默认启动的是火狐，在使用selenium RC 启动 IE 进行跑脚本时浏览器总是会报错！各种搞不定，各种不淡定！决定放弃使用IDE！

selenium有一个强大之处就是支持多种语方：java,C#,python等等，并且可以把录制的脚本转换成代码！我用的是java，果断走起！

不用说，当然是把脚本转为java代码了，在E www.hbbz08.com clipse中重新开始搞！

选择一个测试框架：有Junit和TestNg两个选择，公司用的是junit，所以，不用多说，我就用junit验证selenium脚本的运行结果！并且，Junit和TestNG都可以生成比较直观的测试报告！

写好一些代码，会看到整段代码中密密麻麻充斥着基本相同的代码：开始封装代码！把常用到API封装起来！封装好之后代码看着就舒服多了！

接下来，是不是也应该把代码中的定位信息用一个专门的文件放起来，再去读取里面的定位信息，这样，维护代码和维护定位信息就放在了两个地方，不用老是扎在代码和定位路径中，简单地分一下层！果断尝试！

麻江县18375759597： 如何运行python selenium - ？
楚花复方： 如何运行python selenium1、下载Python2.7版本,默认运行安装即可; 2、安装完成之后,设置Python环境变量C:\Python27(操作步骤: 电脑->属性->高级->环境变量->系统变量中的PATH为:变量值: ;C:\Python27 ) 3、在python的官方网站...

麻江县18375759597： 如何在Python中使用Selenium - ？
楚花复方： 在selenium当中,一个元素找不到时它会自动不变的寻找,你可以在Python中设置一定的时间或者次数,当执行完这N次之后事还是没有找到,则返回false;或者是selenium在找不到该元素时会抛出异常,你可以使用python捕捉异常,然后返回false

麻江县18375759597： 怎么使用python进行selenium - ？
楚花复方： 你的login方法在使用driver的时候要先导入或者把driver作为参数传给login方法,但是我建议在login的方法里面,初始化webDriver,另外就是建议你使用class封装,这样比较方便

麻江县18375759597： 如何在python中使用selenium - ？
楚花复方： 首先要确保已经安装了selenium,如果没有问度娘怎么安.代码使用方法from selenium import webdriverdriver=webdrive.Ie()......

麻江县18375759597： python怎么添加selenium模块 - ？
楚花复方： 1、下载Python2.7版本,默认运行安装即可; 2、安装完成之后,设置Python环境变量C:\Python27(操作步骤: 电脑->属性->高级->环境变量->系统变量中的PATH为:变量值: ;C:\Python27 )

麻江县18375759597： 如何搭建Python3.4+Selenium - ？
楚花复方： 详细步骤: 1.下载32位的python3.4 ,安装,注意在安装过程中,选择pip2.添加系统环境变量C:\Python34;C:\Python34\Scripts;C:\Program Files\Google\Chrome\Application(后面会用到)3.使用pip命令,安装selenium cd Python34 然后输入: ...

麻江县18375759597： 如何用python的selenium提取页面所有资源加载的链接 - ？
楚花复方： 最近需要写一个爬虫,逻辑上有一个环节是取得一个页面的所有资源加载链接(html5页面) (ps:python下的确是是有个第三方包叫Ghost.py可以取得,但是尝试后效果并不好,估计是因为Ghost.py的webkit对html5的支持并不好.) 选择用...

麻江县18375759597： python selenium自动化测试应该怎么 - ？
楚花复方： 使用python的单元测试框架,可以建立测试类,构造测试集. 测试类中包含了common的测试方法定义,包括测试开始前建立测试环境的setUp方法和测试完成后清理还原环境的tearDown方法,最好按照约定规则(以test开头)来命名所有的测试方法.

麻江县18375759597： Windows下怎么搭建Python+Selenium的自动化环境 - ？
楚花复方： 环境搭建步骤(Windows7,64位): 第一步:安装Python 第二步:安装Python的SetupTools 第三步:安装Python的包管理工具 pip 第四步:安装基于Python的Selenium包第五步:验证Selenium安装是否成功第六步:python的开发环境配置第七步:kinitter框架依赖的第三方python包【64位】

麻江县18375759597： 如何用python的selenium提取页面所有资源加载的链接 - ？
楚花复方： 用浏览器打开你那个连接(完整加载),通过查看源找到你要的数据(记住标记,比如某个元素),selenium+python获取到页面代码再去判断查找你的标记就知道是否加载完了.

你可能想看的相关专题

星空见康网

python selenium如何获取下一页的html网页源码

你可能想看的相关专题