python3.7爬虫使用xpath解析，获取的表格数据为什么不全面?

作者&投稿：濮种（若有异议请与网页底部的电邮联系）

用Python爬取网页并用xpath解析，得到一个内容相同的集合，为什么~

问题出在你每次得到的都是同一个list 每次取list[0] 当然永远是重复的第一个元素。
问题出在这个//*[@id="newsRegion"]/ul/li 取得的所有的li不是一个个别的li。返回的list 虽然有几十个元素，但每一个用后面的xpath匹配都是可以得到相同的结果

内部网站不能访问，你用无登录打开这个网站会自动跳转，所以就没内容了。
爬中国人民银行想干嘛？拿电影、小说网站爬爬不好吗？

我认为是xpath默认提取xpath第一个tr属性了，xpath 表达式改成'//div[@class="row"]//table//tr[@height="38px" or @height=""]'

要不尝试一下css selector?
response. css(... ). getall()
或者就用个for循环，在每个xpath的tr后加上[i]

试试这个
t = response.xpath('//table').extract()[0]
import re

print(re.sub(p1,"",t))

python3.7 idle怎么安装
python 3.7 idle安装的方法：1、下载一个Python idle程序安装包。进入Python的官网网站，找到Downloads区，点击进去，找到3.7版本安装包。2、找到刚下载的Python程序安装包，双击打开，运行安装程序。一般无需要过多设置，直接点击下一步，直至安装成功，点击完成就可以了。如果想切换安装目录的朋友，可以...

初入Python(3.7),但写一个最简单的print语句,却提示报错,请各位看看怎 ...
这个错误提示是由于在Python解释器中引用了一个未定义的变量tangwenxin导致的。可能是因为你在代码中使用了tangwenxin这个变量，但是在之前没有对它进行定义或赋值。建议检查一下你的代码，看看是否有这个变量的定义和赋值操作。如果没有，可以考虑添加相应的定义和赋值操作来解决该问题。另外，还需要注意变量...

Python 3.7 将引入 dataclass 装饰器
Python 3.7 的新亮点之一是即将引入的 dataclass 装饰器，这将极大地简化开发过程，尤其对于处理简单数据类的初始化和自动生成方法。在Python 3.7中，dataclass将改变我们编写基础类的方式。原本需要手动编写__init__方法，如：通过dataclass，这种繁琐的初始化可以被自动处理。例如，星球大战 API 的资源...

我在python3.7版本中装不了requests库 ,系统提示我升级pip?
首先，先升级一下pip。pip install --upgrade pip 若报错进行pip换源。第一步：在我的电脑中目录栏输入%APPDATA%，然后在目录中新建文件夹，改名为pip，进入pip文件夹，创建文本文档命名为：pip 第二步：编辑这个文本输入以下命令：[global]timeout = 6000 index-url = https:\/\/pypi.tuna.tsinghua....

python3.10和3.7的区别
在 Python 3.9 中创建了一个名为 zoneinfo 的新模块，通过此模块，您可以访问 IANA 或互联网号码分配机构时区数据库，默认情况下，此模块使用系统的本地时区数据，但是3.7就并没有这个模块，导致在默认情况下并不能系统的显示出本地的具体数据。对于3.7来说也有其有点，在于Python 3.97增加了另...

python和python3哪个好
许多刚入门 Python 的朋友都在纠结的的问题是：我应该选择学习 python2 还是 python3，Python 3.7 已经发布了，目前Python的用户，主要使用的版本应该是 Python3.6 和 Python2.7 ，那么是不是该转到 Python 3.7 呢？首先先说一下python2与python3的选择许多刚入门 Python 的朋友都在纠结的的...

python怎么安装运行
python怎么安装运行？1. 安装Python 3.7目前，Python有两个版本，一个是2.x版，一个是3.x版，这两个版本是不兼容的。由于3.x版越来越普及，我们的教程将以最新的Python 3.7版本为基础。请确保你的电脑上安装的Python版本是最新的3.7.x。推荐：《python教程》下载地址：https:\/\/www.python.org...

python3.12和3.7通用吗?
可以通用的。Python3的各个版本之间是向上兼容的。这意味着使用Python3.6编写的代码可以在Python3.7、3.8、3.9、3.10、3.11和3.12等版本中运行。存在一些仅在此版本中引入的新特性或更改。但不影响其通用性。

python37idle-快捷方式
首先，回答问题：“python37idle-快捷方式”通常指的是一个指向Python 3.7版本中IDLE（Integrated Development and Learning Environment）的快捷方式。这个快捷方式可以让用户更方便地启动IDLE，进而编写、运行和调试Python代码。Python是一种广泛使用的编程语言，而IDLE是Python自带的一个集成开发环境...

怎么看python版本
Python版本指的是Python编程语言的特定版本。Python有多个版本，每个版本都有不同的功能、语法和兼容性。每个版本都会引入新的特性、修复错误和改进性能。Python的版本号采用主版本号.次版本号的格式。例如，Python 3.7和Python 3.8是两个不同的版本。主版本号表示重大更新或不兼容的改变，而次版本号...

肇源县18318258446： python 爬虫代码有了爬虫代码怎么运行 - ？
全哄再普： 打开python爬虫代码的源码目录,通常开始文件为,init.py,start.py,app.py寻找有没有类似的python文件,如果没有,请看源码的readme文件,里面会有说明,若以上都没有,你可能需要python方面的知识,自己去看源码,找到入口方法并运行找到入口文件后,在当前目录打开控制台,输入python 正常情况下会出现下图的提示,若没有,请检查当前pc的python环境是否有被正确安装最后,运行入口文件,输入python ***.py(入口文件),运行爬虫

肇源县18318258446： python3.5 网页爬虫方法有哪些 - ？
全哄再普： 爬取来说的话,模块有:request、urllib2、pycurl 框架有:scrapy 解析网页有:xpath、美丽的汤、正则、lxml 就接触过这么多二营长SEO

肇源县18318258446： 用Python写爬虫,用什么方式,框架比较好 - ？
全哄再普： Beautiful Soup.名气大,整合了一些常用爬虫需求.缺点:不能加载JS.Scrapy.看起来很强大的爬虫框架,可以满足简单的页面爬取(比如可以明确获知url pattern的情况).用这个框架可以轻松爬下来如亚马逊商品信息之类的数据.但是对...

肇源县18318258446： mac上用xcode怎么写python爬虫 - ？
全哄再普： mac用来写python爬虫可以 Linux下运行Python程序,一般说来有以下两种形式,其实和Windows下基本一样.一、在IDLE中运行在终端窗口输入$ python进入交互式运行环境,然后就可以边输入边执行代码了:>>> print 'Hello Python' Hello Python>>>退出使用Ctrl-D.二、以脚本方式运行在py脚本所在目录下输入

肇源县18318258446： python爬虫怎么抓包 - ？
全哄再普： 方案:1. 自己通过request库手动编写2. 使用python的爬虫库scrapy 最推荐的一种:使用python的爬虫库scrapy 推荐理由:1. 应用最广泛的爬虫框架,没有之一2. 成熟度最高的框架,没有之一3. 利用成熟产品,避免重复“造轮子”,可以更快速的构建项目

肇源县18318258446： 如何入门 Python 爬虫 - ？
全哄再普： 可以先从简单的开始,在熟悉了Python语法后,学习用 urllib 和 urllib2 爬虫,使用 BeautifulSoup 分析结果.进一步学习多线程抓取. 如果要学习一个框架,可以学 Scrapy,并学习将XPath得到的结果存入到SQL或Redis等数据集中以便方便索引查找. 简单的学会后,再开始练习登录界面(带Cookie),再进一步使用无图形界面的js处理工具,用来处理JS界面的网页. 当然,这些抓取数据只是数据处理的第一步,难点还是在处理这些数据结果.不过已经不是爬虫的范围了.

肇源县18318258446： 如何用python3爬虫处理分页问题具体如图 - ？
全哄再普： 使用requests模块的post方法,采集数据. 给你个例子吧,哎,10分少了点. # -*- coding:utf-8 -*-import requestsdatas = {'year_id': 2017, 'quarter_id': 1, 'CsrfCheckCode': 'g9zcdo'}re_url = requests.post('http://www.aeps-info.com/aeps/ch/reader/issue_list.aspx', data=datas) print(re_url.text)

肇源县18318258446： 如何运行python使得进行爬虫 - ？
全哄再普： 在pom.xml 中添加如下内容: <dependency><groupId>org.apache.thrift</groupId> <artifactId>libthrift</artifactId> <version>0.9.0</version> </dependency> <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-log4j12</artifactId> <version>1.5.8</version> </dependency>

肇源县18318258446： 怎么样在Python中制作简单的网页爬虫 - ？
全哄再普： 推荐使用Requests + BeautifulSoup框架来写爬虫,Requests用来发送各种请求,BeautifulSoup用来解析页面内容,提取数据.当然Python也有一些现成的爬虫库,例如Scrapy,pyspider等.

你可能想看的相关专题

星空见康网

python3.7爬虫使用xpath解析，获取的表格数据为什么不全面?

你可能想看的相关专题