当前位置:首页 > 运维 > 正文内容

python selector网页含有tbody表格,输出返回空列表

MuWinds2年前 (2023-07-06)运维192

在搓外汇API的时候,需要弄BOC爬虫去爬汇率数据,每次浏览器检查都是正常的,但在用bs4的selector后就是返回空列表:

image.png

百度翻了半天,简单说一下原因:如果不是浏览器渲染的话,是不会渲染tbody的,就和下面的这个图一样

image.png

你可以看到是没有表格结构的

解决方法也很简单,直接删除tbody节点就好

image.png

输出正常

“python selector网页含有tbody表格,输出返回空列表” 的相关文章

在 CentOS 7 上搭建属于自己的邮件系统

跟朋友整了一堆活,总得要留下邮箱收集民意~由于项目的敏感性,我们需要一个属于自己的email服务器,于是便开始搭建了。所需工具:域名,可以PTR的公网IP机器,二级域名证书原理:先安装环境:yum -y install epel-release yum up...

Zblog of Cloudflare插件

用了大约一小时的时间(包含躲着我妈写的时间)业余玩玩的插件,省的各位发完文章还得去cf purge all cachegithub项目地址:https://github.com/MuWinds/zblog_cloudflare...

zblog强制打开调试模式

之前写zblog of cloudflare插件的时候,写错了代码,因为没开调试模式我也不知道哪里报错,这里记录一下:修改 zb_system/function/c_system_base.php,将第 22 行的//注释删除掉,再保存即可。...

记录一个远古垃圾系统的维护

这次接手的是tp框架的远古收款系统,开局几个ajax认不上我已经习以为常了,反手把php版本改成7.0就恢复正常(7.0算是个兼容版本 5.x的和7.x都兼容一点 各位穷途末路了可以试试)然后呢,其他的确认过没啥毛病了,打算测试一下接口的时候,意外就来了,弹404。我知道tp框架弹404一定是代码的...

雨云CDN清除指定文件的缓存

雨云的CDN并没有给用户清除缓存的选项,想清除缓存的话其实挺麻烦的。通过浏览器对网站的请求头我们可以看到,CDN的服务器是apache apisix通过查阅apisix有关缓存的文档,我们可以发现清除缓存的方法:https://apisix.apache.org/zh/docs/apisix/2.1...

支付系统下MySQL超时问题

现在跑的支付系统在处理客户问题查询订单的时候经常查询超时锁表,导致需要刷新网页。支付系统的在数据库的特性是高更新频率,当我在排查问题的时候看到了query cache,去google了一下:MySQL查询缓存是MySQL中比较独特的一个缓存区域,用来缓存特定Query的整个结果集信息,且共享给所有客...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。