爬取人民日报的评论员文章,碰到问题了,求解答。
新手,在学习python爬虫,环境是python3.4,想爬取人民日报评论员文章,现在只怕去了一个网页,代码如下,
import requests
from bs4 import BeautifulSoup
import re
myUrl = ".html"
response = (myUrl)
soup = , "lxml", from_encoding="gbk")
print(soup.de('ISO-8859-1').decode('gbk'))
for a in soup.find_all(style="text-indent: 2em;"):
print(de('ISO-8859-1').decode('gbk'))
网页上出错的源代码如下:
《 人民日报 》( 2016年06月13日 01 版)
我的出错提示如下:
Traceback (most recent call last):
File "pa_chong_lx.py", line 21, in
print(de('ISO-8859-1').decode('gbk'))
AttributeError: 'NoneType' object has no attribute 'encode'
原因分析:
我查找的关键词是style="text-indent: 2em;,这段代码《 人民日报 》( 2016年06月13日 01 版) 格式与前边的主题文章代码不一样,所以出错,求解答怎么改。
新手,因为编码的问题卡了好久,感觉一步一个坑,步步是坑!python虽然简单,但也正是简单,我不知道哪里出错了,或者是知道错误但不知道怎么改正。
相关阅读:
laravel的request里的get和input有区别嘛?
JavaScript 禁用提交按钮失效
pybbm的example_thirdparty
phpstrom 如何开启对swoole的支持呢?
双击div,使得变成两个宽度等分的div
RabbitMQ队列消费性能问题
如何获得局域网内指定IP的hostname?
css中百分比的值为什么会当做是有单位的?
启动jira时提示JIRALockedError.
记得以前在哪里看过一个估算时间的网站
设配手机屏幕的网站,html+js应该怎么写。
iOS通过两指捏合动作如何使一个UIView不按比例放大?
centos6.5 安装kvm
请问您所见过的最棒的一段代码是什么?
Python之禅中的namespace怎么理解?
H5 Css3 怎么实现这样一个进度条呢?精度条可以用百分比来控制
Android客户端上传文件时向后端PHP发起一个获取上传授权的请求,具体怎么实现?
关于js的模板语言mustache,求助
请用通俗的语言解释下什么是curl?
关于搜索引擎定义是否收录的文件
本文发布于:2024-02-05 06:39:23,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170726472163951.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |