爬取人民日报

阅读: 评论:0

爬取人民日报

爬取人民日报

爬取人民日报的评论员文章,碰到问题了,求解答。

新手,在学习python爬虫,环境是python3.4,想爬取人民日报评论员文章,现在只怕去了一个网页,代码如下,

import requests

from bs4 import BeautifulSoup

import re

myUrl = ".html"

response = (myUrl)

soup = , "lxml", from_encoding="gbk")

print(soup.de('ISO-8859-1').decode('gbk'))

for a in soup.find_all(style="text-indent: 2em;"):

print(de('ISO-8859-1').decode('gbk'))

网页上出错的源代码如下:

《 人民日报 》( 2016年06月13日 01 版)

我的出错提示如下:

Traceback (most recent call last):

File "pa_chong_lx.py", line 21, in

print(de('ISO-8859-1').decode('gbk'))

AttributeError: 'NoneType' object has no attribute 'encode'

原因分析:

我查找的关键词是style="text-indent: 2em;,这段代码《 人民日报 》( 2016年06月13日 01 版) 格式与前边的主题文章代码不一样,所以出错,求解答怎么改。

新手,因为编码的问题卡了好久,感觉一步一个坑,步步是坑!python虽然简单,但也正是简单,我不知道哪里出错了,或者是知道错误但不知道怎么改正。

相关阅读:

laravel的request里的get和input有区别嘛?

JavaScript 禁用提交按钮失效

pybbm的example_thirdparty

phpstrom 如何开启对swoole的支持呢?

双击div,使得变成两个宽度等分的div

RabbitMQ队列消费性能问题

如何获得局域网内指定IP的hostname?

css中百分比的值为什么会当做是有单位的?

启动jira时提示JIRALockedError.

记得以前在哪里看过一个估算时间的网站

设配手机屏幕的网站,html+js应该怎么写。

iOS通过两指捏合动作如何使一个UIView不按比例放大?

centos6.5 安装kvm

请问您所见过的最棒的一段代码是什么?

Python之禅中的namespace怎么理解?

H5 Css3 怎么实现这样一个进度条呢?精度条可以用百分比来控制

Android客户端上传文件时向后端PHP发起一个获取上传授权的请求,具体怎么实现?

关于js的模板语言mustache,求助

请用通俗的语言解释下什么是curl?

关于搜索引擎定义是否收录的文件

本文发布于:2024-02-05 06:39:23,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170726472163951.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:快讯
标签:人民日报
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23