当前位置：首页 > python > 正文内容

python 爬虫报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in position”解决方案

zhangsir3年前 (2022-10-27)python391

发现报错“UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1：invalid start byte”，

方法一：

根据报错提示，错误原因有一条是这样的：

“'Accept-Encoding': 'gzip, deflate'”

网络上的解释是：

这句话的意思是本地接收压缩格式的数据，服务器传过来压缩格式gzip的文件，而解压这种gzip文件只能用deflate算法，浏览器能够自动解压，程序却不能自动解压gzip。

总结：写爬虫程序时候还是不要写'Accept-Encoding': 'gzip, deflate'了，就让服务器传原始文件过来吧，不用压缩了。

方法二：

利用gzip进行解压缩。

python3 ：

import gzip
import urllib.request
response_1 = urllib.request.urlopen('').read()
data=gzip.decompress(response_1).decode("utf-8")

zhangsir版权k3防采集https://mianka.xyz

扫描二维码推送至手机访问。

本文链接：https://www.mianka.xyz/post/52.html

标签: python 爬虫

分享给朋友：

返回列表

上一篇：python selenium find_element_by_xpath 方法已经被弃用的解决办法

下一篇：python 实现彩色图转素描图

“python 爬虫报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in position”解决方案” 的相关文章

Python爬虫xpath详解

一、xpath介绍xpath是一门在 XML 文档中查找信息的语言。最初是用来搜寻 XML 文档的，但同样适用于 HTML 文档的搜索。所以在做爬虫时完全可以使用 XPath 做相应的信息抽取。二、安装lxmllxml是Python的一个第三方解析库，支持HTML和XML解析，而且效率非常高，弥补了...

python+selenium元素定位的8种方法

定位元素，selenium提供了8中元素定位方法：（1）find_element_by_id() ：html规定，id在html中必须是唯一的，有点类似于身份证号（2）find_element_by_name() ：html规定，name用来指定元素的名称，有点类似于人名（3）find_elemen...

Python三方库ddddocr实现验证码识别

Python三方库ddddocr实现验证码识别环境要求python >= 3.8安装三方库pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple参数说明：参数名参数类型默认值说明us...

pip安装三方库国内的一些镜像站点推荐

pip 国内的一些镜像站点推荐镜像套路：使用cmd；输入命令pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名即可开始安装。清华：https://pypi.tuna.tsinghua.edu.cn/simple 阿里云：http...

使用pyautogui进行屏幕捕捉实现自动化操作

import pyautogui import time # # 获取基本信息 # # 屏幕大小 # size = pyautogui.size() # print(size) #&nbs...

python 爬虫 报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in position”解决方案

方法一：

方法二：

“python 爬虫 报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in position”解决方案” 的相关文章

Python爬虫xpath详解

python+selenium元素定位的8种方法

Python三方库ddddocr实现验证码识别

pip安装三方库 国内的一些镜像站点推荐

使用pyautogui进行屏幕捕捉实现自动化操作

Copyright My WebSite.Some Rights Reserved.

python 爬虫报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in position”解决方案

“python 爬虫报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in position”解决方案” 的相关文章

pip安装三方库国内的一些镜像站点推荐