当前位置: 主页

解决pyquery采集gbk中文网页乱码问题

再写一个采集中文网页上内容的python脚本,执行完网页报出乱码。对网页查看源代码原来是 <meta http-equiv="Content-Type" content="text/html; charset=gb2312" />, 网上尝试了各种办法都无济于事,最后终于解决。

原来在pyquery的第二个参数加上encoding="gbk"即可解决问题。

pyquery(url="网址", encoding="gbk")



分享一下 :
我来说两句 0 条评论 点击全部查看