close

【requests】解決requests中文亂碼問題:一次教學解決python網頁爬蟲requests爬下來是亂碼

一、前言

python在使用requests進行爬蟲的時候遇到div標籤中夾帶的中文變成亂碼嗎?

這邊兩個步驟永遠解決這個天大的煩惱,不用問了,又是給你一篇圖片會說話還附程式碼的教學。

像這樣的亂碼看了真的很煩 跨季繼續播放:每週五凌晨/0時0分

image

 

進入基本教學前,不要忘了訂閱按讚分享唷!

部落格教學網站:
https://pixnashpython.pixnet.net/blog
想要即時訂閱最新文章:
https://forms.gle/MdXmiF2HgHhNChL46
訂閱Telegram來接收最新資訊:
https://t.me/joinchat/VUUuDt67Uq5l6CIQ

 

 

二、requests解決中文亂碼問題


先去你要爬的網頁按一下右鍵,檢查裡面網頁的html原始碼,

在meta標籤中就可以找到該網頁的編碼方式,常見的有utf-8及big5。

而後加上re.encoding = '編碼方式',這樣就大功告成了,是不是很簡單。

像範例終究是utf-8的編碼方式,那就re.encoding = 'utf-8'就可以顯示中文了。

image

import requests

re = requests.get(url)
re.encoding = 'utf-8'

 

 

三、後記


在爬蟲方面還有問到什麼問題,或是教學有不懂的地方可以留言給我!

 

部落格教學網站:
https://pixnashpython.pixnet.net/blog
想要即時訂閱最新文章:
https://forms.gle/MdXmiF2HgHhNChL46
訂閱Telegram來接收最新資訊:
https://t.me/joinchat/VUUuDt67Uq5l6CIQ

arrow
arrow

    恩哥Python 發表在 痞客邦 留言(1) 人氣()