【requests】解決requests中文亂碼問題:一次教學解決python網頁爬蟲requests爬下來是亂碼
一、前言
python在使用requests進行爬蟲的時候遇到div標籤中夾帶的中文變成亂碼嗎?
這邊兩個步驟永遠解決這個天大的煩惱,不用問了,又是給你一篇圖片會說話還附程式碼的教學。
像這樣的亂碼看了真的很煩 è·¨å£ç¹¼çºææ¾ï¼æ¯é±äºåæ¨ï¼0æ0å
進入基本教學前,不要忘了訂閱按讚分享唷!
部落格教學網站:
https://pixnashpython.pixnet.net/blog
想要即時訂閱最新文章:
https://forms.gle/MdXmiF2HgHhNChL46
訂閱Telegram來接收最新資訊:
https://t.me/joinchat/VUUuDt67Uq5l6CIQ
二、requests解決中文亂碼問題
先去你要爬的網頁按一下右鍵,檢查裡面網頁的html原始碼,
在meta標籤中就可以找到該網頁的編碼方式,常見的有utf-8及big5。
而後加上re.encoding = '編碼方式',這樣就大功告成了,是不是很簡單。
像範例終究是utf-8的編碼方式,那就re.encoding = 'utf-8'就可以顯示中文了。
import requests re = requests.get(url) re.encoding = 'utf-8'
三、後記
在爬蟲方面還有問到什麼問題,或是教學有不懂的地方可以留言給我!
部落格教學網站:
https://pixnashpython.pixnet.net/blog
想要即時訂閱最新文章:
https://forms.gle/MdXmiF2HgHhNChL46
訂閱Telegram來接收最新資訊:
https://t.me/joinchat/VUUuDt67Uq5l6CIQ
留言列表