【Python】Xpathがあってるはずなのにスクレイピング失敗するときに確認すること

プログラミング

pythonのRequestsとlxmlを使用してスクレイピングをしていました。

その時、XPathは正しいものを指定しているのに動かない…という悲劇が起こり、無事解決したので共有いたします。

対処法:文字化けを直す

私の場合、日本語のwebサイトをスクレイピングしていたため文字化けが起こっていました。

r = requests.get('URL')
r.encoding = r.apparent_encoding

のように、エンコーディングを指定するとうまく動きました。

以上、備忘録でした!

コメント

タイトルとURLをコピーしました