403 Forbidden Error

Evil_Patrick · Jun-20-2020, 06:19 AM

How to avoid this error while crawling any website?

from bs4 import BeautifulSoup
import requests

source = requests.get("https://www.hltv.org/")
print(source.status_code)

Output:
403

***snippsat*** · (This post was last modified: Jun-20-2020, 02:19 PM by snippsat.)

(Jun-20-2020, 06:19 AM)Evil_Patrick Wrote: How to avoid this error while crawling any website?

Using a header user_agent is one way.

from bs4 import BeautifulSoup
import requests

user_agent = {'User-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36'}
source = requests.get("https://www.hltv.org/", headers=user_agent)
print(source.status_code)

Output:
200

Sites like this use JavaScript heavy,so using Selenium may be needed to get result without to much work.

Possibly Related Threads…
Thread		Author	Replies	Views	Last Post
	error HTTP Error 403: Forbidden	local_bit	1	4,022	Nov-14-2020, 11:34 AM Last Post: ndc85430
	HTTPError: Forbidden when try download image	b33g33	8	23,261	Jan-21-2017, 12:42 PM Last Post: scriptso

403 Forbidden Error

User Panel Messages

Announcements