Web Crawler help

Thread Rating:

1 Vote(s) - 3 Average
1
2
3
4
5

Thread Modes

Web Crawler help

metulburr
The Castle of aaarrrrggh
Administrators

Posts: 5,150

Threads: 396

Joined: Sep 2016

Reputation: 170

#32

Feb-20-2017, 05:52 PM

if you write the html to a file and open that file in the browser you will see what your crawler is getting

import requests
from bs4 import BeautifulSoup
import re
  
def fundaSpider(max_pages):
    page = 1
    while page <= max_pages:
        url = 'http://www.funda.nl/koop/rotterdam/p{}'.format(page)
        source_code = requests.get(url)
        plain_text = source_code.text
        with open('test.html','w') as f:
            f.write(plain_text.encode('utf-8'))
        soup = BeautifulSoup(plain_text, 'html.parser')
        ads = soup.find_all('li', {'class': 'search-result'})
  
        print(ads)
  
        page += 1
  
fundaSpider(1)

In my case i am getting a captcha verification. Not sure what is triggering the captcha, but there isnt really a automation method around it....as its purpose to verify a human.

Recommended Tutorials:

Find

Messages In This Thread

Web Crawler help - by takaa - Feb-06-2017, 06:57 PM

RE: Web Crawler help - by wavic - Feb-06-2017, 08:53 PM

RE: Web Crawler help - by metulburr - Feb-06-2017, 08:57 PM

RE: Web Crawler help - by takaa - Feb-07-2017, 08:46 AM

RE: Web Crawler help - by wavic - Feb-07-2017, 09:46 AM

RE: Web Crawler help - by takaa - Feb-07-2017, 05:17 PM

RE: Web Crawler help - by snippsat - Feb-07-2017, 05:45 PM

RE: Web Crawler help - by metulburr - Feb-07-2017, 05:53 PM

RE: Web Crawler help - by takaa - Feb-07-2017, 10:12 PM

RE: Web Crawler help - by metulburr - Feb-08-2017, 02:33 AM

RE: Web Crawler help - by takaa - Feb-08-2017, 12:22 PM

RE: Web Crawler help - by takaa - Feb-08-2017, 01:31 PM

RE: Web Crawler help - by wavic - Feb-08-2017, 01:47 PM

RE: Web Crawler help - by snippsat - Feb-08-2017, 02:19 PM

RE: Web Crawler help - by takaa - Feb-09-2017, 11:16 AM

RE: Web Crawler help - by metulburr - Feb-09-2017, 12:07 PM

RE: Web Crawler help - by takaa - Feb-09-2017, 12:08 PM

RE: Web Crawler help - by Larz60+ - Feb-09-2017, 12:10 PM

RE: Web Crawler help - by metulburr - Feb-09-2017, 12:14 PM

RE: Web Crawler help - by takaa - Feb-10-2017, 12:24 PM

RE: Web Crawler help - by metulburr - Feb-10-2017, 01:06 PM

RE: Web Crawler help - by takaa - Feb-14-2017, 01:49 PM

RE: Web Crawler help - by metulburr - Feb-14-2017, 02:43 PM

RE: Web Crawler help - by takaa - Feb-14-2017, 02:54 PM

RE: Web Crawler help - by takaa - Feb-15-2017, 11:02 AM

RE: Web Crawler help - by metulburr - Feb-15-2017, 01:18 PM

RE: Web Crawler help - by takaa - Feb-15-2017, 01:46 PM

RE: Web Crawler help - by snippsat - Feb-15-2017, 03:48 PM

RE: Web Crawler help - by takaa - Feb-15-2017, 04:01 PM

RE: Web Crawler help - by metulburr - Feb-15-2017, 06:03 PM

RE: Web Crawler help - by takaa - Feb-20-2017, 03:10 PM

RE: Web Crawler help - by metulburr - Feb-20-2017, 05:52 PM

RE: Web Crawler help - by takaa - Feb-20-2017, 07:56 PM

RE: Web Crawler help - by metulburr - Feb-21-2017, 02:18 AM

RE: Web Crawler help - by takaa - Mar-04-2017, 07:42 PM

RE: Web Crawler help - by metulburr - Mar-05-2017, 01:12 AM

RE: Web Crawler help - by Stoss - Jan-28-2019, 12:39 PM

RE: Web Crawler help - by takaa - Jan-30-2019, 08:35 AM

RE: Web Crawler help - by metulburr - Jan-30-2019, 06:23 PM

RE: Web Crawler help - by stateitreal - Apr-26-2019, 12:14 PM

Possibly Related Threads…
Thread		Author	Replies	Views	Last Post
	Web Crawler help	Mr_Mafia	2	1,989	Apr-04-2020, 07:20 PM Last Post: Mr_Mafia

Users browsing this thread: 2 Guest(s)

View a Printable Version

Web Crawler help

User Panel Messages

Announcements