Cannot extract data from the next pages

nazmulfinance · (This post was last modified: Nov-11-2019, 07:26 PM by buran.)

Dear Members,

I am writing Python codes to extract EyeGlass listings at 'https://www.glassesshop.com/bestsellers'. The codes perfectly extract data from the first page and but fails to extract data from the next pages. There are in total 5 pages. I list both VS codes and Terminal report here. I highly appreciate your help.

# -*- coding: utf-8 -*-
import scrapy


class GlassSpider(scrapy.Spider):
    name = 'glass'
    allowed_domains = ['www.glassesshop.com']
    start_urls = ['https://www.glassesshop.com/bestsellers']

    def parse(self, response):
        names=response.xpath("//p[@class='pname col-sm-12']/a")
        for name in names:
            name_var=name.xpath(".//text()").get()
            link=name.xpath(".//@href").get()

            yield response.follow(url=link, callback=self.parse_glass, meta={'glass_name': name_var})

    def parse_glass(self, response):
        name_var=response.request.meta['glass_name']
        price=response.xpath("//span[@class='product-price-original']/text()").get()
        sku=response.xpath("//ul[@class='col-12 col-sm-6 default-content']/li[1]/text()").get()
        frame=response.xpath("//a[@class='col01']/text()").get()

        yield{
            'glass_name': name_var,
            'price': price,
            'sku': sku,
            'frame': frame
            }
        
        next_page = response.xpath("(//div[@class='custom-pagination']/ul/li)[7]/a/@href").get()
        
        if next_page:
            yield scrapy.Request(url=next_page, callback=self.parse)

Terminal Report:

Hide/Show

Output:(virtual_workspace) C:\Users\nazmu\projects\nextpage>scrapy crawl glass -o glass.csv
2019-11-11 14:21:42 [scrapy.utils.log] INFO: Scrapy 1.6.0 started (bot: nextpage)
2019-11-11 14:21:42 [scrapy.utils.log] INFO: Versions: lxml 4.4.1.0, libxml2 2.9.9, cssselect 1.1.0, parsel 1.5.2, w3lib 1.21.0, Twisted 19.7.0, Python 3.7.5 (default, Oct 31 2019, 15:18:51) [MSC v.1916 64 bit (AMD64)], pyOpenSSL 19.0.0 (OpenSSL 1.1.1d  10 Sep 2019), cryptography 2.8, Platform Windows-10-10.0.18362-SP0
2019-11-11 14:21:42 [scrapy.crawler] INFO: Overridden settings: {'BOT_NAME': 'nextpage', 'FEED_FORMAT': 'csv', 'FEED_URI': 'glass.csv', 'NEWSPIDER_MODULE': 'nextpage.spiders', 'ROBOTSTXT_OBEY': True, 'SPIDER_MODULES': ['nextpage.spiders']}
2019-11-11 14:21:43 [scrapy.extensions.telnet] INFO: Telnet Password: 58b1eea874ca96ca
2019-11-11 14:21:43 [scrapy.middleware] INFO: Enabled extensions:
['scrapy.extensions.corestats.CoreStats',
 'scrapy.extensions.telnet.TelnetConsole',
 'scrapy.extensions.feedexport.FeedExporter',
 'scrapy.extensions.logstats.LogStats']
2019-11-11 14:21:43 [scrapy.middleware] INFO: Enabled downloader middlewares:
['scrapy.downloadermiddlewares.robotstxt.RobotsTxtMiddleware',
 'scrapy.downloadermiddlewares.httpauth.HttpAuthMiddleware',
 'scrapy.downloadermiddlewares.downloadtimeout.DownloadTimeoutMiddleware',
 'scrapy.downloadermiddlewares.defaultheaders.DefaultHeadersMiddleware',
 'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware',
 'scrapy.downloadermiddlewares.retry.RetryMiddleware',
 'scrapy.downloadermiddlewares.redirect.MetaRefreshMiddleware',
 'scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware',
 'scrapy.downloadermiddlewares.redirect.RedirectMiddleware',
 'scrapy.downloadermiddlewares.cookies.CookiesMiddleware',
 'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware',
 'scrapy.downloadermiddlewares.stats.DownloaderStats']
2019-11-11 14:21:43 [scrapy.middleware] INFO: Enabled spider middlewares:
['scrapy.spidermiddlewares.httperror.HttpErrorMiddleware',
 'scrapy.spidermiddlewares.offsite.OffsiteMiddleware',
 'scrapy.spidermiddlewares.referer.RefererMiddleware',
 'scrapy.spidermiddlewares.urllength.UrlLengthMiddleware',
 'scrapy.spidermiddlewares.depth.DepthMiddleware']
2019-11-11 14:21:43 [scrapy.middleware] INFO: Enabled item pipelines:
[]
2019-11-11 14:21:43 [scrapy.core.engine] INFO: Spider opened
2019-11-11 14:21:43 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)
2019-11-11 14:21:43 [scrapy.extensions.telnet] INFO: Telnet console listening on 127.0.0.1:6023
2019-11-11 14:21:43 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/robots.txt> (referer: None)
2019-11-11 14:21:44 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/bestsellers> (referer: None)
2019-11-11 14:21:44 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fz1370> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:44 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fz1370>
{'glass_name': 'Maltz - Pink Tortoise', 'price': '$29.95', 'sku': 'SKU: FZ1370', 'frame': 'Full'}
2019-11-11 14:21:45 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1927> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:45 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1762> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:45 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1793> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:45 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/sm0833> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1927>
{'glass_name': 'Bronti - Black', 'price': '$12.95', 'sku': 'SKU: FP1927', 'frame': 'Full'}
2019-11-11 14:21:45 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1675> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:45 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1650> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1762>
{'glass_name': 'Arlene - Black', 'price': '$24.95', 'sku': 'SKU: FP1762', 'frame': 'Full'}
2019-11-11 14:21:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1793>
{'glass_name': 'Syracuse - Brown', 'price': '$19.95', 'sku': 'SKU: FP1793', 'frame': 'Full'}
2019-11-11 14:21:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/sm0833>
{'glass_name': 'Cowper - Black', 'price': '$34.95', 'sku': 'SKU: SM0833', 'frame': 'Semi-Rimless'}
2019-11-11 14:21:45 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1833> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1675>
{'glass_name': 'Dillon - Gray', 'price': '$24.95', 'sku': 'SKU: FP1675', 'frame': 'Full'}
2019-11-11 14:21:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1650>
{'glass_name': 'Owen - Black/Crystal', 'price': '$19.95', 'sku': 'SKU: FP1650', 'frame': 'Full'}
2019-11-11 14:21:45 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1770> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1833>
{'glass_name': 'Tacab - Black', 'price': '$19.95', 'sku': 'SKU: FP1833', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1770>
{'glass_name': 'Winchester - Tortoise', 'price': '$19.95', 'sku': 'SKU: FP1770', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1902> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1438> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1902>
{'glass_name': 'Jinbee - Black/Multicolor', 'price': '$19.95', 'sku': 'SKU: FP1902', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1438>
{'glass_name': 'Prince - Tortoise', 'price': '$19.95', 'sku': 'SKU: FP1438', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fm1271> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp0985> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fz1358> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fm1271>
{'glass_name': 'Omar - Gunmetal', 'price': '$19.95', 'sku': 'SKU: FM1271', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1834> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1364> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fm1383> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp0985>
{'glass_name': 'Callan - Black', 'price': '$19.95', 'sku': 'SKU: FP0985', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fz1358>
{'glass_name': 'Milne - Crystal', 'price': '$29.95', 'sku': 'SKU: FZ1358', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1834>
{'glass_name': 'Tacab - Purple', 'price': '$19.95', 'sku': 'SKU: FP1834', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp0989> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1364>
{'glass_name': 'Evansville - Blue', 'price': '$19.95', 'sku': 'SKU: FP1364', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fm1383>
{'glass_name': 'Rochester - Black', 'price': '$29.95', 'sku': 'SKU: FM1383', 'frame': 'Full'}
2019-11-11 14:21:46 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp0989>
{'glass_name': 'Hillsborough - Black/Chocolate', 'price': '$19.95', 'sku': 'SKU: FP0989', 'frame': 'Full'}
2019-11-11 14:21:47 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1168> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:47 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1168>
{'glass_name': 'Coolidge - Black', 'price': '$29.95', 'sku': 'SKU: FP1168', 'frame': 'Full'}
2019-11-11 14:21:47 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/sup0567> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:47 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1764> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:47 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1697> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:47 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/sup0567>
{'glass_name': 'Gaskell - Gunmetal', 'price': '$29.95', 'sku': 'SKU: SUP0567', 'frame': 'Full'}
2019-11-11 14:21:47 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1811> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:47 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1764>
{'glass_name': 'Arlene - Purple', 'price': '$24.95', 'sku': 'SKU: FP1764', 'frame': 'Full'}
2019-11-11 14:21:47 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.glassesshop.com/eyeglasses/fp1864> (failed 1 times): 500 Internal Server Error
2019-11-11 14:21:47 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1281> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:47 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1697>
{'glass_name': 'Novia - Black/Crystal', 'price': '$19.95', 'sku': 'SKU: FP1697', 'frame': 'Full'}
2019-11-11 14:21:47 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1913> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:47 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1811>
{'glass_name': 'Binghamton - Blue', 'price': '$19.95', 'sku': 'SKU: FP1811', 'frame': 'Full'}
2019-11-11 14:21:47 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1409> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:47 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1281>
{'glass_name': 'Wood - Crystal/Tortoise', 'price': '$29.95', 'sku': 'SKU: FP1281', 'frame': 'Full'}
2019-11-11 14:21:47 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1913>
{'glass_name': 'Cecilia - Black/Red', 'price': '$29.95', 'sku': 'SKU: FP1913', 'frame': 'Full'}
2019-11-11 14:21:47 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1409>
{'glass_name': 'Kelowna - Brown', 'price': '$19.95', 'sku': 'SKU: FP1409', 'frame': 'Full'}
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1661> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1661>
{'glass_name': 'Derrick - Black/Golden', 'price': '$24.95', 'sku': 'SKU: FP1661', 'frame': 'Full'}
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/sm0873> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1843> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/sm0873>
{'glass_name': 'Hoyle - Green', 'price': '$19.95', 'sku': 'SKU: SM0873', 'frame': 'Semi-Rimless'}
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1843>
{'glass_name': 'Buttler - Gray', 'price': '$19.95', 'sku': 'SKU: FP1843', 'frame': 'Full'}
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/sm0885> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1504> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1563> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/sm0885>
{'glass_name': 'Sherwood - Gunmetal', 'price': '$29.95', 'sku': 'SKU: SM0885', 'frame': 'Semi-Rimless'}
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1699> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1504>
{'glass_name': 'Joyce - Brown', 'price': '$12.95', 'sku': 'SKU: FP1504', 'frame': 'Full'}
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1643> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1563>
{'glass_name': 'Thomasville - Crystal', 'price': '$24.95', 'sku': 'SKU: FP1563', 'frame': 'Full'}
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1699>
{'glass_name': 'Novia - Tortoise/Yellow', 'price': '$12.95', 'sku': 'SKU: FP1699', 'frame': 'Full'}
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1643>
{'glass_name': 'Isaiah - Tortoise', 'price': '$19.95', 'sku': 'SKU: FP1643', 'frame': 'Full'}
2019-11-11 14:21:48 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fm1349> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:48 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fm1349>
{'glass_name': 'Hawthorn - Black', 'price': '$29.95', 'sku': 'SKU: FM1349', 'frame': 'Full'}
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/sm0876> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fm1352> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1781> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:49 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/sm0876>
{'glass_name': 'Horatio - Gunmetal', 'price': '$19.95', 'sku': 'SKU: SM0876', 'frame': 'Semi-Rimless'}
2019-11-11 14:21:49 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fm1352>
{'glass_name': 'Haywood - Gunmetal', 'price': '$29.95', 'sku': 'SKU: FM1352', 'frame': 'Full'}
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1804> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:49 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1781>
{'glass_name': 'Hubbard - Purple', 'price': '$19.95', 'sku': 'SKU: FP1781', 'frame': 'Full'}
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1829> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:49 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1804>
{'glass_name': 'Watertown - Brown', 'price': '$19.95', 'sku': 'SKU: FP1804', 'frame': 'Full'}
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1830> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:49 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1829>
{'glass_name': 'Averies - Blue', 'price': '$19.95', 'sku': 'SKU: FP1829', 'frame': 'Full'}
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1062> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:49 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1830>
{'glass_name': 'Averies - Mblack', 'price': '$19.95', 'sku': 'SKU: FP1830', 'frame': 'Full'}
2019-11-11 14:21:49 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.glassesshop.com/eyeglasses/fp1615> (failed 1 times): 500 Internal Server Error
2019-11-11 14:21:49 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1062>
{'glass_name': 'Lina - Green', 'price': '$29.95', 'sku': 'SKU: FP1062', 'frame': 'Full'}
2019-11-11 14:21:49 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.glassesshop.com/eyeglasses/fz1159> (failed 1 times): 500 Internal Server Error
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1662> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:49 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fm1350> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1841> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1662>
{'glass_name': 'Earl - Black/Crystal', 'price': '$19.95', 'sku': 'SKU: FP1662', 'frame': 'Full'}
2019-11-11 14:21:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/rm0247> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fm1350>
{'glass_name': 'Hawthorn - Gunmetal', 'price': '$29.95', 'sku': 'SKU: FM1350', 'frame': 'Full'}
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1841>
{'glass_name': 'Buttler - Black', 'price': '$19.95', 'sku': 'SKU: FP1841', 'frame': 'Full'}
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/rm0247>
{'glass_name': 'Terre - Golden', 'price': '$32.95', 'sku': 'SKU: RM0247', 'frame': 'Rimless'}
2019-11-11 14:21:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1457> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1747> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1457>
{'glass_name': 'Zoe - Purple', 'price': '$19.95', 'sku': 'SKU: FP1457', 'frame': 'Full'}
2019-11-11 14:21:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1658> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1747>
{'glass_name': 'Murphy - Tortoise', 'price': '$39.95', 'sku': 'SKU: FP1747', 'frame': 'Full'}
2019-11-11 14:21:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fz1094> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1658>
{'glass_name': 'Rainbow - Multicolor', 'price': None, 'sku': 'SKU: FP1658', 'frame': 'Full'}
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fz1094>
{'glass_name': 'Buckeye - Pink', 'price': '$29.95', 'sku': 'SKU: FZ1094', 'frame': 'Full'}
2019-11-11 14:21:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1763> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1828> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1763>
{'glass_name': 'Arlene - Crystal/Tortoise', 'price': '$24.95', 'sku': 'SKU: FP1763', 'frame': 'Full'}
2019-11-11 14:21:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1828>
{'glass_name': 'Averies - Pink', 'price': '$19.95', 'sku': 'SKU: FP1828', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1771> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1831> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1568> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1771>
{'glass_name': 'Winchester - MBlack', 'price': '$19.95', 'sku': 'SKU: FP1771', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1831>
{'glass_name': 'Tacab - Gray', 'price': '$19.95', 'sku': 'SKU: FP1831', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fm1263> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1568>
{'glass_name': 'Cooksville - Tortoise', 'price': '$24.95', 'sku': 'SKU: FP1568', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fz1320> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fz1088> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fm1263>
{'glass_name': 'Rochester - Black/Golden', 'price': '$29.95', 'sku': 'SKU: FM1263', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fz1320>
{'glass_name': 'Vogt - Multicolor', 'price': '$29.95', 'sku': 'SKU: FZ1320', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fz1088>
{'glass_name': 'Mandy - Crystal', 'price': '$29.95', 'sku': 'SKU: FZ1088', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1719> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fz1268> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1719>
{'glass_name': 'Jean - Black', 'price': '$24.95', 'sku': 'SKU: FP1719', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1775> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fz1268>
{'glass_name': 'Genevieve - Tortoise', 'price': '$34.95', 'sku': 'SKU: FZ1268', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1775>
{'glass_name': 'Haggai - Black/Gunmetal', 'price': '$24.95', 'sku': 'SKU: FP1775', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fz1297> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fp1903> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fm1385> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:51 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.glassesshop.com/eyeglasses/fz1159> (failed 2 times): 500 Internal Server Error
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fz1297>
{'glass_name': 'Hume - Tortoise/Brown', 'price': '$29.95', 'sku': 'SKU: FZ1297', 'frame': 'Full'}
2019-11-11 14:21:51 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fp1903>
{'glass_name': 'Jinbee - Brown/Multicolor', 'price': '$19.95', 'sku': 'SKU: FP1903', 'frame': 'Full'}
2019-11-11 14:21:52 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.glassesshop.com/eyeglasses/fm1387> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:52 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fm1385>
{'glass_name': 'Celestia - Black/Golden', 'price': '$19.95', 'sku': 'SKU: FM1385', 'frame': 'Full'}
2019-11-11 14:21:52 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.glassesshop.com/eyeglasses/fp1864> (failed 2 times): 500 Internal Server Error
2019-11-11 14:21:52 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.glassesshop.com/eyeglasses/fp1615> (failed 2 times): 500 Internal Server Error
2019-11-11 14:21:52 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.glassesshop.com/eyeglasses/fm1387>
{'glass_name': 'Celia - Rose Gold', 'price': '$19.95', 'sku': 'SKU: FM1387', 'frame': 'Full'}
2019-11-11 14:21:52 [scrapy.downloadermiddlewares.retry] DEBUG: Gave up retrying <GET https://www.glassesshop.com/eyeglasses/fz1159> (failed 3 times): 500 Internal Server Error
2019-11-11 14:21:52 [scrapy.core.engine] DEBUG: Crawled (500) <GET https://www.glassesshop.com/eyeglasses/fz1159> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:52 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <500 https://www.glassesshop.com/eyeglasses/fz1159>: HTTP status code is not handled or not allowed
2019-11-11 14:21:52 [scrapy.downloadermiddlewares.retry] DEBUG: Gave up retrying <GET https://www.glassesshop.com/eyeglasses/fp1864> (failed 3 times): 500 Internal Server Error
2019-11-11 14:21:52 [scrapy.core.engine] DEBUG: Crawled (500) <GET https://www.glassesshop.com/eyeglasses/fp1864> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:52 [scrapy.downloadermiddlewares.retry] DEBUG: Gave up retrying <GET https://www.glassesshop.com/eyeglasses/fp1615> (failed 3 times): 500 Internal Server Error
2019-11-11 14:21:52 [scrapy.core.engine] DEBUG: Crawled (500) <GET https://www.glassesshop.com/eyeglasses/fp1615> (referer: https://www.glassesshop.com/bestsellers)
2019-11-11 14:21:52 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <500 https://www.glassesshop.com/eyeglasses/fp1864>: HTTP status code is not handled or not allowed
2019-11-11 14:21:52 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <500 https://www.glassesshop.com/eyeglasses/fp1615>: HTTP status code is not handled or not allowed
2019-11-11 14:21:52 [scrapy.core.engine] INFO: Closing spider (finished)
2019-11-11 14:21:52 [scrapy.extensions.feedexport] INFO: Stored csv feed (65 items) in: glass.csv
2019-11-11 14:21:52 [scrapy.statscollectors] INFO: Dumping Scrapy stats:
{'downloader/request_bytes': 61210,
 'downloader/request_count': 76,
 'downloader/request_method_count/GET': 76,
 'downloader/response_bytes': 2384811,
 'downloader/response_count': 76,
 'downloader/response_status_count/200': 67,
 'downloader/response_status_count/500': 9,
 'finish_reason': 'finished',
 'finish_time': datetime.datetime(2019, 11, 11, 19, 21, 52, 632507),
 'httperror/response_ignored_count': 3,
 'httperror/response_ignored_status_count/500': 3,
 'item_scraped_count': 65,
 'log_count/DEBUG': 144,
 'log_count/INFO': 13,
 'request_depth_max': 1,
 'response_received_count': 70,
 'retry/count': 6,
 'retry/max_reached': 3,
 'retry/reason_count/500 Internal Server Error': 6,
 'robotstxt/request_count': 1,
 'robotstxt/response_count': 1,
 'robotstxt/response_status_count/200': 1,
 'scheduler/dequeued': 75,
 'scheduler/dequeued/memory': 75,
 'scheduler/enqueued': 75,
 'scheduler/enqueued/memory': 75,
 'start_time': datetime.datetime(2019, 11, 11, 19, 21, 43, 282844)}
2019-11-11 14:21:52 [scrapy.core.engine] INFO: Spider closed (finished)

(virtual_workspace) C:\Users\nazmu\projects\nextpage>

**buran** · Nov-11-2019, 07:51 PM

change start_urls to include all 5 pages

start_urls = [f'https://www.glassesshop.com/bestsellers?page={page}' for page in range(1, 6)]

nazmulfinance · Nov-11-2019, 08:00 PM

Thank you, buran, for your response. It works perfectly fine now. If you do not mind, could you please briefly explain the problem in the code. I believe I will learn from your explanation and in the future solve this sort of problem.

**buran** · (This post was last modified: Nov-11-2019, 08:11 PM by buran.)

well, I don't know what's there to explain. You have 2 levels of pages - the top 5 pages is the first level. When you parse these 5 pages you have all the urls of each individual product. The second levels is the each individual product page.
Your start_urls had only one of the 5 top level urls.

as explained in the docs, start_urls list is shortcut for start_requests method

def start_requests(self):
    for page in range(1, 6):
        yield scrapy.Request(url=f'https://www.glassesshop.com/bestsellers?page={page}', callback=self.parse)

nazmulfinance · Nov-11-2019, 08:15 PM

The explanation completely makes sense. Thank you, buran.

Possibly Related Threads…
Thread		Author	Replies	Views	Last Post
	Extract data from sports betting sites	nestor	3	7,752	Mar-30-2021, 04:37 PM Last Post: Larz60+
	Extract data from a table	Bob_M	3	3,515	Aug-14-2020, 03:36 PM Last Post: Bob_M
	Extract data with Selenium and BeautifulSoup	nestor	3	5,153	Jun-06-2020, 01:34 AM Last Post: Larz60+
	Extract json-ld schema markup data and store in MongoDB	Nuwan16	0	3,141	Apr-05-2020, 04:06 PM Last Post: Nuwan16
	Extract data from a webpage	cycloneseb	5	3,991	Apr-04-2020, 10:17 AM Last Post: alekson
	Cannot Extract data through charts online	AgileAVS	0	2,375	Feb-01-2020, 01:47 PM Last Post: AgileAVS
	How to use Python to extract data from Zoho Creator software on the web	dan7055	2	5,088	Jul-05-2019, 05:11 PM Last Post: DeaD_EyE
	Python/BeautiifulSoup. list of urls ->parse->extract data to csv. getting ERROR	IanTheLMT	2	4,925	Jul-04-2019, 02:31 AM Last Post: IanTheLMT
	Help to extract data from web	prasadmathe	4	4,153	May-20-2019, 10:59 PM Last Post: michalmonday
	[Python 3] - Extract specific data from a web page using lxml module	Takeshio	9	9,454	Aug-25-2018, 08:46 AM Last Post: leotrubach

Cannot extract data from the next pages

User Panel Messages

Announcements