The first scrapy project
第一个爬虫项目
创建项目
scrapy startproject ielts_online_spider制作爬虫
scrapy genspider ielts_online "ieltsonlinetests.com" start_urls = ['https://ieltsonlinetests.com/ielts-recent-actual-test-answers-vol-6-reading-practice-test-1/solution'] def parse(self, response):
filename = "reading_page1.html"
open(filename, 'w').write(str(response.body))scrapy crawl ielts_online取爬虫数据
构建自己的spider存储对象
取数据
执行测试
Last updated