
本文仅用于网络爬虫技术学习与研究所有代码与方法仅针对公开、无版权的静态网页进行演示。请勿将本文内容用于爬取受版权保护的小说资源一切因违规使用导致的法律责任由使用者自行承担。》》》》有没有兄弟点评一下感觉这个爬的太快了一些网站会不会把我封了可以拓展一些功能自动把所有该网站相关内容的小说都下载下来import requestsfrom lxml import etreeurl -------header { user-agent:---------}while True:#判断读取的结束if url “:breakresp requests.get(url,headers header)resp.encoding utf-8e etree.HTML(resp.text)#小说内容content .join(e.xpath(//div[classpanel-body]/p/text()))title e.xpath(//h1/text())[0]#存放下一章地址nxt e.xpath(//div/a[3]/href)[0]url nxt#print(title)#写入到当前目录下文本with open(demo小说.txt,a,encodingutf-8) as f:f.write(title\n\ncontent\n\n)