爬取CSDN上的博客文章
爬取Csdn某个博主的所有博文,并下载到本地(暂时只支持保存html格式),加入了多线程,爬取更快速。 SpiderGui----------------->爬虫gui界面 CsdnBlogSpider------------>爬虫主程序
Python3.4
* 确保安装Python解释器。 * SpiderGui.py * 提示输入要爬取的博客名和开启线程数,根据自己需求配置 * 开始爬取,存储在当前目录的blog文件夹下
本爬虫还不够完善,欢迎大家指导