爬取菜鸟教程网站并转PDF__python_crawer_by_chrome
此脚本用来下载runoob教程为pdf文件,可用来给学习者打印或者离线学习.pdf文件已经下载至 runoob 文件夹.若想下载至您的本地,请运行
python3 runoob_crawl.py
在clean.js设置html的字体,宽度,样式,再保存到pdf
ERROR:gpu_process_transport_factory.cc(967)] Lost UI shared context
这是chrome内在一个小bug,新版本已经修复.
merge_pdf_with_toc.py
来合并pdf,并可添加TOC,非常强大.(参考的国外牛人)sed -i '/<script.jquery.</script>/d' ./full_page/$page_pr.html
解决了。