Soducrawler Save

Project README

搜读阅读器

这个项目是为了解决阅读网络小说的几个痛点：

“免费”网站广告太多
有些不能收藏，有些能，但是有bug，或者有收藏数量限制
阅读不便，总是要弹开新窗口
追更新不便，需要手动刷新
不能在PC和手机之间同步进度
不能离线查看

因此，这个项目的路线图如下：

抓取网络小说及章节内容（DONE）
展示小说列表（DONE）
小说章节阅读器（TODO）
本地收藏（TODO）
云端同步收藏、进度信息（TODO）
封装electron客户端（TODO）
APP版（TODO）

本地安装使用方法：

安装nodejs环境
安装node依赖包：在命令行进入项目目录，执行

npm install

或者，使用yarn

yarn

执行抓取代码

node crawler.js

打开小说阅读器：直接双击index.html在浏览器打开

请注意，由于使用了ng-admin来自动生成阅读器页面，目前还有些展示问题：

搜索小说必须使用全部名称
查看章节内容时，html标签全部显示出来了，而且字体太小
显示章节列表时，打开modal窗口显示章节内容的功能还有问题：要么无法显示内容，要么显示带html标签的内容

项目采用了以下技术：

parse-server: https://github.com/ParsePlatform/parse-server-example
ng-admin: https://www.gitbook.com/book/marmelab/ng-admin/details
cheerio: https://github.com/cheeriojs/cheerio
js-crawler: https://github.com/antivanov/js-crawler
heroku: https://www.heroku.com
nodejs: https://nodejs.org
其他使用到的开源项目，请看package.json

有人问框架是什么，我大概总结了一下：

后台API+存储：parse-server（部署在Heroku）
爬虫（Nodejs）：js-crawler（crawler.js）
前端展示（JS）：ng-admin（admin.js、index.html）
实体（JS）：models目录下面的两个js文件
全部代码就是以上五个文件，其他要么是配置文件（Nodejs）、要么就是废弃而没删的代码（也许以后用得着？）

欢迎大家提出宝贵意见，反馈直接发到issue，有兴趣参与开发的可以提pull request，我会尽快处理。

Open Source Agenda is not affiliated with "Soducrawler" Project. README Source: winglight/soducrawler

Stars

Open Issues

Last Commit

7 years ago

Repository

winglight/soducrawler

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/soducrawler"><img src="https://www.opensourceagenda.com/projects/soducrawler/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Review Review Your Favorite Project

Submit Resource Articles, Courses, Videos

Submit Article Submit a post to our blog

From the blog

Dec 11, 2022

How to Choose Which Programming Language to Learn First?

From the blog

Dec 11, 2022