Papa Save Abandoned

一个浏览器端数据爬虫,做每个人的数据助手

Project README

TooBigData

爬爬是你的个人数据助手,帮你在浏览器中爬到一些需要的数据。

它是一款采集数据的 Chrome 插件,可在 QQ 浏览器、360 浏览器、搜狗浏览器等 Chromium 内核的浏览器中使用。

支持数据源

  • 微信文章
  • 淘宝众筹
  • 今日头条文章
  • 豆瓣电影
  • 大众点评
  • 链家租房
  • 我爱我家租房
  • 京东商品
  • 京东商品评论
  • 淘宝商品
  • 天猫商品
  • 天猫商品评论
  • 亚马逊商品
  • 亚马逊商品评论
  • Kickstarter 评论
  • Kickstarter 用户
  • 微博用户信息
  • 微博用户关注
  • 抖音小视频
  • 火山小视频

安装

演示

数据网站

http://app.toobigdata.com/

使用视频

https://www.youtube.com/watch?v=NCUJCnFZrAw

https://www.youtube.com/watch?v=7LY7CDP4k34

特色功能

  • 可以在网页上显示微信文章的阅读点赞评论打赏数据
  • 微信文章分钟监测及文章回采
  • 查看收藏夹数据,分层级显示
  • 内置通用的URL打开器,可辅助自动爬数
  • 自动关闭已爬页面
  • 插件开源,无限扩展

动手改造

要添加更多的数据源,可通过以下方式完成

  1. 修改 app/scripts/config.js,添加数据源定义
  2. 在 app/scripts/track/ 目录下,添加对应的采集脚本

如果想自定义接收数据的网关,可修改 app/scripts/background.js 中的 data_upload_url 变量

Open Source Agenda is not affiliated with "Papa" Project. README Source: toobigdata/papa
Stars
156
Open Issues
1
Last Commit
3 years ago
License
MIT

Open Source Agenda Badge

Open Source Agenda Rating