Ctrip Spider Save

Scrape Learning (ctrip)

Project README

Scrape Learning (ctrip)

使用时先跑'gen_ticket.py'生成ctrip_ticket，再跑'main.py'
破解eleven参数后，可以不需要调用selenium便可请求到详细的价格信息，提升获取速度、减少资源占用
该爬虫可爬取：

每个酒店名称、评分
每个酒店不同预订时间每种房型价格
每个酒店不同预订时间每种房型满意度
每个酒店不同预订时间每种房型剩余可订数

1. 获得房间价格的重要参数"eleven"的生成方法

"eleven"由一个混淆js文件-"oceanball"生成，该文件具有随机性
生成方法:ctrip_funcs.py中的"get_oceanball"、"get_eleven"两个函数，需要配合js代码和python共同生成

这个cookie疑似使用“Http-only”Flag 发送，无法直接读取，只能通过浏览器获得。(reference)
该cookie时效较长，可以用selenium每30分钟提取一次

Open Source Agenda is not affiliated with "Ctrip Spider" Project. README Source: evanleungc/ctrip_spider

Stars

Open Issues

Last Commit

3 years ago

Repository

evanleungc/ctrip_spider

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/ctrip-spider"><img src="https://www.opensourceagenda.com/projects/ctrip-spider/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Review Review Your Favorite Project

Submit Resource Articles, Courses, Videos

Submit Article Submit a post to our blog

From the blog

Dec 11, 2022

How to Choose Which Programming Language to Learn First?

From the blog

Dec 11, 2022

Ctrip Spider Save

Scrape Learning (ctrip)

1. 获得房间价格的重要参数"eleven"的生成方法

2. 发现获得剩余可订房间仅需要Cookie: ctrip_ticket

Open Source Agenda Badge

From the blog

How to Choose Which Programming Language to Learn First?

From the blog

How to Choose Which Programming Language to Learn First?