新闻搜索引擎
pip install lxml
pip install jieba
pip install Flask
如果想抓取最新新闻数据并构建索引,一键运行./code/setup.py,再按上面的方法测试。
./code/setup.py
2020.4.5:新增抓取中国新闻网的爬虫程序。先运行./code/spider.chinanews.com.py爬取最近5天新闻(约2500条);然后注释./code/setup.py第38行并运行,自动构建索引。
./code/spider.chinanews.com.py