微博自动摘要系统 Chinese Microblog Automatic Summary System
给定微博话题数据集,从中筛选出前N(N>0)条微博,作为话题摘要。
问题实质:短文本多文档自动文摘。
流程:数据-算法-评估-展现
macOS Sierra 10.2.5
建议在虚拟环境中运行, 若已安装pip:
sudo pip install virtualenv
virtualenv virtualEnv
进入虚拟环境:
cd virtualEnv/
source bin/activate
cd virtualEnv/
source bin/activate
cd weiboApplication
指定变量:
export FLASK_APP = app.py
调试模式(可选):
export FLASK_DEBUG=1
运行:
flask run
默认访问:
* Serving Flask app "weibo-summary.weiboApplication.app"
* Running on http://127.0.0.1:5000/ (Press CTRL+C to quit)
Ubuntu ( 可否写一个自动部署脚本?)
安装MySQL
安装Apache
sudo apt-get install apache2
安装mod_wsgi
sudo apt-get install libapache2-mod-wsgi
配置Python虚拟环境
安装Flask以及相关依赖
pip install -r requestments.txt
进入MySQL:
mysql -u root -p
导入数据:
mysql -u root -p weibodb < weibodb_summary.sql
|____app.py(应用入口)
|____config.py
|____manage.py
|____requirement.txt(需安装的依赖)
|____weiboModel.py
|____weibo-summary.wsgi(部署配置)
|____Algorithms(算法)
| |____Hybird-TFIDF.py
| |____TextRank.py
| |____TFIDF.py
| |____utilities.py
| |...
|____Data (数据)
| |____rawData(原始数据)
| |____weiboData(预处理后数据)
| |____ResultData(生成摘要结果数据)
| |____ROUGE(算法评估结果数据)
|____db(数据库)
|____lib(使用的第三方库)
|____static
| |____css
| |____echarts(图表插件)
| |____font-awesome
| |____js
| |...
|____templates
| |____admin(后台)
| |____slide(模板分割模块)
|____util(自动化与处理脚本)
本系统数据库为MySQL