Easy Machine Learning is a general-purpose dataflow-based system for easing the process of applying machine learning algorithms to real world tasks.
EasyML 1.2.0版本,加入了Tensorflow的单机、分布式的支持,同时对一些bug进行了修复。该版本具体细节功能和改进如下:
docker pull nkxujun/mysql_eml:1.2.0
docker pull nkxujun/ubuntu_eml:1.2.0
Tensorflow支持: ubuntu镜像内置tensorflow 1.3.0
版本,提供tensorflow并行模式一键配置脚本。支持tensorflow的数据并行与模型并行
新增Tensorflow模型并行示例:以深度学习常用数据集mnist为例,采用CNN Tensorflow模型并行方式解决手写字识别问题
新增Tensorflow数据并行示例:以深度学习常用数据集mnist为例,采用CNN Tensorflow数据并行方式解决手写字识别问题
脚本修正:修正运行脚本中部分单词拼写错误问题
更换示例数据上传方式:修改upload-hdfs.sh脚本,移除单个数据、程序数据的上传模式,采用批量数据上传方式。(此前为一个程序一个程序上传)
Tensorflow类型支持:支持程序上传类型为Tensorflow,同时提供单机、数据并行、模型并行三种运行方式
Directory类型支持:用户的输入及输出提供Directory类型,在上传程序的命令行中添加输入输出参数时可进行选择
修复数据库表添加新字段,导致原有数据无法删除问题
修复上传程序成功后,点击所上传程序,无法立即显示在画布问题
修复部分日志无法显示问题
权限修改:删除examples任务只能在examples面板中删除,不能在个人任务中删除
示例任务添加CNN_tensorflow(模型分布)和CNN_tensorflow(数据分布)。 该示例为深度学习的入门示例,采用mnist数据集,以Tensorflow CNN为训练模型 解决手写字识别问题
EasyML 1.0.0版本,是基于初始发布版本的优化版本,该版本修复了诸多初始发布版本的Bug。同时集群搭建提供了支持windows/mac安装的docker简化版本安装包,供机器内存小的用户安装使用。具体细节功能和改进如下:
docker pull nkxujun/mysql_eml:1.0.0
docker pull nkxujun/ubuntu_eml:1.0.0
2.2.0.2.0.6.0-102
改为2.2.0
;将依赖的oozie版本
4.0.0.2.0.6.0-102
改为 4.1.0
EasyML 1.1.0版本,加入了较多的新特性,同时对代码及注释进行了进一步的规范,建议对新特性感兴趣的用户可以升级到该版本进行体验。该版本具体细节功能和改进如下:
docker pull nkxujun/mysql_eml:1.1.0
docker pull nkxujun/ubuntu_eml:1.1.0
Spark版本: Spark版本从原来2.0.1
替换为 1.6.1
(2.0.1
版本不支持内置ETL算法组件)
新增Titanic Demo示例:增加Kaggle竞赛中的Titanic Demo,用户可从该示例中看到新特性的示例
Python支持: ubuntu镜像内置python 2.7
版本
Tensorflow支持: ubuntu镜像内置tensorflow 1.3.0
版本
Mysql数据库: Mysql镜像新增test
数据库,方便用户进行ETL功能测试。studio
数据库新增moduleversion
表,用于程序与数据的版本管理
脚本修正:修正运行脚本中部分单词拼写错误问题