谈谈阿里的DataWorks这个产品
阿里的DataWorks是这样介绍自己的:
DataWorks(大数据开发治理平台)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供数据集成、数据开发、数据地图、数据质量和数据服务等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘和探索。 |
很早我就是知道DataWorks,甚至几度还有一些合作,不过对DataWorks我一直不是那么感冒,最近因为某些原因,我又开始分析了下DataWorks,我更愿意把DataWorks归结为是一个”失败”的产品。
从部署上来说:
DataWorks提供的功能就是一个写SQL去对数据做处理的能力,再配合一些调度这些周边能力,本质上就是一个:BI工具+调度器,也就是例如Superset+Airflow的能力。但是DataWorks完全无法单机部署,甚至无法低成本部署,私有化部署需要部署一大堆阿里的全家桶,仅仅获得了一些通用能力,部署性价低。
从功能上来说:
DataWorks标榜自己是大数据开发治理平台,首先说开发,这里的开发仅仅是”SQL”,而在大部分龙头企业中,SQL占比非常低。对于notebook能力,DataWorks不具备。其次DataWorks提到自己可以搞治理,但是在界面上看不到任何治理的功能。
比如数据治理至少会涵盖:主数据治理,元数据治理,数据质量治理等等,这些功能DataWorks一个都没有,所以它到底治理的是什么呢?
其次既然叫自己是治理平台,但是没有任何一个地方是展示了”治理”纬度的,那么从业务来说,我任何通过DataWorks知道我正在做的”治理”是在往好的地方走,还是在往差的地方走?
从成本上来说:
DataWorks价格高昂,功能不痛不痒还臃肿,非常不划算。
所以综合下来,DataWorks是一个比较失败的产品,再从客户视角来看,阿里的模式是上云,对于上云不是任何企业都会符合这个方向,大型传统龙头企业都不会考虑上云,中小型互联网企业会考虑上云,但是这些企业预算都会偏少,再其次中小型互联网企业一旦做大,必然会脱离别人的云自己开始搞,字节脱离阿里就是很好的例子。
扫码手机观看或分享: