课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
我们在前几期的文章中给大家简单介绍了大数据平台架构都有哪些常见类型等内容,而本文我们就继续来了解一下,大数据架构数据端到端都有哪些常见问题。
虽然上述架构看起来将多种大数据组件串联起来实行了一体化管理,但是接触过数据开发的人会感受比较强烈,这样的裸露架构业务数据开发需要关注很多基础工具的使用,实际数据开发中存在很多痛点与难点,具体表现在下面一些方面。
缺乏一套数据开发IDE来管理整个数据开发环节,长远的流程无法管理起来。
没有产生标准数据建模体系,导致不同数据工程师对指标理解不同计算口径有误。
大数据组件开发要求高,普通业务去直接使用Hbase、ES等技术组件会产生各种问题。
基本上每个公司大数据团队都会很复杂,涉及到很多环节,遇到问题难以定位难以找到对应负责人。
难以打破数据孤岛,跨团队跨部门数据难以共享,互相不清楚对方有什么数据。
需要维护两套计算模型批计算和流计算,难以上手开发,需要提供一套流批统一的SQL。
缺乏公司层面的元数据体系规划,同一条数据实时和离线难以复用计算,每次开发任务都要各种梳理。
基本上大多数公司在数据平台治理上和提供开放能力上都存在上述问题和痛点。在复杂的数据架构下,对于数据适用方来说,每一个环节的不清晰或者一个功能的不友好,都会让复杂链路变更更加复杂起来。想要解决这些痛点,就需要精心打磨每一个环节,将上面技术组件无缝衔接起来,让业务从端到端使用数据就像写SQL查询数据库一样简单。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。