
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
随着互联网的不断发展,越来越多的人都在学习达内互联网IT培训课程等技术,而本文我们就通过案例分析来简单了解一下,数据仓库技术应用都有哪些注意事项。
指标的价值
海盗指标法(AARRR海盗模型)
它反映了增长是系统性地贯穿于用户生命周期各个阶段的:用户拉新(Acquisition)、用户激活(Activation)、用户留存(Retention)、商业变现(Revenue)、用户推荐(Referral)
指标如何做到精准
选指标常用方法是指标分级方法和OSM模型。
指标分级方法
T1公司战略层面指标
T2业务策略层面指标
T3业务执行层面指标
OSM模型
O业务目标
S业务策略
M业务度量
建模
维度建模的模式:
星型模型:以事实表为中心,所有的维度表直接连在事实表上
雪花模式:雪花模式的维度表可以拥有其他的维度表,这种表不易维护,一般不推荐使用
星座模型:基于多张事实表,而且共享维度信息,即事实表之间可以共享某些维度表
维度建模步骤:
事实表种类:
事物事实表:表中的一行对应空间或时间上某点的度量事件
周期快照事实表:单个周期内数据,每行都带有时间值字段,代表周期
累计快照事实表:由多个周期数据组成,每行汇总了过程开始到结束之间的度量
无事实的事实表:有少量的没有数字化的值但是还很有价值的字段,无事实的事实表就是为这种数据准备的,利用这种事实表可以分析发生了什么。
聚集事实表:原子粒度的数据进行简单的聚合操作,目的就是为了提高查询性能
合并事实表:属于相同粒度,就可以合并为一个事实表
维度表技术
维度表结构
维度表谨记一条原则,包含单一主键列
跨表钻取
使不同的查询能够针对两个或更多的事实表进行查询
上钻(roll-up):上卷是沿着维的层次向上聚集汇总数据。例如,对产品销售数据,沿着时间维上卷,可以求出所有产品在所有地区每月(或季度或年或全部)的销售额。
下钻(drill-down):下钻是上钻的逆操作,它是沿着维的层次向下,查看更详细的数据。
退化维度
退化维度就是将维度退回到事实表中。因为有时维度除了主键没有其他内容,虽然也是合法维度键,但是一般都会退回到事实表中,减少关联次数,提高查询性能
多层次维度
多数维度包含不止一个自然层次,如日期维度可以从天的层次到周到月到年的层次。所以在有些情况下,在同一维度中存在不同的层次。
维度表空值属性
推荐采用描述性字符串代替空值
日历日期维度
在日期维度表中,主键的设置不要使用顺序生成的id来表示,可以使用更有意义的数据表示,比如将年月日合并起来表示,即YYYYMMDD,或者更加详细的精度。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。更多内容请加抖音太原达内IT培训学习了解。