宝贝我爱你 Good Luck To You!

data warehouse

刚刚看完数据仓库的第一章,感觉数据分析是件很扯淡很忽悠人的东西。

首先,数据源的准确性?

1、外部数据。比如艾瑞的数据都是从别人那拿来的再加工的。

2、整合加工数据再处理。对于管理层来说,他们得到的数据报表也是一级级下属加工后已经和原始数据大相径庭了。

其次,基础的KPI。就算全部都是原始的log,且确保程序猿对业务逻辑清晰,统计出来的报表正确。也只能保证基础的KPI报表基本准确而已。

第三,数据分析其实基本没啥人懂,大家都在凭借经验再做再摸索,也就是说是一个经验积累的活。

额,前面居然都跑题了,最后归题:

1、数据仓库的本质就是分析用户的行为。必须事先约定好日志格式,但是又由于数据分析师不知道真正要的数据,只有尽量把能想到的需要数据全部记录下来(需dw和dss共同沟通确定)。

2、“给我看一下我说我想要的东西,然后,我才能告诉你我真正想要什么。”

作者:johen 分类:技术 浏览:46948 评论:0
留言列表
发表评论
来宾的头像