全国服务热线:
15867137303

通过聚类分析聊聊双十二

分享到:
点击次数:55 更新时间:2020年11月27日11:31:05 打印此页 关闭

双十二马上就要来了,小伙伴们已经开始蠢蠢欲动了吧,开始逛某宝、某东、某猫,大有把购物车塞满的趋势,在这个过程中,我们会受到一些推销活动的通知或推送,但其实你之前可能并没有关注过这个商品,就像某宝的“猜你喜欢”,那他推送的内容是根据什么来确定的呢?这其实就是一个典型的数据分析的过程。数据分析数据分析

电商网站可以在后台根据用户信息比如年龄、性别、地址等历史数据将用户进行划分,比如“年轻白领”、“一家三口”、“家有老人”、“初为父母”等等类型,然后根据这类用户的特征来发起不同的优惠活动,那么在利用这些用户数据来对用户进行细分的过程就会用到聚类分析。数据分析

聚类分析是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,其目标是在相似的基础上收集数据来进行分类并分析。聚类分析用于将观察结果组合成组或簇的技术,每个组或簇包含同质观察项——彼此相似的观察项,每个组或簇之间都是异构的——每个组或簇都是不同的,用于分组观察的变量决定最终的组或簇的解决方案,而其所选择的变量需要与分析目的具有相关性。数据分析

因为聚类分析师基于距离将观察项进行合并,所以观察项之间越接近,它们就越有可能属于同一个集群。根据输入聚类分析的变量来计算出欧氏距离决定观察项彼此之间的距离。通常该类聚类分析比较适合使用连续变量,最佳做法一般是将变量的数值标准化,确保所有变量都以相同的比例进行测量。

图片1.jpg

那么常见的聚类分析算法有哪些呢?

●Hierarchical clustering——根据距离,观察项之间距离较近的关系比较远的要密切

●k-means clustering——找到K个集群的中心,并将观察项归类到各个中心

●Density-based clustering——聚类被定义为比数据集的其余部分更高密度的区域。

●Distribution-based clustering——群集被定义为最有可能属于同一分布的对象。

我们上面说到,电商平台在进行用户数据分析的时候,使用聚类分析法寻找相似的细分组,在细分顾客的时候,基于RFM价值或者根据正在购买的产品/服务。在细分产品/服务的时候,会区分高端产品与低端产品。

聚类分析方法比较简单、直观,主要用于EDA探索性研究,所以数据分析师们在进行聚类分析的时候需要选择最佳的方案。现在小伙伴知道双十二是怎么回事了吧~

20201127113625_65728.png

数据分析

上一条:数据分析中有哪些有价值的认证? 下一条:作为数据分析师不懂细分分析,我劝你耗子尾汁!
  • 发表评论
  • 查看评论
文明上网理性发言,请遵守评论服务协议。
首页 上一页 下一页 尾页