关于怎么看电商平台用户数量,怎么查看电商数据这个很多人还不知道,今天琪琪来为大家解答以上的问题,现在让我们一起来看看吧!
怎么看电商平台用户数量 怎么查看电商数据
怎么看电商平台用户数量 怎么查看电商数据
1、包括用户行为数据和用户基本信息数据:重复值处理缺失值处理数据格式处理:日期格式的转换 astype()查看有无重复值:首先看使用df.查看各个字段的记录数,再看去除重复值后的数量。
2、以此判断有无重复数据。
3、去重重复值可以使用函数drop_duplicates()通过df.查看数据格式看到time是object类型的,不适合处理。
4、同时我们一般将数据分为日期和时间格式,因此对其进行拆分处理。
5、为各个时段打标,将时段分为'凌晨'、'上午'、'中午'、'下午'、'晚上'知识点:pd.cut函数,区间分割查看空值,并计算数量。
6、可以看到并无空值。
7、在订单表中按照(用户,时段)分组,取每个时段的记录数(订单数):这里的作流程与hive-sql类似,我们需要先把max算出来,再去关联。
8、将生成的标签加入标签表:同理,可统计出用户购买的活跃时间段,在此不赘述,仅展示结果分析用户喜欢的类目,从而便于我们为其进行。
9、终得到标签表:通过分析用户分析近的行为,来判断该用户是否活跃、流失分析近30天的活跃天数,只要有浏览、收藏、加购和购物四种行为之一就认为是活跃。
10、结果如下:我们可以通过查看所有用户30天活跃天数的分布情况,来确认一个分类的标准,判断某个用户是否活跃。
11、用户30天活跃天数分布图如图:同理,可分析用户近7天的行为,包括其购物次数和活跃天数。
12、与上述作类似,展示结果:明确今天的日期,在本项目中,“今天”指“2014-12-19”,然后统计订单表中用户某种行为的日期与当前日期的值。
13、使用的函数是:datetime.strptime: new datetime parsed from a string (like time.strptime()) ,将字符串转为date格式,以方便我们做日期运算结果如图:使用日期的diff函数返回结果RFM分组是指按照近一次消费 (Recency)、消费频率 (Frequency)和消费金额(Monetary)进行分组近一次消费,我们按照一次购物距今的天数进行分组,同样是观看用户的一个分布情况,然后看如何进行分类。
14、消费频率,这里放宽要求,按照用户的30天活跃天数进行分类消费金额,本次不涉及金额的统计。
15、因此,我们可以根据活跃度分类和近一次消费将用户划分为四类:结果如图可以看到在第8天前后,用户有明显的分层,因此按照8天对其进行划分,一次消费距今天数小于8天的,认为近有消费,大于8天的认为近无消费返回结果:通过value_counts查看每个值的出现次数:上述返回的结果值是:如果值为空,说明无相应的行为,对浏览未购买的数据记录进行打标以上的步骤到商品粒度,下面对用户进行统计,即只要用户有浏览未下单的行为就对其进行打标返回的结果如图:加购未下单同上述步骤分析平台用户的年龄、学历、性别、城市、职业、婚姻情况等,以便于我们去分析我们的典型用户是什么。
16、从上图可以看出,平台用户中男性居多,女性较少。
本文到这结束,希望上面文章对大家有所帮助。