常用的8种数据分析方法（常用数据分析方法介绍）

用户投稿 3天前 12浏览

【点击查看】低成本上班族靠谱副业好项目 | 拼多多无货源创业7天起店爆单玩法

【点击查看】逆林创业记 | 拼多多电商店铺虚拟类项目新玩法（附完整词表&检测工具）

【点击查看】逆林创业记 | 小白ai写作一键生成爆文速成课

领300个信息差项目，见公众号【逆林创业记】（添加请备注:网站）

Kervin_Chan| 作者

掘金|来源

本节将介绍几个常用的商品分析模型，包括商品价格敏感度模型、新产品市场定位模型、销售预测模型、商品关联销售模型、异常订单检测模型、商品规划的最优组合。

商品价格敏感度模型

商品价格敏感度模型是指通过研究找到用户对于价格是否敏感以及敏感程度的价格杠杆。利用价格敏感度模型可以辅助于销售定价，促销活动的折扣方式、参考价格、价格变动幅度等方面的参考。

例如：

促销活动时是否应该包含M2商品；当商品M3提价100元时，订单量会如何变化；在商品详情页的参考价格应该定为多少才能让客户感觉到已经降价并触发下单动作；满减、满返、跨品类用券等哪些方式最适合M4商品。

商品价格敏感度分析可以通过两种方式实现：

1.调研问卷法

通过调研问卷的形式针对关注的品类或商品做调研分析是比较通用的一种方法。这种方法可以获得品类详细信息，并且可以通过问卷设置不同的关注信息点，收集到的信息更符合实际需求。

但是，当面临新的价格敏感度分析需求时，通常都需要重新开展调研分析工作。这种方式实施起来周期较长且反馈结果较慢，另外常用的8种数据分析方法，当要收集的商品信息较多时，可能很难获得完整数据。

2.数据建模法

通过数据建模的方式建立商品价格和销售量之间的关系模型是研究价格敏感度的有效方法。

这种方法实施起来相对简单：

首先，收集不同价格下的销售数据。价格敏感度模型需要有基于不同价格下的销售数据产生，因此需要商品运营部门针对性的做调价。这种调价动作根据需求的不同，可能是长期的，也可能是短期的。

长期的调价是一种“自然状态”，因为在一个较长周期内商品会经历生命周期的不同阶段，并结合商品促销、打折等运营工作产生多种价格和销售数据；而短期的调价更多的是为了采集数据而产生。

其次，数据建模分析。商品价格敏感度模型关注的主要是价格和销量之间的关系，可以用回归方法来解决。在回归方法中，自变量中除了价格外，还需要包含其他两类信息：

之所以要将大量的商品信息和客户信息加入到回归模型中，是因为如果只针对价格和商品销售量做回归，那么价格本身能解释的商品销售量变化可能会非常有限，销量的变化还可能受到其他很多因素的影响，因此要在控制这些干扰因素的前提下做回归模型。

新产品市场定位模型

新产品市场定位分析用于当企业新生产或策划一款产品时，需要根据市场上现有的竞争对手产品情况做定位分析。

该分析的目的是评估新产品与哪些产品能形成竞品关系，可以针对性地找到与竞品的差异性和优势，例如功能特点、使用周期、产品质量等，从而应用到产品定价、市场宣传、渠道推广等方面。

新产品市场定位分析可以通过基于相似度的方法实现。

例如：使用非监督式的KNN（K近邻），模型的核心是通过对新产品的数据与现有数据的比较，发现跟新产品相似的其他产品。

通过KNN实现新产品市场定位分析的步骤如下：

如下是一段简单但包含了核心步骤的示例：

from sklearn.neighbors import NearestNeighbors #导入NearestNeighbors库 
X = [[0., 0.1, 0.6], [0., 1.5, 0.3], [1.2, 1.6, 0.5]] #定义训练集，训练集包含3 条记录，每个记录包含3个特征变量 
neigh = NearestNeighbors(n_neighbors=1) #建立非监督式的KNN模型对象 neigh.fit(X) # 训练模型对象 
new_X = [[1., 1., 1.]] #要预测的新产品数据 print(neigh.kneighbors(new_X)) #打印输出新产品最相似的训练集产品

结果：

(array([[ 0.80622577]]), array([[2]]))

销售预测模型

销售预测模型根据历史的销售数据来预测未来可能产生的销售情况。该模型常用于促销活动前的费用申请、目标制定、活动策略等的辅助支持。

销售预测模型通常要得到的结果为未来会产生多少销售量、收入、订单量等具体数值，可通过时间序列、回归和分类三种方法实现。

商品关联销售模型

商品关联销售模型主要用来解决哪些商品可以一起售卖或不能一起打包组合的问题。关联销售是商品销售的常态，也是促进单次销售收入和拉升复购效果的有效手段。

商品关联销售模型的实现方式是关联类算法，包括Apriori、FP-Growth、PrefixSpan、SPADE、AprioriAll、AprioriSome等，主要实现的是基于一次订单内的交叉销售以及基于时间序列的关联销售。

关联销售算法的实现步骤上与普通的监督式和监督式算法略有不同，原因是关联分析对于数据集的要求不同。一般包括三种数据源格式：

以上三种数据格式中，第一种和第二种常见于企业内部的源数据环境或数据仓库，第三种需要经过ETL处理得到，很多第三方工具也可以提供这种数据形式。如果企业内不具备能够直接做关联分析的数据，则需要做对应处理。

异常订单检测

异常订单检测用来识别在订单（尤其是促销活动中的订单）中的异常状态，目标找到非普通用户的订单记录，例如黄牛订单、恶意订单、商家刷单等。

异常订单检测主要基于两类方法实现：

商品规划的最优组合

在做商品促销或广告宣传时，通常企业会面临多种组合策略，它是在一定限制条件下考虑通过何种组合策略来实现最大或最小目标。此时，可以考虑使用线性规划方法。

线性规划（Linear programming，LP）是运筹学中研究比较早、方式相对成熟且实用性非常强的研究领域，主要用来辅助人们进行科学管理，目标是合理地利用有限的人力、物力、财力等资源作出的最优决策。

解决简单线性规划问题的最直接的方法是图解法常用的8种数据分析方法，即借助直线与平面区域的交点求解直线在y轴上的截距的最大值或最小值。

在做线性规划时涉及几个概念：

实现线性规划的基本步骤如下：

为了能清晰地表达上述概念和步骤，在此通过一个简单的示例演示该过程。

假设公司有P1和P2两种商品，当推广P1商品时，每次费用为60元；当推广P2商品时，每次费用为30元。现在公司有1800元预算可以用来做P1和P2商品推广，其中受到两种商品尺寸和品类的限制，P1商品最多只能投放20次，P2商品最多只能投放40次，并且两种商品的总投放次数不超过45次。已知每次推广P1和P2的商品分别能获得单品毛利为40元和30元，

问：如何安排P1和P2的商品投放次数才能达到销售毛利最大化目标？

为了解决问题，我们假设P1和P2两种商品的投放次数分别是X1和X2，最大化销售毛利为z，此时：