产品展示官网数据带你领略 超市货架的摆放艺术

  当你在逛超市的时候,你有没有想过商场里的商品的摆放方式有什么讲究?随着新零售时代的到来,超市如今已经开始逐渐转向精细化运营时代。面对成千上万商品,通过数据收集和分析技术不断提升销售效率是零售超市们如今最关心的事情。其中,如何让货架空间最大化是其中的关键因素之一。数据侠Deepesh Singh使用python和贪婪算法告诉你:货架空间优化的奥义就藏在那些简单的数据里。

  一般来说,POS机附近的货架会为客户提供最大的曝光度。顾客在排队结账时客观上必须浏览这些列表商品。尽管这些商品的价格只有几块钱,如果在正确的时间,正确的地点,以正确的数量销售正确的商品,就可以帮助商店卖出更多的商品,这是零售业收入和盈利能力的关键。

  虽然这个逻辑很好理解,但应用起来可并不简单。空间优化所需的信息在整个业务中的大部分时间都是模糊、复杂、分散的。某些产品在整个营销中可能扮演的是至关重要的角色; 其他产品可能只是附属品,用来提供更高的边际效用。因此,仅仅使用一个变量来衡量他们就变得非常困难。更何况,平均一个零售商店里就有将近3万个SKU(stock keeping unit库存单位)。每年在零售店还会推出数千种的新产品。面对如此大数据量的问题,优化就变得非常困难。

  优化就是把一个真实世界的问题,用数学的方法进行建模,然后用数学方法在约束条件下求解。

  线性规划(Linear Programming,也称为线性优化)是指在需求由线性关系表示的数学模型中实现最佳结果(如最大利润或最低成本)的方法。线性程序可以表示为:

  假设一个有3个货架的零售店:货架1,新宝gg创造奇迹平台登录货架2和货架3。每个货架分别有3个、3个和4个架子(如下表所示)。我们必须出售3家公司的产品:Unilever(联合利华,英荷联合公司),Godrej(戈德瑞,印度公司)和Dabur(印度草药公司)。Unilever, Godrej和Dabur三家公司分别有3种、3种、2种不同的产品。

  现在,由于产品的利润率/库存成本/需求/过期时间等差异,商店希望优化每个产品在货架上的位置,并最大化销售总额(产品数量),同时考虑到一些已有的限制条件。决策变量将采用与lift矩阵(10* 8)相同大小的矩阵的形式。矩阵内的元素是一个二元变量:1表示产品/货架的匹配是对的(Yes);0表示产品/货架的匹配是错的(No)。我们将从所有元素都是0的矩阵开始,并允许求解器在需要时更改为1。

  当我们确定了目标函数、限制约束条件后,这种简单的线性优化就可以使用EXCEL中的solver功能进行操作。我们最终目标函数算出来最大的销售量是4197。最大情况下给出的决策矩阵如下图。

  现在我们来讨论下大数据会带来什么样的问题。在这个例子中,我们知道每个决策变量可以取值为0或1,即2 ^ 1也就是2个可能的值。如果现在是2个决策变量,可能组合的总数可以是2 ^ 2也就是4,其中一个/多个都可以给出目标函数的优化值。当情况需要考虑的有80个决策变量时,总的组合是2 ^ 80。决策变量增多带来的问题是指数性增加的而不是线性的。(用计算复杂性理论(Computational complexity theory)的理论来说,就是指数时间算法O(2 ^ n)]。即使是最好的电脑,指数时间算法的问题也是非常大强度的。正如在我们的例子中,所有2 ^ 80组合都需要被评估以找到优化的解决方案。)

  谷歌的AdWords:Google使用线性规划来优化在线广告。Google在其搜索页面上有不同的广告窗口,并基于PPC(每次点击的价格),CTR(点击率)和广告客户的预算——这些约束条件,来分配广告窗口和播放次数(这个是决策变量)以最大化其收入(目标函数)。AdWords帐户约占Google收入的97%。

  (图片说明:Google Adword广告系统的收费标准灵活,会根据点击和来电通话次数等效果来收取费用,约束条件较多,是线性优化的经典案例;图片来源:Google Adword官网截图)

  航空公司的收益管理(Revenue Management):航空公司使用线性优化来决定提供多少打折机票(决策变量),在考虑到预测的需求(约束条件)和飞机型号(有限的座位,也是约束条件)情况下,最大化其收入(目标函数)。

  本文数据侠 Deepesh Singh 是一位数据科学爱好者。他是一名持续的学习者,热爱探索数据科学的不同领域。他是NIT Silchar的一名工程师,拥有IIM-L和KSB(印第安纳大学)商业分析一年的证书,目前正在解决分析机构班加罗尔办事处的业务问题。在工作之外,他喜欢会议主持人,在健身房锻炼,练习、教导空手道。

  数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing002并备注“数据社群”,合作请联系。

  数问数据科学平台是一个一站式数据玩家的驿站,目前有问答,竞赛,工作,线下活动等内容版块。任何数据爱好者都都可以在平台,提问题、找答案、分享学习资料、经验、对接资源等。他们希望帮助给各个阶层的数据使用者解决“从哪里来”,“到哪里去”的问题。欢迎登录数问的网站,针对数据分析提出你的各种疑问,会有各路高手过来解答。