爬取五大平台621款手机,告诉你双十一在哪买最便宜!

Aidan075
• 阅读 1648

↑关注+置顶~ 有趣的不像个技术号

爬取五大平台621款手机,告诉你双十一在哪买最便宜!


今晚0点,相约剁手

大家好,我是朱小五

明天就是双十一了,看了看自己手里的卡的像IE浏览器的手机,感觉可能等不到5G普及了。

我!要!换!手!机!

去哪买呢?

作为一个机(pin)智(qiong)boy,肯定要比价啊,哪家便宜去哪家~

我用Python爬取了某比价网站的手机数据,获取了其中五大平台(天猫,京东,拼多多,苏宁易购,国美)的手机价格数据。

部分爬取代码如下:

def get_price_min(urls,name):  
    html = restaurant(d)  
    doc = pq(html)  
    data = []  
    try:  
        a = doc('#aspnetForm > div.main > div > div.pro-mall-list > div.bd.proziying > ul > li:nth-child(1) > div').attr('v')  
        load_data_min = json.loads(a)  
        price_min = load_data_min.get("price")  
    except:  
        print('无')   
    for i in range(1,11): # 选取前十家优惠店家  
        dic = {}  
        try:  
            a = doc('#aspnetForm > div.main > div > div.pro-mall-list > div.bd.proziying > ul > li:nth-child(' + str(i) +') > div').attr('v')  
            load_data = json.loads(a)  
            dic['name'] = name  
            dic['price_min'] = price_min  
            dic['sitename'] = load_data.get("sitename")  
            dic['price'] = load_data.get("price")  
        except:  
            print('无')   
        data.append(dic)  
    return data 

手机品牌销量占比

我们先来看看各手机品牌在几家平台的销售占比,在这里由于销售量不太好统计,我选取了用户的评价数量来侧面反映销售数量。

爬取五大平台621款手机,告诉你双十一在哪买最便宜!

由上图可以看出,华为(包含荣耀)牢牢占据了第一名,苹果则是第二名,小米、OPPO、VIVO等手机品牌也占有一席之地。

但是大家需要注意的是,由于此次爬取的数据都是线上平台的销售渠道,所以主要依靠线下渠道的OPPO,VIVO品牌会因此占比略少。

我们再看一下哪款手机的销量最好呢?

列举了TOP10:

爬取五大平台621款手机,告诉你双十一在哪买最便宜!

其中千元机系列分别是荣耀三款、小米一款、红米一款。华为今年发布的P30和P30pro都取得了不错的销量,而且销量好的似乎都是高配版(低配版被阉割),Apple的三款也是性价比较高(最便宜)的。

看来对于大家挑选手机来说,物美价廉最重要的。

去哪买最便宜?

去哪买最便宜?为此我设置了一个评选标准:

设置当 price = min_price 时,该平台为最省钱平台~

因此同一手机类型可能对应多个优惠平台。

比如说:手机类型A,在京东2000,拼多多2000,苏宁2000,天猫2100,国美2100。

那么对于手机类型A来说,京东、拼多多、苏宁都是最省钱平台。

按照这个规则,我按照五大平台分别成为这621款手机的最省钱平台的次数,来进行排名。

爬取五大平台621款手机,告诉你双十一在哪买最便宜!

京东第一位,拼多多第二位,苏宁第三,国美第四,天猫最后一名!

不知道大家对这个统计数据有没有很惊讶!我是真的没想到竟然天猫排在国美后面!

我简单分析了一下,影响因素有以下几点:

  1. 中兴、联想、锤子等较小手机品牌,基本只在京东商城销售,这会导致对于这些品牌的手机来说,销售平台是京东,最省钱的平台也只能是京东。

  2. 统计时只统计了天猫店,比较小的淘宝店铺没有统计其中。

    (当然也不建议去淘宝小店购买手机这种大件)

  3. 相对于京东、淘宝来说,拼多多等新兴平台为了抢占市场,会进行价格补贴。

为了验证上面影响因素的1、2点,我又将手机款式限制为(只挑选华米OV的旗舰机,苹果Apple系列手机)。

爬取五大平台621款手机,告诉你双十一在哪买最便宜!

拼多多、苏宁靠着对旗舰手机的价格补贴,成功地把京东“挤”在了后面,同时天猫也挽回了一点颜面,成为了倒数第二名。

我又在各个平台看了一下旗舰机的优惠,发现拼多多百亿补贴这种行为简直降维打击。

比如下面这个iphone 11 64G的5119元已经是全网最低了,居然还能领券再减500(不过这个券我也没抢过,毕竟不打算换iPhone)

爬取五大平台621款手机,告诉你双十一在哪买最便宜!

爬取五大平台621款手机,告诉你双十一在哪买最便宜!

爬取五大平台621款手机,告诉你双十一在哪买最便宜!

最后,本次数据分析结果仅供参考,毕竟每个平台的价格都是波动的。

小五建议大家选取合适的手机款式之后,记得比比价,有优惠券就领券,有返利记得走返利。

希望大家双十一都能买到自己合适的商品。

本文转转自微信公众号凹凸数据原创https://mp.weixin.qq.com/s/KoTezwFrl40ul1R-JMyEVg,可扫描二维码进行关注: 爬取五大平台621款手机,告诉你双十一在哪买最便宜! 如有侵权,请联系删除。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
双十一预售活动分析
2022年双十一促销活动已经开始,大家应该都提前开始关注今年双十一活动的时间表了吧?2022年10月24日晚8:00天猫双11预售时间,第一波销售时间10月31日晚8:0,第二波销售时间11月10日晚8:00;天猫双11的优惠力度是跨店每满30050
Aidan075 Aidan075
3年前
爬取五大平台621款手机,告诉你双十一在哪买最便宜!
↑关注置顶有趣的不像个技术号今晚0点,相约剁手大家好,我是朱小五明天就是双十一了,看了看自己手里的卡的像IE浏览器的手机,感觉可能等不
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
9个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这