作者:朱小五
鸣谢:等你下课
周末好,我是小五
这周发生一件特别奇葩的事情,狗不理包子王府井总店被差评“又贵又难吃”,然后它竟然报警了?
起因呢,就是一个探店美食博主发现这家店在大众点评网上的评分是2.85分,是王府井/东单地区“评分最差餐厅”。于是就过去品尝了一番,结果视频发出后导致狗不理包子王府井总店报警了。本来还没多少人知道,这么一番操作大家就都知道了。
狗不理餐厅发布声明后,这件事直接上了热搜,后面店家又删除了声明。
这转眼一夜之间,热搜就没有了,但撤了热搜就能堵住众人之口?
要我说啊,狗不理就应该给每个打差评的顾客,挨个寄律师函))(看热闹不嫌事大)
作为一个技术号主,我来帮帮他们。
咱家店不就是王府井/东单地区“评分最差餐厅”嘛!不就是大众点评网上的评分是2.85分嘛!
好,那咱就从大众点评上的差评里选取打最低分的挨个寄律师函
在大众点评上,一共1939条评论,爬就完事了
那啥,狗不理
你看哈,你家店在大众点评的首页是
http://www.dianping.com/shop/k53rtfbSpvcdd80r
再往下翻到评价的界面,咦,差评真多
翻页,就会发现url的变化
http://www.dianping.com/shop/k53rtfbSpvcdd80r/review_all/p1
http://www.dianping.com/shop/k53rtfbSpvcdd80r/review_all/p2
注意控制爬取速度,我们只爬这一家店,也用不到换IP,慢慢爬就行。对,它还涉及个字体反爬,可以看看历史文章“破解****的字体加密,这一篇就够了。”
部分爬虫源码:
def get_data(html):
# 获取饭店的名称和链接
data = []
doc = pq(html)
for i in range(1,16):
#每页15个评价
dic = {}
name_1 = doc('#review-list > div.review-list-container > div.review-list-main > div.reviews-wrapper > div.reviews-items > ul > li:nth-child('+str(i)+') > div > div.dper-info > a').text()
dic['name'] = name_1
taste_1 = doc('#review-list > div.review-list-container > div.review-list-main > div.reviews-wrapper > div.reviews-items > ul > li:nth-child('+str(i)+') > div > div.review-rank > span.score > span:nth-child(1)').text()
dic['taste'] = filter_str(str(taste_1))
environment_1 = doc('#review-list > div.review-list-container > div.review-list-main > div.reviews-wrapper > div.reviews-items > ul > li:nth-child('+str(i)+') > div > div.review-rank > span.score > span:nth-child(1)').text()
dic['environment'] = filter_str(str(environment_1))
services_1 = doc('#review-list > div.review-list-container > div.review-list-main > div.reviews-wrapper > div.reviews-items > ul > li:nth-child('+str(i)+') > div > div.review-rank > span.score > span:nth-child(1)').text()
dic['services'] = filter_str(str(services_1))
comment_1= doc('#review-list > div.review-list-container > div.review-list-main > div.reviews-wrapper > div.reviews-items > ul > li:nth-child('+str(i)+') > div > div.review-words').text().replace('\n','')
dic['comment'] = comment_1
data.append(dic)
return data
保险起见,设置爬取每页time.sleep(10)
,丝毫没有引起反爬。
看看结果不错嘛。
成功获取信息
那个谁,给你家差评的人怎么多,你都要给谁寄律师函啊?
要不我挑挑“口味、环境、服务”全都打了最低分(0.5分)的顾客吧。
哎呀,竟然有117个
你看看他们说的都是什么词啊,我都看不下去了(狗头)
快给我个联系方式,我把这个名单给你
你说你想要这些顾客的个人信息啊,那我爬不到
要不你去问问点评网吧,他们要是不给你,你就再报警
以上纯属瞎扯。
讲真,许多老字号以前可能是某某当地美食/特产的代表,现在早已成了“雷区”。这次报警的行为,更是不思进取的代表。一个顾客在真实用餐后,真实评价,怎么能算是恶意中伤呢?那位博主甚至还在原视频中表示,有人说这家店的服务态度差,但他“并没有感觉到”。
狗不理包子的部分门店陆续关闭。在北京,狗不理包子金源店和狗不理包子东单店等都先后关闭,仅剩下前门店和王府井店。问题不打算从自身运营上找一找嘛?
马上也快到十一旅游季了,大家在外出旅游时也要擦亮眼睛,多看攻略和问当地朋友是更好的选择哦!
福利时间
安利一本📕:《机器学习与深度学习算法基础》市场上的机器学习/深度学习算法的入门书籍要么过于理论化和数学化,要么过于偏重实操,本书将两者更合理的结合在一起。点击下图可看详情/购买!👇
本文转转自微信公众号凹凸数据原创https://mp.weixin.qq.com/s/uYjzI4OVyJ7D6cBm9pGxOg,可扫描二维码进行关注: 如有侵权,请联系删除。