创业创业,有点风险,读取数据做个商务分析

举报
香菜聊游戏 发表于 2022/06/26 21:56:57 2022/06/26
【摘要】 1、起因过完年了,作为程序也很老了,所以想搞个副业看看,但是盲目的创业是不行的,方向大于努力,所以选对方向很重要,数据调研第一步,不能盲目出招,浪费时间,浪费精力,最主要浪费我的血汗钱。上班的时间基本都在点外卖,所以想做做外卖,因为自己是小白,所以想找个品牌外卖店加盟,但是大都知道加盟店比较坑,所以还是得谨慎,做做调研。2、数据爬取数据的爬取选择的平台是两个大的外卖平台,想看下商圈的外卖单量...

1、起因

过完年了,作为程序也很老了,所以想搞个副业看看,但是盲目的创业是不行的,方向大于努力,所以选对方向很重要,数据调研第一步,不能盲目出招,浪费时间,浪费精力,最主要浪费我的血汗钱。

上班的时间基本都在点外卖,所以想做做外卖,因为自己是小白,所以想找个品牌外卖店加盟,但是大都知道加盟店比较坑,所以还是得谨慎,做做调研。

2、数据爬取

数据的爬取选择的平台是两个大的外卖平台,想看下商圈的外卖单量,做一个调研,爬取的数据内容就是外卖的品类,单量,还有名字,位置,这些基本数据,然后做个总结,分析下商圈内的数据。

3、爬取步骤

1、确认爬取的网址

爬取的数据来源最初选择的是app,本地的方案是夜神模拟器和Charles,装了环境搞了几下,没搞清楚头绪,这个方案就放弃了

image.png

在xxx的官网经过一阵搜索找到了h5 的界面,似乎这个界面是不公开了,找了半天终于找到入口

h5.xxx.me/

经过一波三折终于找到,但是在登录之后还是要跳转到官网,所以再次输入这个网址就可以了

xxx 请自行替换

image.png

最终爬取的数据接口为:

h5.xxx.me/restapi/sho…

2、分析网址

数据的请求方式是get请求,所以参数全在url中

latitude=31.296829

&longitude=120.736135

&offset=16

&limit=8

&extras[]=activities

&extras[]=tags

&extra_filters=home

&terminal=h5

前两个数据是经纬度,也就是定位信息的偏移,这个数据决定了拉去的数据,这里也是我只要要定位的地方。

offset 不知道这个偏移是什么意思,我猜测可能是第几个吧,不重要

limit 我猜是单页多少个数据

terminal 是终端的类型,基本上

3、分析返回数据

{
has_next: true,
items: - [
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
}
],
meta: - {
rankId: "",
rankType: - {
505517688: "33"
}
}
}

最外成的数据格式是这样的,我们要的是restaurant这层数据,也是要重点分析的

restaurant: - {
act_tag: 0,
activities:[],
address: null,
authentic_id: 502101541,
average_cost: null,
baidu_id: null,
bidding: null,
brand_id: 710858,
business_info: "{"pickup_scheme":"https://tb.xxx.me/wow/a/act/eleme/dailygroup/682/wupr?wh_pid=daily-186737&id=E14670700902593244","ad_info":{"isAd":"false"},"recent_order_num_display":"月售1244"}",
closing_count_down: 14234,
delivery_fee_discount: 0,
delivery_mode: + {... },
description: null,
distance: 2804,
favor_time: null,
favored: false,
flavors: + [... ],
float_delivery_fee: null,
float_minimum_order_amount: 20,
folding_restaurant_brand: null,
folding_restaurants:[],
has_story: false,
id: "E14670700902593244",
image_path: "https://img.alicdn.com/imgextra/i2/2212739556234/O1CN01jzFa3R1vvDoDnsojl_!!2212739556234-0-koubei.jpg",
is_new: false,
is_premium: true,
is_star: false,
is_stock_empty: 0,
is_valid: null,
latitude: null,
longitude: null,
max_applied_quantity_per_order: -1,
name: "切果匠(湖东CBD店)",
next_business_time: "明天 9:30",
only_use_poi: null,
opening_hours: - [
"9:30/0:10"
],
order_lead_time: 42,
out_of_range: false,
phone: null,
piecewise_agent_fee: + {... },
platform: 0,
posters:[],
promotion_info: null,
rating: 4.7,
rating_count: null,
recent_order_num: 1244,
recommend: + {... },
recommend_reasons: + [... ],
regular_customer_count: 0,
restaurant_info: null,
scheme: "https://h5.xxx.me/newretail/p/shop/?store_id=546110047&geolat=31.296829&geolng=120.736135&o2o_extra_param=%7B%22rank_id%22%3A%22%22%7D",
status: 1,
support_tags: + [... ],
supports:[],
target_tag_path: "35a1bb9025ab98c28112d82f83f73d7ejpeg",
theme: null,
type: 1
}

数据看起来还是比较好懂的,这里我们需要的数据就是

name 外卖店的名字

business_info.recent_order_num_display 销量数据

activities 是店铺活动数据

opening_hours 是店铺的营业时间

support_tags 是店铺的分类

4、爬取数据

爬取数据的代码我还没写全,所以上面都是分析

爬取数据的核心就是伪装成正常的请求,我们已经看到了数据的web接口,基本上没什么了

一般也就是

cookie要求

js加密

token 要求等等

因为我并不是批量使用,所以可以在web端登录之后,直接使用数据,伪装成web就可以了,最不济可以直接使用seleunim 进行爬取,所以问题不大

5、总结

看下数据似乎有些品牌的销量不错,但是看不到店铺的开业时间,所以没办法判断是不是买量的行为,但是平均的销量不高,有点两极分化,做外卖的形势严峻,挣得是辛苦钱,平台还从营业额中抽取15% ,去掉加盟费,商铺租金,还有各种设备费,还真是不少花钱。最终钱都被平台挣去了,作为商家基本上没什么。所以不推荐



【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。