- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

创业创业，有点风险，读取数据做个商务分析

香菜聊游戏发表于 2022/06/26 21:56:57 2022/06/26

【摘要】 1、起因过完年了，作为程序也很老了，所以想搞个副业看看，但是盲目的创业是不行的，方向大于努力，所以选对方向很重要，数据调研第一步，不能盲目出招，浪费时间，浪费精力，最主要浪费我的血汗钱。上班的时间基本都在点外卖，所以想做做外卖，因为自己是小白，所以想找个品牌外卖店加盟，但是大都知道加盟店比较坑，所以还是得谨慎，做做调研。2、数据爬取数据的爬取选择的平台是两个大的外卖平台，想看下商圈的外卖单量...

1、起因

过完年了，作为程序也很老了，所以想搞个副业看看，但是盲目的创业是不行的，方向大于努力，所以选对方向很重要，数据调研第一步，不能盲目出招，浪费时间，浪费精力，最主要浪费我的血汗钱。

上班的时间基本都在点外卖，所以想做做外卖，因为自己是小白，所以想找个品牌外卖店加盟，但是大都知道加盟店比较坑，所以还是得谨慎，做做调研。

2、数据爬取

数据的爬取选择的平台是两个大的外卖平台，想看下商圈的外卖单量，做一个调研，爬取的数据内容就是外卖的品类，单量，还有名字，位置，这些基本数据，然后做个总结，分析下商圈内的数据。

3、爬取步骤

1、确认爬取的网址

爬取的数据来源最初选择的是app，本地的方案是夜神模拟器和Charles，装了环境搞了几下，没搞清楚头绪，这个方案就放弃了

在xxx的官网经过一阵搜索找到了h5 的界面，似乎这个界面是不公开了，找了半天终于找到入口

h5.xxx.me/

经过一波三折终于找到，但是在登录之后还是要跳转到官网，所以再次输入这个网址就可以了

xxx 请自行替换

最终爬取的数据接口为：

h5.xxx.me/restapi/sho…

2、分析网址

数据的请求方式是get请求，所以参数全在url中

latitude=31.296829

&longitude=120.736135

&offset=16

&limit=8

&extras[]=activities

&extras[]=tags

&extra_filters=home

&terminal=h5

前两个数据是经纬度，也就是定位信息的偏移，这个数据决定了拉去的数据，这里也是我只要要定位的地方。

offset 不知道这个偏移是什么意思，我猜测可能是第几个吧，不重要

limit 我猜是单页多少个数据

terminal 是终端的类型，基本上

3、分析返回数据

{
has_next: true,
items: - [
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
},
- {
restaurant: + {... }
}
],
meta: - {
rankId: "",
rankType: - {
505517688: "33"
}
}
}

最外成的数据格式是这样的，我们要的是restaurant这层数据，也是要重点分析的

restaurant: - {
act_tag: 0,
activities:[],
address: null,
authentic_id: 502101541,
average_cost: null,
baidu_id: null,
bidding: null,
brand_id: 710858,
business_info: "{"pickup_scheme":"https://tb.xxx.me/wow/a/act/eleme/dailygroup/682/wupr?wh_pid=daily-186737&id=E14670700902593244","ad_info":{"isAd":"false"},"recent_order_num_display":"月售1244"}",
closing_count_down: 14234,
delivery_fee_discount: 0,
delivery_mode: + {... },
description: null,
distance: 2804,
favor_time: null,
favored: false,
flavors: + [... ],
float_delivery_fee: null,
float_minimum_order_amount: 20,
folding_restaurant_brand: null,
folding_restaurants:[],
has_story: false,
id: "E14670700902593244",
image_path: "https://img.alicdn.com/imgextra/i2/2212739556234/O1CN01jzFa3R1vvDoDnsojl_!!2212739556234-0-koubei.jpg",
is_new: false,
is_premium: true,
is_star: false,
is_stock_empty: 0,
is_valid: null,
latitude: null,
longitude: null,
max_applied_quantity_per_order: -1,
name: "切果匠（湖东CBD店）",
next_business_time: "明天 9:30",
only_use_poi: null,
opening_hours: - [
"9:30/0:10"
],
order_lead_time: 42,
out_of_range: false,
phone: null,
piecewise_agent_fee: + {... },
platform: 0,
posters:[],
promotion_info: null,
rating: 4.7,
rating_count: null,
recent_order_num: 1244,
recommend: + {... },
recommend_reasons: + [... ],
regular_customer_count: 0,
restaurant_info: null,
scheme: "https://h5.xxx.me/newretail/p/shop/?store_id=546110047&geolat=31.296829&geolng=120.736135&o2o_extra_param=%7B%22rank_id%22%3A%22%22%7D",
status: 1,
support_tags: + [... ],
supports:[],
target_tag_path: "35a1bb9025ab98c28112d82f83f73d7ejpeg",
theme: null,
type: 1
}

数据看起来还是比较好懂的，这里我们需要的数据就是

name 外卖店的名字

business_info.recent_order_num_display 销量数据

activities 是店铺活动数据

opening_hours 是店铺的营业时间

support_tags 是店铺的分类

4、爬取数据

爬取数据的代码我还没写全，所以上面都是分析

爬取数据的核心就是伪装成正常的请求，我们已经看到了数据的web接口，基本上没什么了

一般也就是

cookie要求

js加密

token 要求等等

因为我并不是批量使用，所以可以在web端登录之后，直接使用数据，伪装成web就可以了，最不济可以直接使用seleunim 进行爬取，所以问题不大

5、总结

看下数据似乎有些品牌的销量不错，但是看不到店铺的开业时间，所以没办法判断是不是买量的行为，但是平均的销量不高，有点两极分化，做外卖的形势严峻，挣得是辛苦钱，平台还从营业额中抽取15% ，去掉加盟费，商铺租金，还有各种设备费，还真是不少花钱。最终钱都被平台挣去了，作为商家基本上没什么。所以不推荐

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

创业创业，有点风险，读取数据做个商务分析

1、起因

2、数据爬取

3、爬取步骤

1、确认爬取的网址

2、分析网址

3、分析返回数据

4、爬取数据

5、总结

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

创业创业，有点风险，读取数据做个商务分析

1、起因

2、数据爬取

3、爬取步骤

1、确认爬取的网址

2、分析网址

3、分析返回数据

4、爬取数据

5、总结

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品