【云享专家公开课】Lesson2:Python项目部署与调度,你将收获到什么?
爬虫项目在编写完成后往往需要部署到服务器上,以便定时执行。你一定很好奇,项目从部署到执行的过程会经历哪些阶段?如何运行Python 的 EGG 包?项目版本控制是如何实现的?具体的执行工作是如何规划的?如何为任意的 Python 项目生成对应的运行日志?任何 Python 项目都可以放到服务器上定时调度吗?
本期,华为云·云享专家团队邀请到云享专家、爬虫工程师韦世东先生为大家讲解《Python项目部署和调度》的相关内容,本次课程以著名的爬虫部署服务 Scrapyd 为例,可以深入了解 Python 项目部署与调度原理,并设计一个通用的 Python 项目部署“架构”。
本期课程的主要流程和内容安排:
第一、对本期直播的主题做一个简单的介绍。
第二、通过成熟的爬虫项目部署和调度平台 Scrapyd来了解爬虫项目从打包到部署,再到调度执行的整个过程,并整理出新平台的整体流程和新平台的功能规划。
第三、了解客户端功能实现的要点和方法,并通过项目演示的方式学习打包功能的逻辑和代码实现。我们还会了解到服务端功能实现的要点和方法,并通过项目演示的方式了解服务端的代码逻辑和关键技术点。
第四,我们将对本期所学知识做一个简短的总结。然后进入到提问答疑环节,这个环节,问题被选中的参与者可以获得华为云社区准备的精美礼物。
本期直播,我们要解决的问题是 PYTHON 项目部署于调度方面的问题。
我们可以将问题拆分为[部署]和[调度]两个方面,部署指的是在客户端打包项目,并传输到服务端的过程,我们可以将这个过程理解为文件压缩和上传。
调度指的是定时或者即时运行项目,而每次的调度可以看作是一个任务。
现在来说,市面上的部署工具分为打包和不打包两个流派。打包流派的项目如 Scrapy 团队研发的Scrapyd、微软工程师崔庆才编写的 Gerapy 和其他开发者编写的 SpiderKeeper等。不打包流派的项目如 PySpider 和 Fabric 等。但无论是打包流派还是非打包流派,它们都不能同时支持定时任务和其他 PYTHON 项目的运行。打包流派的几个项目,都只支持爬虫框架 Scrapy 编写的 PYTHON 项目,而 PySpider 只支持 PySpider 编写的爬虫项目。
我们将在直播过程中演示如何构建一个兼容性高、支持定时任务、并行执行、有版本控制功能、能够生成任意 PYTHON 项目运行日志的、可扩展的、打包流派的 PYTHON 项目通用的部署和调度平台。大家能够收获到版本控制、进程交互、定时任务、多机通信、PYTHON 项目打包和 PYTHON 包的传输与运行相关的知识。
华为云·云享专家简介:
延伸阅读:
- 点赞
- 收藏
- 关注作者
评论(0)