一日二技:MongoDB与 Scrapy 的小技巧各一个

举报
未闻Code 发表于 2022/02/10 20:04:16 2022/02/10
【摘要】 MongoDB与 Scrapy 各一个小技巧
今天我们来讲两个小技巧。

如何更新 MongoDB 中的一个数组

我们知道,如果想给 MongoDB 的一条文档增加一个字段,我们可以使用update_one方法:

import pymongo

handler = pymongo.MongoClient().db.col
handler.update_one({'name': 'kingname'}, {'$set': {'新的字段名': '新的字段值'}})

但如果有一个字段是数组,我想向这个数组里面添加一个元素。并且,如果这个元素之前就已经在这个数组中了,就什么也不做,只要之前不存在时才添加。

这个时候,我们就可以使用$addToSet操作符来实现这个功能。

这个操作符的语法为:

handler.update_one({'name': 'kingname'}, {'$addToSet': {'字段名': '要插入的元素'}})

我们来看一个例子。

例如对于如图所示的一条文档:

2.png

执行代码:

handler.update_one({'name': 'kingname'}, {'$addToSet': {'excellent': 'JavaScript'}})

运行以后,数组excellent变为如下图所示:

3.png

如果插入一条已经存在的数据,那么这个数组就不会变化。例如:

handler.update_one({'name': 'kingname'}, {'$addToSet': {'excellent': 'Python'}})

如何使用参数给 Scrapy 爬虫增加属性

在Scrapy 项目中,我们有时候需要在启动爬虫的时候,传入一些参数,从而让一份代码执行不同的逻辑。这个时候,有一个非常方便的方法,就是使用-a参数。它的语法为:

scrapy crawl 爬虫名 -a 参数1 -a 参数2 -a 参数3

那么,传入的这些参数,在爬虫里面怎么使用呢?其实很简单,你不需要做任何额外的配置,直接在爬虫里面通过self.参数名就可以调用了。例如下面这个爬虫:

4.png

大家可以看到,PyCharm 给两个属性self.body_nameself.age_from_cmdline标上了黄色的背景,这是因为PyCharm 找不到这两个属性是在哪里定义的。

但没有关系,我们启动 Scrapy 爬虫的时候,使用-a参数传递进去就好了:

scrapy crawl example -a body_name=kingname -a age_from_cmdline=28

运行效果如下图所示:

5.png

可以看到,这个接口成功接收到了这两个参数,并且把它显示了出来。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。