城市传感器气象数据集
此数据集包含PM2.5,湿度、臭氧和二氧化氮、一氧化碳等。数据集的时间范围为2021年1月1日至现在
概述
Network 是一个低成本的城市空气质量传感网络,是微软研究院城市创新小组领导的一个研究项目
该网络于 2021 年 7 月开始部署,通过与芝加哥市、物联网项目、JCDecaux Chicago、环境法律和政策中心以及该市当地环境正义组织的合作。 记录了网络设计和数据校准策略。
存储资源
数据存储在西欧 Azure 区域的 Azure Blob 存储中的https://ai4edataeuwest.blob.core.windows.net/eclipse
文件中,位于.
在该容器中,定期发生的快照存储在 中chicago/YYYY-MM-DD
,其中YYYY-MM-DD
对应于快照的日期。
每个快照都包含从文件夹名称 YYYY-MM-DD 上的日期开始的 Parquet 格式的未来 7 天的传感器读数。
许可和归属
请引用:Daepp、Cabral、Ranganathan 等人。(2022) Eclipse:用于城市低成本、超本地环境传感的端到端平台。传感器网络中的 ACM/IEEE 信息处理。意大利米兰。
接触
有关此数据集的问题,请联系msrurbanops@microsoft.com@microsoft.com
学到更多
包含 Microsoft Research 项目 Eclipse的概述。
STAC 集合
提供者
(生产者、许可者、加工者) (主持人)执照
DOI
空间范围
Location: IL, United States.
Map style: grayscale_light.
时间范围
2021 年 1 月 1 日 – 至今项目级资产
数据集项目包含以下资产。
data
帐户名称
ai4edataeuwest列
每个表包括以下列。
数据集资产
abfs://eclipse/Chicago/
data
abfs://items/eclipse.parquet
geoparquet-items
是一个低成本的城市空气质量传感网络,是微软研究院城市创新小组领导的一个研究项目。
使用 STAC API
Eclipse 项目数据以一组 parquet 文件的形式分发——每周一个。我们可以使用 STAC API 来搜索特定周的文件。
代码:
Found 1 item
<Item id=Chicago-2022-02-27>
We'll load the parquet file with pandas.
City | DeviceId | LocationName | Latitude | Longitude | ReadingDateTimeUTC | PM25 | CalibratedPM25 | Humidity | O3 | NO2 | CO | BatteryLevel | PercentBattery | CellSignal | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | Chicago | 2002 | State & Garfield (SB) | 41.804031 | -87.631180 | 2022-02-27 00:04:04 | 9.126071 | 10.39 | 59.703064 | 37.728996 | 142.770187 | 0.105193 | 4.143906 | 91.634804 | -83.0 |
1 | Chicago | 2002 | State & Garfield (SB) | 41.793957 | -87.631485 | 2022-02-27 00:09:14 | 10.927937 | 11.60 | 60.223389 | 40.901974 | 142.898773 | 0.114015 | 4.142812 | 91.634804 | -80.0 |
2 | Chicago | 2002 | State & Garfield (SB) | 41.804031 | -87.631180 | 2022-02-27 00:14:24 | 10.395282 | 11.01 | 60.884094 | 33.247395 | 137.301682 | 0.096386 | 4.141094 | 91.634804 | -82.0 |
3 | Chicago | 2002 | State & Garfield (SB) | 41.804031 | -87.631180 | 2022-02-27 00:19:33 | 9.431242 | 10.61 | 61.984253 | 37.036892 | 130.622101 | 0.119355 | 4.142969 | 91.385475 | -81.0 |
4 | Chicago | 2002 | State & Garfield (SB) | 41.793957 | -87.631485 | 2022-02-27 00:24:44 | 9.648221 | 10.79 | 62.377930 | 36.423344 | 149.283890 | 0.125682 | 4.142344 | 91.385475 | -82.0 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
195436 | Chicago | 2212 | EPA Springfield Pump Station E | 41.909859 | -87.722046 | 2022-03-05 23:34:33 | 12.480565 | 14.46 | 55.670166 | 40.417656 | 96.079803 | 0.252798 | 4.156719 | 87.191406 | -86.0 |
195437 | Chicago | 2212 | EPA Springfield Pump Station E | 41.909859 | -87.722046 | 2022-03-05 23:39:43 | 10.866013 | 13.39 | 55.938721 | 44.407310 | 96.909615 | 0.249360 | 4.156719 | 87.191406 | -86.0 |
195438 | Chicago | 2212 | EPA Springfield Pump Station E | 41.909859 | -87.722046 | 2022-03-05 23:44:53 | 12.153159 | 14.26 | 56.143188 | 37.700886 | 101.764137 | 0.254816 | 4.157187 | 87.074219 | -86.0 |
195439 | Chicago | 2212 | EPA Springfield Pump Station E | 41.909859 | -87.722046 | 2022-03-05 23:50:03 | 15.439072 | 16.17 | 56.408691 | 28.147001 | 97.074806 | 0.242335 | 4.155937 | 87.074219 | -85.0 |
195440 | Chicago | 2212 | EPA Springfield Pump Station E | 41.909859 | -87.722046 | 2022-03-05 23:55:13 | 10.189906 | 12.80 | 56.704712 | 34.585629 | 101.608673 | 0.238499 | 4.156250 | 87.074219 | -87.0 |
195441 rows × 15 columns
# 41.8556863344578, -87.93552154031771
187943
该数据集包含了每个传感器的许多观测数据。我们可以通过选择每个传感器的第一个观测值,用地理坐标绘制每个传感器的位置。
代码:
使用一个命名的聚合,我们可以计算出每个传感器的摘要,并将其绘制在地图上。悬停在标记上可以看到每个传感器的平均校准PM25。
阅读完整的数据集
STAC集合包括一个数据资产,它链接到parquet数据集的根。这可以用来读取所有跨时间的数据。我们将使用Dask来读入数据集。
Dask DataFrame Structure:
City | DeviceId | LocationName | Latitude | Longitude | ReadingDateTimeUTC | PM25 | CalibratedPM25 | Humidity | O3 | NO2 | CO | BatteryLevel | PercentBattery | CellSignal | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
npartitions=44 | |||||||||||||||
object | int32 | object | float64 | float64 | datetime64[ns] | float64 | float64 | float64 | float64 | float64 | float64 | float64 | float64 | float64 | |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
Dask Name: read-parquet, 44 tasks
往期推荐:
Google Earth Engine(GEE)——Sentinel-2数据你真的用对了吗?
Google Earth Engine(GEE)—— GRIDMET: 爱达荷大学网格化地表气象数据集
Google Earth Engine——全球陆地冰层空间数据的介绍(内含常见错误)
利用GEE-APP(LT-GEE Time Series Animator)快速实现1984-2021年gif动图的下载
Google Earth Engine APP——不写代码实现影像图例添加和全球底图添加
Google Earth Engine APP——不写代码实现影像图例添加和全球底图添加
- 点赞
- 收藏
- 关注作者
评论(0)