GEE:2014年至2021年的全球Bing地图图像中检测到777M的建筑数据集

举报
此星光明 发表于 2023/02/02 18:09:56 2023/02/02
【摘要】 ​全球ML建筑脚印必应地图正在发布全球范围内的公开建筑脚印。我们从2014年至2021年的Bing地图图像中检测到777M的建筑,包括Maxar和Airbus的图像。为了完整起见,早期发布的数据集也包括在这个数据集中,并被纳入其中。你可以在这里找到Github repo和关于方法的更多信息。数据集是压缩的,可作为不同地区的GeoJSON和GeoJSONL文件。关于预处理的其他信息和一些更多的...

全球ML建筑脚印
必应地图正在发布全球范围内的公开建筑脚印。我们从2014年至2021年的Bing地图图像中检测到777M的建筑,包括Maxar和Airbus的图像。为了完整起见,早期发布的数据集也包括在这个数据集中,并被纳入其中。你可以在这里找到Github repo和关于方法的更多信息。数据集是压缩的,可作为不同地区的GeoJSON和GeoJSONL文件。关于预处理的其他信息和一些更多的背景,可以在这里的博客上找到

免责声明:数据集的全部或部分描述是由作者或其作品提供的。

数据预处理
我将MSBuildings数据集纳入谷歌地球引擎,除了微软的7.77亿全球建筑足迹之外,还包括早期的版本,最终状态为10亿多足迹(1,069,059,359)。在整个摄取过程中,有一些有趣的性能行为。

有些数据集是以GeoJSON格式发布的,有些则是以大GeoJSON格式(GeoJSONL)发布的,虽然压缩后的大小足以限制硬件的类型,但解压缩后的提取物是大量的矢量文件。因此,需要对数据集进行分类和分割。
摄取时间在文件大小上不一定是线性的,似乎一个复杂的几何体需要更长的时间来摄取,尽管这并不是一个足够一致的概括。
极大的数据集被分割成较小的子集并被摄取。
摄取完成后,一个文件夹中的子集可以被合并、扁平化,并以不同程度的成功导出。

这里用到了一个函数:

ee.data.listAssets(parent, paramscallback)

Returns a list of the contents in an asset collection or folder, in an object that includes an assets array and an optional nextPageToken.

Arguments:

parent (String):

The ID of the collection or folder to list.

params (api.ProjectsAssetsListAssetsNamedParameters, optional):

An object containing optional request parameters with the following possible values:

  • pageSize (string) The number of results to return. Defaults to 1000.

  • pageToken (string) The token for the page of results to return.

  • filter (string) An additional filter query to apply. Example query:

properties.my_property>=1 AND properties.my_property<2 AND startTime >= "2019-01-01T00:00:00.000Z" AND endTime < "2020-01-01T00:00:00.000Z" AND intersects("{'type':'Point','coordinates':[0,0]}") See AIP-160: Filtering for how to construct a query.

  • view (string) Specifies how much detail is returned in the list. Either "FULL" (default) for all image properties or "BASIC".

callback (Function, optional):

If not supplied, the call is made synchronously.

Returns: api.ListAssetsResponse

ee.data.listAssets(parent ,参数,回调)
在包含资产数组和可选 nextPageToken 的对象中返回资产集合或文件夹中的内容列表。

参数:
parent(字符串):
要列出的集合或文件夹的 ID。

参数(api.ProjectsAssetsListAssetsNamedParameters,可选):
包含具有以下可能值的可选请求参数的对象:

pageSize(字符串)要返回的结果数。 默认为 1000。

pageToken(字符串)要返回的结果页面的标记。

filter (string) 要应用的附加过滤器查询。 示例查询:

properties.my_property>=1 AND properties.my_property<2 AND startTime >= "2019-01-01T00:00:00.000Z" AND endTime < "2020-01-01T00:00:00.000Z" AND intersects("{'type ':'Point','coordinates':[0,0]}") 请参阅 https://google.aip.dev/160 了解如何构建查询。

view(字符串)指定列表中返回的详细信息量。 所有图像属性的“FULL”(默认)或“BASIC”。
回调(函数,可选):
如果未提供,则同步进行调用。

返回:api.ListAssetsResponse

所有数据的展示形式

//所有数据的展示形式
var country  = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/{country_name}');

//所有的数据列表
var ee_folder = ee.data.listAssets("projects/sat-io/open-datasets/MSBuildings");

//这里是澳大利亚和智利的建筑物提取
var australia = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia');
var chile = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Chile')


//展示代码
var objects = ee.data.listAssets('projects/sat-io/open-datasets/MSBuildings')
print('Assets in MS Global Buildings Footprint Folder', objects['assets'])

print(ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia').size())

var feature = ee.FeatureCollection('projects/sat-io/open-datasets/MSBuildings/Australia')
Map.centerObject(feature.first(),6)
Map.addLayer(feature.style({fillColor: '00000000',color: 'FF5500'})),{},'Australia'

 

License

The datasets are released under the Open Data Commons Open Database License.

Created by: Microsoft

Curated in GEE by: Samapriya Roy

Keywords: building footprint, machine learning, remote sensing, global

Last updated in GEE: 2022-05-30

 

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。