在最近的项目中,完成了许多python处理矢量数据的算法程序,比如缓冲区分析、叠置分析、统计分析等,主要用到的是GDAL/OGR库,很多功能都参照了此链接中的示例:http://pcjericks.github.io/py-gdalogr-cookbook/#
由于完成的功能在上面链接中都能找到实现的代码,所以原来不打算写博客的,但是今天写的这个SHP转GeoJSON的算法把我坑得不轻,着实郁闷了好久才解决,因此就写一下权当纪念吧。有时候写程序真的是一件充满玄学的事情,原理上怎么看怎么对,但是运行起来却偏偏不是那回事,就算调试也给你不报错直接闪退,特别是处理空间数据时属性的编码问题,更是搞得人头皮发麻。这种情况下,能不能调的出来全靠运气,搞不好一个小问题卡一个星期都是正常,这可能也是程序员普遍发量稀少的原因吧。更加玄学的是,解决问题的方式又常常充满戏剧性,折腾了一个早上加半个下午没找到原因,起来喝杯水却突然灵感乍现,三四行代码调整一下顺序,一顿骚操作,点击运行,突然就能运行成功了,再看一下结果,还真是对的!山穷水尽疑无路,柳暗花明又一村,这种感觉真是刺激。
好了,将Shapefile转化为GeoJSON的完整代码如下:
1 # -*- coding: utf-8 -*-
2 from osgeo import ogr
3 import gdal
4 import sys
5 import os
6
7 def ChangeToJson(vector, output):
8 print("Starting........")
9 #打开矢量图层
10 gdal.SetConfigOption("GDAL_FILENAME_IS_UTF8", "YES")
11 gdal.SetConfigOption("SHAPE_ENCODING", "GBK")
12 shp_ds = ogr.Open(vector)
13 shp_lyr = shp_ds.GetLayer(0)
14
15 # 创建结果Geojson
16 baseName = os.path.basename(output)
17 out_driver = ogr.GetDriverByName('GeoJSON')
18 out_ds = out_driver.CreateDataSource(output)
19 if out_ds.GetLayer(baseName):
20 out_ds.DeleteLayer(baseName)
21 out_lyr = out_ds.CreateLayer(baseName, shp_lyr.GetSpatialRef())
22 out_lyr.CreateFields(shp_lyr.schema)
23 out_feat = ogr.Feature(out_lyr.GetLayerDefn())
24
25 #生成结果文件
26 for feature in shp_lyr:
27 out_feat.SetGeometry(feature.geometry())
28 for j in range(feature.GetFieldCount()):
29 out_feat.SetField(j, feature.GetField(j))
30 out_lyr.CreateFeature(out_feat)
31
32 del out_ds
33 del shp_ds
34 print("Success........")
35
36 if __name__ == '__main__':
37 shapefile = 'D:/Python37Work/HainanAOI/affected_bridge.shp'
38 out = 'D:/Python37Work/HainanAOI/affected_bridge.json'
39 ChangeToJson(shapefile, out)
有以下几个注意事项:
1、gdal.SetConfigOption("GDAL_FILENAME_IS_UTF8", "YES")和gdal.SetConfigOption("SHAPE_ENCODING", "GBK")
这两行用于支持中文,前一句用于支持文件名称及路径内的中文,后一句用于支持属性字段中的中文,最好将其放在最前面,否则读取矢量文件时不能按GBK编码方式读取。
2、out_lyr.CreateFields(shp_lyr.schema)和out_feat = ogr.Feature(out_lyr.GetLayerDefn())
这两句的顺序一定不能错,否则会导致部分字段无法写入,应该是先对out_lyr创建相应的字段,然后再由out_feat来一个个生成Feature。
最终生成的.json文件内容如下: