공간 데이터를 처리하는 DBMS는 포인트, 폴리라인, 폴리곤과 같은 공간 좌표 데이터를 효율적으로 저장하기 위해 BLOB 타입으로써 WKB라는 형태로 저장합니다. 개발하고 있는 지도 렌더러를 위한 맵엔진(코드명: Xr)에서 사용할 수치지도 데이터 포맷에 대해 고민하던 차에… GIS 데이터 표현의 범용 표준 중에 하나인 WKB에 대한 자료를 정리해 보았습니다.
WKB, 즉 Well-known Binary는 OpenGIS 스펙에 의해 정의된 지오메트리 값을 표현하기 위해 사용됩니다. KWB는 지오메트리 WKB 정보를 담고 있는 BLOB 타입의 값으로 표현되는 바이너리 스트림으로써 지오메트리 데이터를 상호간에 교환하기 위해 사용됩니다. WKB는 1바이트의 부호없는 정수와 4바이트의 부호없는 정수 그리고 8바이트의 배정밀 소수(IEEE 754)를 사용합니다. 여기서 1바이트는 8비트입니다.
예를 들면… WKT인 POINT(1 1)을 동일한 WKB로 변환해 본다면… 다음과 같은 총 21개로 구성된 연속된 바이트입니다.
0101000000000000000000F03F000000000000F03F
앞의 연속된 바이트를 해석 해보면… 다음과 같습니다.
즉, 첫번째 1바이트의 값이 1이면 바이트 정렬이 Little-Endian이며 0이면 Big-Endian이라는 의미입니다. 그리고 다음 2바이트는 지오메트리 타입으로써 현재까지 제안된 타입은 총 7개로써 Point, LineString, Polygon, MultiPoint, MultiLineString, MultiPolygon 그리고 GemetryCollection입니다. 끝으로 포인트의 좌표인 X와 Y 값이 각각 8바이트씩 오게됩니다.
앞의 예는 Point 타입에 대한 예이며 다른 지오메트리 타입에 대해서, 보다 직관적이고 효율적으로 파악하기 위해 C언어의 구조체 형식으로 보면 다음과 같습니다.
// Basic Type definitions // byte : 1 byte // uint32 : 32 bit unsigned integer (4 bytes) // double : double precision number (8 bytes) // Building Blocks : Point, LinearRing Point { double x; double y; }; LinearRing { uint32 numPoints; Point points[numPoints]; }; enum wkbGeometryType { wkbPoint = 1, wkbLineString = 2, wkbPolygon = 3, wkbMultiPoint = 4, wkbMultiLineString = 5, wkbMultiPolygon = 6 }; enum wkbByteOrder { wkbXDR = 0, // Big Endian wkbNDR = 1 // Little Endian }; WKBPoint { byte byteOrder; uint32 wkbType; // 1=wkbPoint Point point; }; WKBLineString { byte byteOrder; uint32 wkbType; // 2=wkbLineString uint32 numPoints; Point points[numPoints]; }; WKBPolygon { byte byteOrder; uint32 wkbType; // 3=wkbPolygon uint32 numRings; LinearRing rings[numRings]; }; WKBMultiPoint { byte byteOrder; uint32 wkbType; // 4=wkbMultipoint uint32 num_wkbPoints; WKBPoint WKBPoints[num_wkbPoints]; }; WKBMultiLineString { byte byteOrder; uint32 wkbType; // 5=wkbMultiLineString uint32 num_wkbLineStrings; WKBLineString WKBLineStrings[num_wkbLineStrings]; }; wkbMultiPolygon { byte byteOrder; uint32 wkbType; // 6=wkbMultiPolygon uint32 num_wkbPolygons; WKBPolygon wkbPolygons[num_wkbPolygons]; }; WKBGeometry { union { WKBPoint point; WKBLineString linestring; WKBPolygon polygon; WKBMultiPoint mpoint; WKBMultiLineString mlinestring; WKBMultiPolygon mpolygon; } };
바이너리는 크기면에서 데이터를 매우 최적화된 형태로 저장할 수 있는 포맷입니다. GIS 엔진을 설계하고 개발할때 자체 엔진에 특화된 데이터 구조를 설계하는 것 대신에 이러한 표준을 수용할 경우 얻을 수 있는 이점은 매우 크다고 할 수 있겠습니다.
이 글의 일부는 다음 URL에서 참고하였습니다.
http://dev.mysql.com/doc/refman/5.0/en/gis-wkb-format.html