공공정책을 위한 빅데이터 전략지도 (GIS United 지음)를 읽었습니다. 자세한 독후감을 남기는 건 제 체질이 아니지만, 그래도 여러가지로 느낀 점을 생각나는대로 순서없이 정리합니다.
서울시장 박원순의 추천글.
- "기술에서 시작하지 말고, 사람에서 시작하라" - Do not begin with technology. Begin with the people." 데이나 탐린(Dana Tomlin)
- 지도의 정교함보다 중요한 것은 나침반이 가리키는 방향
머리말
- 빅데이터의 원조는 세종... 전국민의 3% 여론조사, 세종실록 지리지. 통치의 기반이 데이터라는 것을 간파한 세종의 위대함은 당연하겠지만, 새롭고 많은 데이터를 쓴다고 하여 빅데이터는 아니죠.
- 미의회 보고서에서 "행정에 사용되는 정보의 80% 이상이 지리공간적인 것" - 이 명제는 GIS 분야에 종사하는 사람들에게 아주 친숙한 말이지만, 사실은 어느 GIS 소프트회사 사장이 만들어낸 말이라고 합니다. http://www.internetmap.kr/135 참조
1장 빅데이터 시대, 어떻게 정보를 활용할 것인가?
- 도시의 성패가 달린 6가지 역량. 지식/민주/문화/환경/기술/재무 역량... GIS는 환경과 기술정도와 관ㄹ련이 있나...
- 빅데이터를 활용한 서울시 심야버스. 2013년 주요정책 33개중 인기투표 1위. 심야버스가 지나는 정류장의 위치와 서울시 인구분포 - 500미터 반경을 기준으로 41.8 % .... 그러나, 이것만으로는 정책이 잘 시행되었는지는 잘 모르겠음.
2장 선거전에서 발휘된 빅데이터와 GIS 전략지도의 위력
- 오바마의 2012년 선거는 마이크로 타켓팅. 유권자의 세분화. 조지 부시의 선거참모 칼로브의 GIS 지도를 이용한 선거전략 (sasha issenberg, The victory lab : The secret science of Winning campaign) 오바마 캠프에선 GIS 데이터외에도 SNS 데이터를 분석 활용. 지역별 시내버스 광고. Jim Messina, 빅데이터 분석팀 The Cave 팀 운영하여 2012년 선거에 승리. 완벽한 마케팅의 승리라고 격찬을 받음
- 성동,광진 / 송파,강동 을 대상으로 선거구 지도 제작, 인구, 가구, 사업체, 아파트 공시가격 등 통계분석 - 후보별 득표에 영향을 준 변수를 분석. 100여가지 독립변수중.... 모든 변수중에서 아파트 기준시가만으로 설명률이 63%. 소득수준 변수가 가장 큼. 서울시장 선거 및 대통령 선거 모두 동일.... 소득이 낮으면 민주당쪽 이라는 결론. 아파트 기준시가를 소득수준으로 단순 대체한 문제. 신용카드 데이터를 보완하면 어떨지? 오바마의 선거전략과 비교해 볼때 분석이 너무 평면적이라고 보임
- 미국 공화당은 25가지 그룹으로 구분함. 오바마는 유권자 개개인을 의미있는 단위로 다루는 분석법... 마이크로 타겟팅.
- 하지만 빅데이터를 어떻게 활용해서 마이크로타게팅을 해냈다는 건지는 잘 모르겠음. 그리고... 우리나라는 가능할까? 하는 생각도...
3장 지역경제를 살리는 빅데이터의 활용 가능성
- 창업시장 70조원, 폐업규모 58조. 평균생존률 1년 72%, 2년 56%, 3년 46%, 4년 39%, 5년 33%. 창업자금지원, 전통시장 아케이드/주차장 건립 등 지역상권 살리기 정책은 큰 효과가 없다.
- 원하는 업종 카페-펜션-제과점-외류잡화 커피전문점 3년 생존률 33%
- 김해시 정육점의 사례 2008년 이후 손님급감. 중심상권이 구시가에서 신시가로 이동. 대형마트가 등장했기 때문. 시장조사. 리모델링. 외국인 근로자에 집중. 도시전체와 작인 인구집단의 변화를 동시에 살펴야 한다. 시설현대화에 맞췄던 초점을 경영역량을 강화하는 방향으로 변경해야.
- 신용카드 결제정보 전국 10만개 블록으로 나누어 소비결과를 취합. 20대와 70대의 강남역 상권 신용카드 소비패턴. 20대는 강남역 중심. 70대는 강남역 근접지역 중심의 소비.
- BC카드와 공동으로 동북4구 데이터 분석. 주로 노원역을 중점으로 형성. 기타 미아역 성신여대, 안암역 등 그런데 패션업종만 분리했을 경우 도봉산역 인근에 특이한 소비패턴. 아웃도어매출때문임. 동북4구 경제 활성화를 위해서 북한산/도봉산 탐방객을 타겟으로 한 정책. 아웃도어, 자연친화 체험활동
- 빅데이터의 가능성은 인근지역 거주자들의 특성 발굴. 새로운 매력요인 발굴 등
- 신용카드 정보가 빅데이터 인가? 어쨌든 신용카드 정보는 마케팅 등에 아주 중요한 정보임. 지역경제의 분석에 신용카드 정보 분석이 유용할 수 있다. 소비자들의 유형 파악에 도움. 어디에 거주하는 사람인지에 대한 정보, 그리고 소득수준에 관한 정보를 함께 사용할 수 있다면 정말 엄청난 데이터가 될 것 같음. 예시한 자료는 현상에 대한 분석일 뿐이며 빅데이터가 어떻게 활용되는지는 보여주지 못하지만...
4장 시민의 삶과 도시의 풍경을 바꾸는 대중교통 개선방안
- 도시교통의 중심이 대중교통으로 이동. 중앙차로, 준공영제, 무상버스, 올빼미버스
- 광주 광산구. 인구유입이 활발한 도시. 새로운 주거밀집지가 생김. 그러나 대중교통 인프라는 미흡. 도심과 신도심의 교통단절. "급행복지버스"의 도입. 기존의 GIS 분석기술
- 동북4구 생활권 분석 지하철 빈도가 낮음. 간선버스도 보완필요. 실질적 대안을 비교하기 위해 신용카드 회원정보(자택주소, 직장주소)를 사용하여 분석. 10%는 종로-을지로, 5%는 강남-삼성 쪽으로 출퇴근. 강남-삼성쪽 노선이 불충분. 성북구에서 강남으로 이동할 경우 대중교통 편의 증진 방안. 왕십리쪽 버스 추가를 제안
- 그런데... 교통분석에 대해서는 문제가 많은 것 같음 이 정도의 자료가 있다면 평균출퇴근 시간이 얼마나 되며, 또 새로운 노선 추가로 얼마나 시간이 단축되는지 등을 분석할 수 있어야... (물론 이것도 빅데이터와는 관련이 없다는) 전통적인 교통분석 전문가들과 협의가 필요하다고 보임
5장 빅데이터로 안전도시 만들기
- 우리나라 국민들이 보는 불안 요인 - 30%가 범죄. 특히 여자는 35%. 미국 국세청은 탈세, 사기 방지 시스템 구축
- 뉴욕 실시간 범죄센터. 강력범죄 발생건수 1993년 43만건에서 2014년 1950건으로 줄어듬. 출동하는 수사관에게 용의자 관련 정보를 실시간으로 제공(범죄기록, 보호관찰기록, 고소기록, 119 신고전화등) 강도 피해를 당한 피자가게 주인이 제공한 정보로부터 문신기록 등의 검색기능을 통해 즉시 검거. 범죄감시시스템 DAS 개설. 범죄발생시 현장주변 CCTV 통해 용의자 파악. 1-2초만에 특정 용의자 찾을 수 있음
- 보스톤 테러시 수만명 중에서 사흘만에 검색. 600대 CCTV, 트위터 페북 대화, 기지국 통화기록 등
- 범죄지도 Heat Map. 광산구의 범죄발생지도. 월세가구+아파트 회당 기준시가가 하위30% 이하와 겹치면 일치성 높음. 잠재적 우범지역 을 통해 대책 세울 수 있음.
- 현재의 CCTV 배치위치 등과 중첩하여 분석하면 훨씬 의미있는 결과를 얻을 수 있었을 것.
- 전혀 빅데이터와는 관련이 없음. 예전부터 있었던 기법들이며, 항상 요구하던 것들... 광산구의 행정경계를 표시하지 않은 것만 봐도 얼마나 민감한 데이터인지 알 수 있음.
이하는 정리하지 않음
====
지도 데이터는 비록 다른 데이터보다 양이 약간 많은 편이며, 복잡한 성격을 가지고 있지만 빅데이터가 아니다. 정형화된 포맷이 있고, 변화가 많지 않기 때문이다. 신용카드 데이터를 이용한 분석이 그나마 빅데이터 분석과 유사한 측면이 있겠지만, 그렇다고 해도 지도에 표현한 것일 뿐, 지도자체를 빅데이터의 일부로 분석한 것은 아니다. 요즈음 빅데이터가 한참 인기를 끌고 있는 용어이기 때문에 책 제목을 이렇게 했을 것이라는 것은 알지만...
그렇다고는 해도, 새로운 데이터를 사용하여, 새로운 분야에 지도분석 기법을 적용하여 의미있는 결과를 끄집어 낸 점에서는 의미가 있다고 생각됨. 아울러 단순한 기술의 나열이 아닌, 여러가지 사례를 중심으로 쉽게 써내려가서 전공하지 않은 분들도 어렵지 않게 읽을 수 있을 것 같음.
민, 푸른하늘