기타/WWW

data.gov.uk FAQ(자주하는 질문)

하늘이푸른오늘 2010. 2. 8. 14:56
며칠전 data.gov.uk 란 무엇인가 라는 글을 통해 아래글은 영국의 데이터공개운동(open data initiative)에 따라 구축된 http://www.data.gov.uk 에 대해 간단히 정리했었는데, 오늘은 FAQ (자주하는 질문) 문서를 번역했습니다.

정확한 내용을 파악할 수 없는 경우에는 마음대로 넘겨짚었기 때문에 오역이 있을 가능성이 높습니다. 정확한 내용을 원하시면 원문을 참고하시기 바랍니다.

아래 내용중에서 제가 중요하다고 생각한 내용을 요약하면 아래와 같습니다.

  • 1. 국가, 지방자치단체, 공공기관에서 생산한 데이터중, 개인정보와 일부 민감한 정보 외의 모든 데이터가 공개 대상이다. 현재 모두 올라와 있는 건 아니지만, 앞으로도 계속 공개할 예정이다.
  • 3. 이 사이트에 공개된 자료는 상업적으로도 사용할 수 있다. 자세한 내용는 라이선스 페이지를 읽어보면 되는데, 대략 데이터 소스만 밝히면 무료로 사용할 수 있는 것으로 보인다.

법적인 권한... 부분에 관한 내용은 영어가 좀 어렵네요. 공부좀 더했더라면... 싶습니다. 아무튼... 관심있는 분들께 도움이 되길~~

Q. 이 프로젝트가 하는 일은? (What is the project doing?)


정부에서는 일반인들이 정부에서 생산한 자료를 재사용할 수 있도록 데이터를 개방하는 중입니다. 개인정보와 민감한 정보를 제외한 학교 리스트나 범죄율, 의회(council)의 업무수행능력 등이 개방대상입니다.

우리가 이 작업을 정확하고 웹에 적합하도록 작업할 수 있도록, 수상은 월드와이드웹 창시자인 팀 버나스리(Tim Berners-Lee) 경웹과학 연구운동(Web Science Research Initiative)의 공동 설립자인 나이젤 샤볼트(Nigel Shadbolt) 교수를 조언자로 지정하였습니다.

이 프리뷰(preview) 사이트는 재사용가능한 정부데이터의 네트워크를 생성하는 제1단계입니다.

Q. 이 사이트의 상태는? (What is the status of this site?)


우리는 지금까지 몇개월간 이 사이트를 개선해 왔으며, 커뮤니티로부터 피드백을 받아왔습니다. 이 사이트는 완성된 것이 아니지만, 완벽한 것을 추구하는 것보다는 많은 사람들이 보고 사용하는 것이 좋다고 판단했습니다.

이 사이트에 대한 의견이 있으시면 알려주세요.

Q. 개인정보가 위험에 처할 가능성이 있습니까? (Will personal information be at risk?)


우리가 여기와 관련 웹사이트에 공개하는 데이터는 개인정보가 포함되어 있지 않으며, 개인을 구분할 수 있는 어떠한 방법도 제공되지 않을 것입니다. 다만, 교장이름과 같이 이미 공개된 정보는 예외입니다.

Q. 매쉬업이 무엇입니까? (What is a mashup?)


매쉬업이란 두개 이상의 자료나 어플리케이션을 결합한 웹페이지 혹은 웹 어플리케이션입니다. 매쉬업은 원래 자료의 생산자의 계획이나 의도를 넘어선 새로운 정보와 기능을 제공해 줍니다. 데이터 매쉬업은 한정된 자원으로도 새로운 웹 어플리케이션을 쉽고 빠르게 생성할 수 있다는 매력이 있습니다. 사람들은 시각화를 생성할 할 수도 있습니다. 시각화란 데이터를 명확하게, 상상력이 풍부하게 보여주는 그림으로, 이를 통해 숨어있는 정보에 대한 이야기를 말해줄 수 있습니다.

예를 들어 학교 주소와 학교 리그 테이블 같은 자료를 결합한 매쉬업은 학업 성취도가 높은 학교가 있는 곳을 보여주는 결과를 만들 수 있습니다. 이는 이사를 생각하고 있는 학부모에게 흥미로운 자료가 될 수 있습니다.

우리는 이 웹사이트를 통하여 협력의 산물로 새롭고도 흥미로운, 창의적이며 새로운  매쉬업이 탄생할 것이라고 기대하고 있습니다.

Q. Linked Data란 무엇이며, 시만텍 웹과는 어떤 관련이 있습니까? (What is Linked Data and how does it fit into the Semantic Web?)


시만틱 웹은 월드와이드웹의 진화로서, 단순히 문서를 서로 연결하는 것을 벗어나, 서로간의 관계에서 의미에 초점을 두고 있습니다. Linked Data는 이를 달성할 수 있는 기술의 집합으로서 데이터 웹을 만들 수 있습니다.

아래는 올해 TED에서 팀 버나스리 경이 시만틱 웹에 대해 발표한 것입니다.


기술적으로는 매우 복잡하지만, Jeni Tennison의 practitioner's 블로그Talis platform wiki와 같은 자원에서 아주 잘 설명되어 있는데, 중요한 것은 이를 통해 사람들이 정보에 대한 링크 및 그 정보에 대한 의미를 교환할 수 있다는 것입니다. 예를 들어, "Bartholomew School"을 가르키면,  "head teacher" 같은 속성을 가지며, "Oxfordshire에 있는 모든 학교" 집합의 일부라는 것까지 파악할 수 있게 됩니다.

Q. 어플리케이션이나 시각화 자료를 제출하는 방법은? (How can people submit applications and visualisations?)


Apps 페이지에 가시면 지금까지 많은 분들이 제출하신 어플리케이션이나 시각화자료를 보실 수 있으며,  여러분의 어플리케이션을 제출할 수 있는 링크가 있습니다. 직접 토론에 참여하실 수도 있습니다.

Q. 아이디어를 체출하는 방법은? (How can people submit ideas)


이 사이트는 기술 노하우를 가진 사람들만 위한 사이트가 아닙니다. 어플리케이션에 대한 좋은 아이디어가 있지만, 직접 구축할 수 없는 그런 사람들도 사용할 수 있습니다. idea 페이지로 가시면 이제까지 많은 분들이 제출한 아이디어를 보실 수 있으며, 여러분의 아이디어도 제출할 수 있습니다.

Q. data.gov.uk 의 사용방법은? (How can people use data.gov.uk?)


Data.gov.uk는 여러분이 원하는 자료를 여러가지 방법으로 찾을 수 있도록 검색엔진을 사용하고 있습니다. 현재 사용할 수 있는 모든 데이터셋을 한꺼번에 보실 수도 있지만, 키워드, 카테고리, 부처/부서 별로 검색할 수도 있습니다. 각각의 데이터셋은 그 자료에 접근할 수 있는 안내문이 포함되어 있습니다. 아울러 주제 태그 외에도 기관별, 국가별, 알파벳 순으로도 데이터셋을 보실 수 있습니다.

Q. data.gov.uk에 있는 데이터셋의 선택방법은? (How were the datasets in data.gov.uk selected?)


원칙적으로 공공 기관에서 생산한 정보중에서 개인정보 및 민감한 정보를 제외한 모든 정보가 재사용 가능대상입니다. 과거에는 지방정부, 광역정부, 개별 위원회 등에서 각각 다른 접근 방법을 채택했었습니다. 이제 정부에서는 보다 과거에는 접근할 수 없었던 공공 정보를 이 웹사이트를 통해 접근할 수 있도록 광범위하게 장려하고 있습니다. 우선순위에 대한 보다 자세한 사항은 "최첨단을 맨 앞으로: 보다 스마트한 정부"를 읽어보시기 바랍니다.

Q. 어떤 데이터셋을 사용할 수 없는 이유는? 언제쯤 사용할 수 있게 되는지? (Why is a particular dataset not available yet, and when will it be?)


데이터 랑이 엄청나게 많기 때문에 모든 데이터를 사용하게 되기까지 시간이 걸립니다. 보다 빨리 사용해야 한다고 생각하시는 데이터셋이 있다면 OSPI unlocking service에 알려주시기 바랍니다.

Q. 어떤 데이터셋에 API가 제공되지 않는 이유는? 언제쯤 사용할 수 있게 되는지? (Why is a particular dataset not available through an API yet, and when will it be?)


정부 데이터 공개에 관한 W3C 가이드에 따르면 데이터는 원시 포맷 그대로 공개함으로써 가능한 한 빨리 사용될 수 있도록 권고하고 있습니다. 시간이 지나면 우리는 Linked Data 표준을 따르도록 변환할 것입니다. Linked Data 표준에는 SPARWL end-pint를 통해서 접근할 수 있는데, 쉽게 재사용할 수 있도록 API도 제공합니다.

Q. 이 프로젝트와 접촉하는 방법은? (How can people make contact with the project?)


우리는 구글 그룹스(Google Group)을 통해 등록한 개발자 커뮤니티 멤버들에게 프로젝트 갱신사항을 제공할 것입니다. 또한 트위터를 통해 프로젝트 팀을 팔로우하거나, 블로그의 글을 통해서도 알려드릴 것입니다. 최신의 진척 상황및 개발상황을 알고 싶으시다면, 앱스페이지아이디어 페이지의 토론란을 이용해 주시기 바랍니다.

Q. 개발자들이 아이디어, 애플리케이션, 데이터 사용방법 등을 토론할 수 있는 곳이 있나요? (Is there a place for developers to discuss ideas, applications and using of the data?)


예, 토론 포럼(Discussion forum)이 바로 그 목적입니다. 우리는 여러분이 우리 또는 서로에게 질문을 하고싶어한다는 것을 알고 있으며, 최선을 다해 도와드릴 것입니다. 또한 위키(wiki)를 통해 서로 기술이나 아이디어, 문제, 도구 등을 공유하실 수 있습니다. 영국 정부 및 다른 기관의 데이터를 사용하여 사람들이 자신의 지역, 문제거리, 우리가 사는 세계 등을 이해하는데 도움이 될 수 있습니다.

Q. 장래에 더 많은 정보가 공개될까요? (Will more public data become available in the future?)


예, 지금은 시작에 불과합니다. 프로젝트가 성숙되면 더 많은 정보가 이 사이트에 공급될 것입니다.

Q. 상업적인 아이디어가 있을 때, 상업적 사용이 가능한지? (What are the commercial use rights if people have commercial ideas?)


영국 저작권Crown Copyright) 에 따르면, 모든 데이터를 상업적으로 사용할 수 있습니다. 우리 데이터가 상업적으로 활용될 기회가 있다면 무척 기쁠 것입니다.

Q. 데이터 라이선스는 어떻게 됩니까? (Under what licence is the data available?)


일반적으로 이 데이트는 영국저작권(Crown Copyright)에 따릅니다.  자세한 내용은 우리 라이선스 페이지를 읽어보시기 바랍니다.

Q. "해야할 것"과 "하지 말아야 할 것"이 있는지? (Are there any “do”s and “don’t”s?)


이 데이터를 여러분의 어플리케이션에 사용하는데 관련하여 간단한 행동강령이 있습니다. 이 가운데에는 우리 데이터를 여러분의 어플리케이션 데이터에 연결시키는 방법이 있는데, 간단한 상식적인 사용이면 문제가 없을 것입니다.

====