예전에 Tableau를 통해서 코로나 데이터를 정리하는 방법을 포스팅했던 적이 있습니다.
당시 data.go.kr의 데이터를 xml 방식으로 python으로 추출하는 방법을 설명드렸었는데, 그 방법 말고 조금 더 쉬운 엑셀로 데이터를 불러오는 방법으로 대시보드를 만들어 보도록 하겠습니다.
웹에 공유되는 xml 데이터를 가져와서 엑셀의 쿼리를 이용해서 표현합니다.
그렇다 보니 일단위로 새로고침을 하게 되면 자동적으로 데이터를 갱신해서 가져옵니다.
해당 파일의 작성일인 21년 7월 13일이다 보니 아래 보이는 것처럼 12일까지의 데이터가 자동으로 불러와졌습니다.
이 데이터를 가지고 다시 정리 한 후 그래프로 표현했습니다.
연간 현황은 연간 코로나 검사진행 수 와 일간 확진자 증가폭을 표현했습니다.
실제 최근 코로나 확진자가 증가되는 것이 그래프에 그대로 보입니다.
아래에 있는 최근 일주일과 월간 현황은 오른쪽 캄보 박스에서 선택한 날짜에 맞는 데이터가 그대로 불러와집니다.
현재 21년 6월 27일을 선택했기 때문에 해당 일자로부터 이전 일주일에 대한 격리 해제, 확진, 검사, 치료 중 환자 수 등이 나오게 됩니다.
오른쪽 월간 현황의 경우 선택한 6월 27일까지 와 5월 27일까지의 데이터를 상호 비교하도록 전원일 들어 있습니다.
5월 대비 6월에는 치료 중 환자가 감소하고 격리 해제되는 사람 수가 늘어났으며, 월간 확진자수가 감소하고 있는데 긍정적인 모습이 보이고 있었습니다.
실제로 날짜를 최근인 7월 12일로 변경했을 때는 아래와 같이 일간 확진자 수가 1000명이 넘어가고
6월 12일까지의 누적 데이터와 7월 12일까지의 누적 데이터를 계산했을 때 치료 중 환자수가 증가, 격리 해제수는 감소하면서 동시에 확진자수는 증가하고 있는 것을 볼 수 있습니다.
7월 들어 확진자수가 그만큼 많이 증가했다고 볼 수 있습니다.
데이터 연결 방법
data.go.kr 링크의 공개 API에 웹 방식으로 직접 연결
일전에 tableau를 통한 대시보드 제작에서 data.go.kr에 접속하거나 연결하는 방법을 설명드렸기 때문에 그 부분은 재차 설명드리진 않겠습니다.
열람 신청을 한 뒤 Open API 활용 가이드를 받게 되면 내부에 링크가 있습니다.
해당 링크에는 자신이 부여받은 인증키를 직접 넣어서 REST 방식의 인증키를 활용할 수 있도록 되어 있습니다.
해당 인증키 입력 부분에 각자 사이트에서 부여받은 개인 인증키(Encoding) 버전을 가지고 오면 됩니다.
그럼 긴 링크가 만들어질 텐데 해당 링크를 엑셀에 [데이터] - [데이터 가져오기 및 변환] - [웹]으로 연결하면 됩니다.
웹에서 데이터를 가져오게 될 경우 아래와 같이 데이터 탭이 열리게 됩니다.
URL을 통해서 데이터를 로드한 뒤 데이터 변환을 통해서 테이블을 불러옵니다.
이후 테이블에서 [원래 열 이름을 접두사로 사용] 항목을 해제해주게 되면 아래와 같이 모든 데이터가 로드됩니다.
해당 데이터를 불러온 뒤 [닫기 및 로드]를 선택하면 아래와 같은 표가 나오게 됩니다.
각 헤드의 이름은 openAPI 워드 파일을 참조해서 무엇을 뜻하는지 확인하면 됩니다.
2편에서는 불러온 데이터를 후가공하는 방법과 대시보드화 하는 방법을 설명드리도록 하겠습니다.
'데이터 분석 > 엑셀' 카테고리의 다른 글
[엑셀/EXCEL]코로나 대시보드 만들기_2 (0) | 2021.07.14 |
---|---|
[주가분석]연간 투자자별 매매동향 및 코스피 지수 (0) | 2021.03.27 |