PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2020/03/29 15:19:43
Name worcester
Link #1 https://public.flourish.studio/visualisation/1717165/
Subject [일반] [보건] 대한민국 행정구역별 코로나-19 확진자수 그래프 (수정됨)
3월 초쯤인가... 할 것도 없이 집에서 놀고나 있었죠.
며칠 후 배치될 곳이 언제려나 싱숭생숭하고 있던 와중에, 질병관리본부에서 행정구역별 확진자수 데이터가 매우 잘 정리되서 나오고 있더군요.
그래서 매일 나오는 확진자수를 엑셀에 따로 정리하다보니... 오늘이 되어있더라고요.

그런데 이렇게 되다보니 가장 처음, 1번 환자부터 데이터를 정리하고픈 생각이 들었습니다.

그러지 말았어야 했습니다.

질본에서 행정구역별로 확진자수를 정리해서 올린 것은 2월 24일부터였고, 이때 전일대비 증가수까지 제공해준 것을 토대로 23일까지는 신뢰성있는 데이터를 얻을 수 있었습니다.
그 이전의 일일상황보고에서는 자세한 지역까지 기재된 경우가 드물었습니다. 사태 초반부엔 그럴 필요도 없을 만큼 확진자수가 적었고, 2월 18일부터는 오히려 매 시간마다 폭발적으로 늘어서 감당하기 힘들었겠지요.
그래서 뉴스, 지자체에서 그맘때쯤 직접 발표했던 사항들을 직접 검색해보기로 합니다.

그러지 말았어야 했습니다.

기자님들 참 별 기사를 다 쏟아내시고, 초반에 "몇 번 확진자" 라고 명시해주면 다행이었습니다. 이렇게 해서는 정리하는 데에 며칠 걸리면 다행인 정도겠더라고요.
그래서 우리들의 친구 나무위키를 켰고, 질본 일일상황보고 및 정례브리핑에서의 데이터와 맞춰보며 정리했습니다.

물론, 방금 자게의 어떤 글에서의 반응에서처럼 꺼무위키의 신뢰도가 높지만은 않은 것은 알고 있습니다. 하지만 사태 초반부터 집계 등에 있어서는 객관성을 유지하던 곳이기도 하고, 저도 일부 편집에 참여하면서 그런 것을 봐왔기에 아주 못믿을 것만은 아닌 것으로 판단됩니다.

확진자수가 행정구역마다 증가하는 추이를 어떻게 보여주는 것이 좋을지를 고민하다가, 예전부터 눈여겨보던 Flourish를 써봤습니다. 결과는 다음과 같습니다.

(iframe이 잘 먹히지 않아서 링크로 대체합니다. 그래프상 2월 18일 시점까지 마음의 준비는 해주세요.)


이와 별개로 제가 따로 가공해서 보던 "행정구역별 10만명당 확진자" 추이도 만들어봤는데, 글머리의 링크로 따로 올려뒀습니다.

이 데이터의 큰 맹점이라면, 2020년 2월 23일 이전 시점 데이터의 일관성 및 신뢰도가 떨어지는 것이겠네요.
물론 꺼무위키가 주된 이유인 점도 한 몫 하지만, 대부분 1차 소스가 있으니 생각보다 큰 문제는 안된다고 봅니다.
더 큰 문제는 데이터를 추합하는 시점입니다. 2월 23일부터 3월 1일까지는 09시 기준, 3월 2일부터는 0시 기준 집계된 확진자수를 토대로 했지만, 그 이전에는 이렇다할 기준이 없어 중구난방인 경우가 많았습니다. 최대한 질본 데이터를 따르도록 했지만 어려운 점도 있었고요.

또한 우한교민 중 확진자인 13번, 24번 확진자는 어느 행정구역 밑으로 집계되었는지 찾을 수가 없었는데, 국립중앙의료원이 있는 서울로 해보니 나중에 나온 질본 숫자와 맞아떨어지더군요. 물론, 나중에 다르게 재분류되었을 수도 있습니다.

10만명당 확진자수의 경우, 분모가 없는 데이터인 "검역"에 대해 완전히 무시할 수밖에 없는 부분도 있고요.

더 큰 문제라면... 그래서 이걸 어따가 써먹냐... 인데요.
글쎄요. 각 감염 클러스터의 임팩트가 얼마나 컸는지를 직접 보는 것? 그러기엔 신천지가 너무 컸기에 별 소용이 없을 수도 있겠군요.
저는 사실 10만명당 확진자수를 더 의미있게 보고있긴 합니다. 각 행정구역의 인구엔 차이가 있을 수밖에 없으니 행정구역끼리 비교하려면 그게 낫겠더라고요. 
지금까지도 힘들었으니 이쯤에서 끝났으면 싶습니다. 10만명당 확진자수가 서로 비슷해지는 건 상상하기도 싫거든요.


유튜브 minutephysics 채널에서 최근 올라왔던 비디오도 추천드립니다.
각 국가별 코로나의 증가추세가 그대로인지, 진정세인지 확인하는 방법을 설명해주는데요, 한국의 데이터를 토대로 한 부분이 많이 있네요. 확진자수도 많으면서 검사수도 많은 것, 그리고 타 국가에 비해서 진정세에 확실히 들어간듯한 모양새 때문인가 싶습니다.


통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
fallsdown
20/03/29 15:24
수정 아이콘
우와 이걸 어떻게만드셨어요 대단하십니다 확실히 31번확진자 이후로 훅 증가하는게 보이네요
worcester
20/03/29 15:35
수정 아이콘
이건 Flourish라고, 스프레드시트에 데이터만 채워넣고 몇 가지만 만져보면 이렇게 됩니다. 무료구요. (대신 모든 데이터를 공개해야 한다는 단점? 이 있지만요)

레딧 /r/dataisbeautiful 가시면 데이터가지고 별 것을 다 만드는 굇수들이 존재하니 그곳도 꼭 가보세요.

어제 올라온 것 중엔... 인구에서 전염병이 돌 때 각 상황에서 (자가격리, 봉쇄령, 아무것도 안 하기 등...) 어떻게 병이 퍼지고 몇명이 사망하는지 시뮬레이션 하던 게 있네요. 물론 시뮬레이션의 한계나 맹점은 있지만요.

https://www.reddit.com/r/dataisbeautiful/comments/fqf9tv
20/03/29 15:46
수정 아이콘
수고하셨습니다. 한눈에 보기에도 믿기지 않는..........대구는 순위권에도 없었는데..와 진짜 말도 안되는 증가폭이네요.
worcester
20/03/29 16:07
수정 아이콘
정확히 말씀드리자면 아마 31번 환자가 대구/경북권에서 처음으로 발견된 확진자일 겁니다. 휴...
김소혜
20/03/29 15:51
수정 아이콘
신천지의 위엄이네요...덜덜;;
worcester
20/03/29 16:08
수정 아이콘
앞으로는 저런 클러스터가 더 커지기 전에 잡혀야 될텐데 말입니다. 개인적인 생각으론, 새로이 생기는 건 어쩔 수 없는 것 같고요.
-안군-
20/03/29 18:18
수정 아이콘
초기에 코로나19의 전염성이 과소평가됐고, 신천지의 특수성이 합쳐져서 일이 커진것 같습니다. 유럽쪽은 스킨십이 잦은 문화와 스포츠 등이 결합된것 같고요.
적어도 우리나라는 신천지 같은 케이스는 더이상 없거나 있어도 소규모일겁니다. 교회같은곳도 신도들 사이에 공포심이 생긴데다가, 목사들도 우리교회에서 집단감염되면 X된다는 경각심이 생겨서 예전처럼은 안해요.
틀림과 다름
20/03/29 15:57
수정 아이콘
저기요, 링크글 위에
"심쿵할수 있으니 맘에 준비를 하시길 바랍니다"
라는 경고 필히 넣어주세요
인터넷에서 왠만한 그림 봐도 심쿵하지 않는 제 심장이 저걸 보고 심장마비 걸릴뻔했습니다

젠장할....(신천지 tb)
나의 드릴은 하늘을 뚫는 드릴이닷!!!!"
이런 환청이 들렸습니다
아 진짜...

너무 잘 만드셨다..
worcester
20/03/29 16:08
수정 아이콘
(수정됨) 더 무서운 것 알려드릴까요

전 세계적으론 저 추세에 근접하게 늘고 있습니다.
(제안하신 점 추가했습니다. 감사합니다!)
틀림과 다름
20/03/29 16:24
수정 아이콘
두번 보고는 더 이상 못보겠습니다
손발이 덜덜덜 떨려서요....
박근혜
20/03/29 16:00
수정 아이콘
완전 차트를 뒤집어 놓으셨다. 최고의 환자.
worcester
20/03/29 16:10
수정 아이콘
이것도 사재기인... 으흐흠흠.
더 뒤집히지 말고 이쯤에서 더 안늘고 끝났으면 제일 좋겠습니다.
드아아
20/03/29 16:55
수정 아이콘
확실히 x축을 날짜보단 누적확진자를 기준으로 하는게 파악하기 쉽군요. 이와중에 유독 튀는 국가가 크흠...
worcester
20/03/29 20:08
수정 아이콘
시간을 애니메이션으로 대신 보여준다는 개념도 다시 생각하니 괜찮더라고요. 엄밀히 말해서 2차원 그래프에 한 차원이 더해지는 거니...

유독 뒤에서 비슷한 궤적은 그릴까 말까 하면서 기어오고 있는 그 국가 말씀하시는 게 맞을까요?
드아아
20/03/29 20:12
수정 아이콘
아 그 발상도 참 좋다고 생각합니다.

역시 다같이 모아 놓으니 그게 참..맞는듯 아닌듯 혼자 길가는 그 국가 맞습니다.
VictoryFood
20/03/29 16:59
수정 아이콘
와 미리 준비하고 봐도 깜놀하네요.
worcester
20/03/29 20:11
수정 아이콘
2월 18일에 그 환자 1명만 나왔던 걸로 기억하는데, 정말 온갖 생각이 다 들더라고요.

뒤이어 온 웨이브는 상상도 못했던 스케일이었지만요. 저도 만들면서 그때 기억이 되살아났었네요.
Janzisuka
20/03/29 21:52
수정 아이콘
수고하셨습니다 감사합니다
20/03/29 22:02
수정 아이콘
(수정됨) 원글의 아래쪽에 첨부가 된 유튜브를 봤는데, 거기 나온 그래프가 좀 신기하군요. 감염자가 증가하는 경향이 지수함수라고 하면, 결국 저 그래프는 x축은 전체 감염수이고 y축은 새로 발견된 확진자 수이기 때문에, 지수함수를 따라서 감염이 지속되는 동안 그래프가 직선을 그리는 것은 당연합니다. 수식으로 표현하자면, x축인 전체 감염자의 수가 지수함수 ab^(ct) 라고 한다면, (a 는 최초 감염자수, b 는 한 감염자가 한번에 전파시키는 감염자의 수+1, c 는 감염 전파가 발생하는 빈도라고 볼 수 있음. 예를 들어 최초 감염자 1명이고 하루에 매일 한명씩 감염시킨다면 a=c=1 이고 b=2 이죠.), y축은 이것을 시간 t 에 대래서 미분을 한 ac log(b) b^(ct) 가 되어서, 결국 기울기는 c log (b) 가 됩니다. 즉, 일정한 기울기를 가지는 직선이 되는 거죠. 그런데, (제대로 검사를 안하기 때문에 데이터의 신뢰성이 떨어지는) 일본을 제외한 거의 모든 나라가 그 기울기도 일정하다는 이야기는, 결국 감염이 발생하는 빈도와 각 전파때 감염이 되는 사람의 수, 즉 감염의 전파속도가 모든 나라가 거의 동일하다는 점을 의미합니다. 즉, 정부에서 적극적으로 사회적 거리두기를 강제하고 감염자들을 격리시키는 등의 조치를 취하기 전 까지는, 전 세계 모든 나라에서 감염이 전파되는 속도는 기후, 자연환경, 사회체계, 생활방식, 사회적관습, 주거환경, 청결도 등등의 차이와 무관하게 거의 동일한 속도로 전파된다는 이야긴데... 제가 뭔가 잘못 생각한 것이 있는지도 모르지만 만일 맞다면 평소 상식과는 다른 의외의 내용이네요.
worcester
20/03/29 23:24
수정 아이콘
여왕의심복님의 최근 글이 하나 생각나는데요. 기상조건(온도/일교차, 습도, 미세먼지 등)에 따른 바이러스성 폐렴 상대적 위험도를 비교하셨는데, 결국 기상조건 그 자체보다는 사람의 활동이 더 중요한 요인이라는 결론을 내리셨었죠.
https://pgr21.co.kr/freedom/85246

특히 바이러스라는 것은 그 특성상 세균과는 달리 숙주 외부에서 증식을 할 수 없기 때문에, 세균으로 인해 발생하는 질병과는 달리 더욱 기후/청결도 등에 영향을 덜 받을 것이라 감히 추측해봅니다.

자연환경이나 사회체계는 도시화된 국가들 사이에서 그 차이가 더욱 줄 것 같고요. 생활방식은 도시화도 그렇지만 서구화라는 것 때문에 예전보다는 많이 비슷해지지 않았을까 싶어요.

또한 동물이나 다른 매개체가 없는 인간-인간의 직접 전파 (특정 환경에서 발생된 에어로졸 등 공기를 매개한 것을 제외하면) 라는 특성도 저러한 요인들에 의한 차이를 줄이는 데에 한몫하지 않았나 싶습니다.

당장 우리나라 데이터에서 가장 큰 변수였던 신천지 클러스터 감염의 가장 도드라지는 특성이 생활방식 내지는 관습이었는데, 전 국민이 신천지급 관습을 행하는 나라가 아니라면 눈에 띄는 차이가 나지 않을 수 있겠네요.

결론적으로, 생각보다 사람들이 살아가는 게 그리 다르지 않다 내지는, 바이러스라는 것 그 특성상 그 정도 다른 거 잘 안 따진다... 라는 뇌피셜/개인적인 생각입니다.


ps. 혹은 기울기 차이가 눈으로 볼 때엔 그리 크지 않게 느낄 수 있지만, 까보면 사실 큰 차이를 표하는 거일 수도 있나요?
20/03/29 23:39
수정 아이콘
31번은 정말 영구결번감이네요
티모대위
20/03/30 00:24
수정 아이콘
알고 봐도 충격먹을수밖에 없는 확진자 폭증....
곧미남
20/03/30 00:30
수정 아이콘
잘봤습니다. 진짜 31번 못잊을듯요
그리움축제
20/03/30 00:56
수정 아이콘
대구 튀어나오는 거 일본 대지진 여파 동영상 본 기분 드네요....
Albert Camus
20/03/30 11:51
수정 아이콘
아래 그래프가 굉장히 흥미로우면서 본질을 잘 꿰뚫고 있단 생각이 드네요
Cafe_Seokguram
20/03/30 15:12
수정 아이콘
이 건 진짜 숫자가 아니라 그래프로 봐야 확 들어오죠. 좋은 그래프 잘 봤습니다.

31번은 정말 영구결번감이네요 (2) ㅠ.ㅠ
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
85440 [일반] 재택근무하는 와중 꼭 봐야 하는 미드 몇 편 추천합니다. [62] This-Plus12983 20/03/30 12983 1
85439 [일반] 기록적인 유가 폭락에 투자를 검토하시는 분들에 대한 참고 [47] 맥스훼인11380 20/03/30 11380 5
85436 [일반] [스연] [보건] 일본 게닌 ( 개그맨) 시무라 켄 사망 [46] 아라가키유이13623 20/03/30 13623 1
85435 [일반] 사스나 메르스와 조금 다른 코로나 [26] 밀물썰물14403 20/03/30 14403 0
85434 [일반] [코로나] 독일 Hessen주의 재무 장관 자살 [24] 타츠야14406 20/03/30 14406 1
85433 [일반] [스연] 이번 코로나 바이러스로 다시 주목받은 영화 [13] Croove14244 20/03/30 14244 2
85432 [일반] [스연] 2020년 현재 중고등학생인 여자아이돌들 [20] VictoryFood16443 20/03/29 16443 0
85431 [일반] 요즘 맥주에 새우깡먹는게 취미네요.. [37] 무우도사11174 20/03/29 11174 0
85430 [일반] [스연][러블리즈] 지수랑 예인이 때문에 창피해서 고개를 못드는 지애.jpgif [11] 나의 연인8721 20/03/29 8721 1
85429 [일반] 코로나19 관련해서 시뮬레이션 싸이트 하나 소개합니다. [5] 마우스질럿8206 20/03/29 8206 1
85428 [일반] [스연] 2020년 3월 다섯째주 D-차트 : ITZY 2주 연속 1위! 세정 6위 진입 Davi4ever5943 20/03/29 5943 0
85426 [일반] [스연] '화양연화' 포스터 & 티저 예고편 [23] 빨간당근10943 20/03/29 10943 0
85425 [일반] [보건] 대한민국 행정구역별 코로나-19 확진자수 그래프 [26] worcester14861 20/03/29 14861 20
85424 [일반] 中 "기존 IP체계를 비롯한 인터넷 표준을 뉴IP로 개편하자" [59] Demanon14694 20/03/29 14694 0
85423 [일반] [단상] n번방, 다크웹 - 디지털 시대의 지하세계 [24] aurelius13486 20/03/29 13486 2
85421 [일반] 손석희의 연이은 거짓말? [106] 노하와이20309 20/03/29 20309 6
85420 [일반] [코로나] 재팬 패러독스! [133] 이호철19671 20/03/29 19671 3
85418 [일반] 쇼킹한 조주빈 여아 살해 모의 관련 청와대 청원 [62] 가라한16874 20/03/29 16874 18
85417 [일반] 코로나 19가 심장질환을 일으킬 가능성이 제시되었습니다. [23] 후상13746 20/03/29 13746 9
85416 [일반] [스연] 요즘 관심 가는 여돌 멤버 [10] 독수리의습격9572 20/03/29 9572 2
85415 [일반] 이 지역화폐가 대단하다 (서울) [32] 말다했죠14371 20/03/28 14371 2
85414 [일반] [스연] 심각하게 줄어든 음원 시장 규모.gaon [35] VictoryFood11461 20/03/28 11461 0
85413 [일반] [코로나] 주일독일대사관, 일본 통계 공식 비판 [122] aurelius20036 20/03/28 20036 21
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로