2018-12-10

확률 비교

  현종형이라면 고민하지 않았을 벼락맞을 확률이 얼마나 되는지 갑자기 궁금해 졌습니다. 구글링을 했더니 2009년 시사저널이 살아 있었을 때의 기사에서 미국번개안전연구원에서 28만분의 1이라고 했다고 합니다. 그 연구기관이 어떤 곳인지 모르니 나름대로 고민해 보기로 했습니다.
  기상청에 들어가 보니 구체적인 데이터가 있습니다. 낙뢰연보. 왕건입니다. 연도별 낙뢰 회수가 있구요


  또 월별 회수가 있습니다.


  연도별 회수를 보면 2017년 유난히 많았던 것을 볼 수 있고, 연중 7월에 거의 집중적으로 발생하는 것도 볼 수 있습니다. 벼락맞을 확률을 구하려고 하니 구할 방법을 생각해 보아야 하겠네요.
  10년간 매년 평균 144,949회 인구평균 4700만명.나누면 될까요? 아닙니다. 벼락이 사람에게만 떨어지는 것이 아니니 국토 면적도 필요하겠네요. 그러면 복잡해 지지요? 어떻게 해야 할까요? 전체 발생 건수와 전체 사상자수를 가지고 계산을 해야 할 것입니다.
  검색을 해보았는데 2005년 인하대학교 석사논문 하나에 1926년부터 2004년까지 보도자료를 바탕으로 사망209명, 중상 105명, 경상 63명의 통계자료가 있고, 노컷뉴스 2008년 10월 10일자에 한나라당의원의 국정조사자료로 사상자가 2004년 7명, 2006년 11명, 2007년 23명이라는 것 두 개를 찾았습니다.
  석사논문의 자료를 보면 전체 사상자는 377명이고 총 79년 누적 값이니 연평균 사상자는 4.77명이 나옵니다. 국회의원 자료를 어떻게 할까요. 그는 국정감사에서 4년간 급격하게 늘었다고 하는데 2005년의 피해기록이 없습니다. 2005년을 0으로 잡고 평균을 계산하니 10.25로 석사논문과 값 차이가 상당히 납니다. 연도별 발생이 늘어나는 추이가 있음을 전제도 두 값 모두 통계적용을 해보겠습니다. 원래 통계라는 게 그런 성질을 가지고 있습니다.
  연평균 인명피해가 4.77명이면 전체 평균 발생 건수 144,949건을 나누어 약 30,388분의 1의 값을 얻을 수 있고 10.25명 피해면 14,141분의 1의 확률을 얻을 수 있습니다. 기본적으로 1년동안 발생건수가 15만건인데 1명의 인명피해가 났다면 15만분의 1밖에 되지 않는 것입니다. 이것은 위의 월별로도 차이가 많이 나지만 지역별로도 차이가 많이 납니다. 미국은 28만분의 1이라잖아요. 지역별 통계는 기상청의 것을 보기 좋게 모양만 새로 했습니다.

  이상하리만치 전남지역에 많이 떨어집니다. 평야가 많아서라면 광주같은 대도시의 값이 큰 건 어떻게 설명합니까. 제일 큰 값인 광주의 7.07은 제일 작은 강원도의 1.26의 5.6배나 됩니다. 만약 피해자의 수가 같다면 그 배수만큼 맞을 확률이 크다는 것이고 기본적으로 떨어진 수만큼 피해를 입는다면 그 반대가 되겠지요. 주선생은 광주, 전남의 특이성을 이야기 했더니 나쁜 사람들이 많이 사나 보다고 농담합니다.
  생각해보니 방법이 하나 더 있었습니다. 국정감사자료에 해당하는 낙뢰연감을 찾아오는 것이었습니다. 찾았습니다. 2008년 연감입니다.

  이 때는 자료를 수치로 주지 않고 그래프를 제공해서 엑셀 표로 옮겼습니다. 위의 두 줄이고 아래 두 줄은 내가 작업한 것입니다. 이상합니다. 낙뢰 회수가 1백만건 안팎입니다. 다른 자료들을 열어보니 2008년과 2009년은 데이터값이 이렇게 거의 10배로 크고 2010년부터 현재와 값이 비슷해졌습니다. 기준이 달라진 것으로 짐작을 하는데 읽어봐도 내 눈엔 띄지 않습니다. 그래서 그대로 값을 인정하고 계산을 했습니다. 큰 값은 13만분의 1, 작은 값은 약 7만분의 1입니다. 그러고 보니 10년 주기로 낙뢰가 많이 발생했네요. 이 자료가 사실이라면.

댓글 없음:

댓글 쓰기

진인사대천명

   진인사대천명盡人事待天命. 사람의 일을 다 하고, 하늘의 명을 기다린다. 멋있는 척 하는 거 즐겨 하는 사람의 집에 가면 많이 걸려 있는 글귀입니다. 이 말의 어원은 여러 가지 입니다. 남송의 호인의 '독사관견'에 盡人事聽天命이 나오...