'분석'에 해당되는 글 2건

  1. 2015.01.28 살아 숨 쉬는 모든 것이 데이터가 되는 세상
  2. 2008.06.30 말 없는 목격자, 혈흔(血痕) (2)
살아 숨 쉬는 모든 것이 데이터가 되는 세상

한 사람이 성큼성큼 편의점에 들어선다. 물건은 고르지 않는다. 곧장 계산대로 향한다. 웃옷 오른쪽 주머니에서 손을 반쯤 꺼낸다. 오른손은 권총 손잡이를 쥐고 있다. 편의점 종업원이 어깨를 으쓱하며 턱으로 매장 안쪽을 가리킨다. 강도의 눈길도 턱이 가리킨 쪽을 향한다. 음료수 냉장고 앞에 선 경찰관이 허리춤에 손을 얹고 강도를 향해 고개를 젓는다. 강도는 경찰관과 눈이 마주치기 무섭게 편의점 문을 향해 내달린다.

우연의 일치가 아니다. 빅데이터의 힘이다. 영화 ‘마이터리티 리포트’에서는 예지몽을 꾸는 세 자매가 범죄가 일어나기 전에 징후를 포착했다. 현실은 영화와 다르다. 하지만 영화 같은 일은 나타난다.

로스엔젤레스 경찰청(LAPD)은 빅데이터를 분석해 범죄 발생 가능성을 점치는 범죄 예측 프로그램(Predictive Policing)을 개발했다. 이미 벌어진 범죄 종류와 범행 시간과 장소를 분석해 범죄 발생 확률을 실시간으로 순찰차에 보낸다. 순찰 중인 경찰관은 범죄 발생 확률이 높은 지역을 알아내 그 곳을 집중적으로 순찰했다¹.

경찰이 빅데이터를 순찰 근무에 활용하자 범죄 발생 건수가 획기적으로 낮아졌다. 절도사건은 33%, 폭행 사건도 21% 줄어들었다. 이런 추세는 9년 동안 이어졌다. 애초에 범죄가 일어나지 않도록 예방한 것이다. 경찰이 추구하는 최선의 결과다. 로스엔젤레스 경찰이 꿈을 실현해낸 힘은 빅데이터다.

■ 빅데이터 = 4V

빅데이터(big data)는 말 그대로 엄청나게 거대한 데이터를 뜻한다. 생활이 디지털로 이뤄지면서 사람들은 엄청나게 많은 데이터를 쏟아낸다. 2012년 한 해 동안 인류가 만든 데이터 양은 2.8제타바이트(ZB)였다. 그동안 인류가 생산한 모든 데이터보다 많다. 데이터가 너무 많은 탓에 이를 유용한 정보로 가공하기란 불가능에 가까웠다. 컴퓨터 성능이 발전하고 클라우드 서비스와 하둡(Hadoop, 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술) 같은 분석 도구가 상용화돼 대용량 정보를 저렴한 비용으로 처리할 수 있게 되면서 방대한 데이터 속에 파묻힌 의미를 사람이 헤아릴 수 있는 길이 열렸다.

단순히 데이터가 많다고 모두 빅데이터라고 부르지는 않는다. 전문가는 빅데이터가 크게 네 가지 특성을 지닌다고 말한다. 첫 번째는 물론 크기(Volume)다. 빅데이터는 페타바이트(PB) 정도 크기를 지닌다. 1페타바이트는 1,024테라바이트(TB)다.

두 번째 조건은 다양성(Variety)이다. 빅데이터는 컴퓨터가 손쉽게 분석할 수 있도록 데이터베이스(DB)로 정리된 정형 데이터뿐 아니라 동영상이나 사진, 사람이 쓴 자연어 와 같은 비정형 데이터도 포함한다. 컴퓨터가 바로 이해할 수 없는 비정형 데이터도 DB처럼 인식해야 하기 때문에 자연어 처리, 컴퓨터 비전, 기계 학습 같은 데이터 처리 기술이 필요하다.

속도(Velocity)가 세 번째 조건이다. 컴퓨터가 바로 이해할 수 없는 방대한 데이터를 처리할 수 있다고 해도 분석에 시간이 너무 많이 들면 소용없다. 시간도 비용이다. 데이터를 수집하고 가공해 분석해내는 과정을 실시간으로 또는 일정 안에 처리해야 한다.

요약해 보자. 빅데이터는 마냥 큰 데이터가 아니다. 그런 데이터를 효과적으로 처리해 의미 있는 정보를 얻어내는 기술이다. 그런데 빅데이터가 왜 필요할까. 방대한 데이터 속에서 가치 있는 정보를 발굴하기 위해서다. 구슬 서 말이라도 꿰어야 보배다. 아무리 자료가 많아도 그 속에서 의미를 찾지 못하면 아무짝에도 쓸모없다. 그래서 빅데이터가 지녀야 할 마지막 조건으로 가치(Value)를 꼽는 이도 있다. 일명 ‘4V’다.

■ 무의미 속에서 의미를 찾다

빅데이터는 사회에서 벌어지는 모든 일을 분석해 활용할 수 있도록 한다. 장님 코끼리 더듬듯 직감에 의존해 중대한 결정을 내리는 대신 객관적인 근거를 바탕으로 예측 가능한 일을 벌일 수 있다.

빅데이터를 가장 먼저 도입하는 분야는 마케팅이다. 광고나 홍보 담당자는 사람들의 숨겨진 욕구를 끄집어 내 물건을 팔기 위해 계속 시장 조사를 벌인다. 빅데이터는 굳이 소비자에게 설문지를 들이밀지 않아도 그 사람의 생각을 엿볼 길을 연다.

감기약 만드는 회사가 광고를 만든다고 치자. 제약 기술이 발전해 약 효능은 다 비슷비슷하다. 결국 마케팅으로 승부를 걸어야 한다. 이 제약 회사는 빅데이터 분석을 의뢰한다. 페이스북이나 트위터 같은 사회 관계망 서비스(SNS)에서 사람들이 감기 걸렸을 때 올린 글 수 백만건을 수집한다. 그리고 그 속에서 감기 환자가 ‘서럽다’는 단어를 많이 사용한다는 사실을 발견한다. ‘감기’와 ‘혼자’가 함께 들어간 문장을 보면 ‘서럽다’는 단어가 나올 확률이 퍽 높아졌다. 이 회사는 자사 제품이 혼자 사는 마당에 감기까지 걸려서 서러운 이를 엄마 손처럼 보듬는다는 광고를 만들어 낼 수 있을 테다. 홀로 감기에 시달려본 사람은 이 광고에 공감할 가능성이 커진다. 소비자에게 선택 받을 가능성도 덩달아 커진다.

전문가의 ‘촉’에 많이 기대는 콘텐츠 제작 분야에서도 데이터가 힘을 발휘한다. 미국에서 주문형 스트리밍 방송을 제공하는 넷플릭스(Netflix)는 고객 정보를 철저하게 분석해 그들이 원하는 콘텐츠를 공급한다. 처음엔 볼 만한 영화를 추천해주는데 그쳤던 빅데이터 분석 기술은 발전을 거듭했다. 넷플릭스는 자체 분석 알고리즘으로 고객이 무슨 드라마를 보고 싶어 하는지 알아내 맞춤형 콘텐츠를 만들었다. 유명 드라마 ‘하우스 오브 카드’다.

스토리와 감독, 배우 모두 고객 입맛에 맞췄다. 심지어 드라마 한 시즌을 몰아보는 고객의 소비 패턴에 맞춰 개봉일 드라마 13화 모두를 공개했다. 하우스 오브 카드’ 덕분에 넷플릭스는 2013년 1분기에만 300만 명이 넘는 고객을 끌어 모았다. 같은 해 매출은 37억 5천만 달러, 창사 이래 최대치였다. 부진한 실적 때문에 한때 나스닥에서 쫓겨날 지도 모를 처지였던 넷플릭스는 빅데이터 덕분에 타임워너에 맞먹는 미디어 기업으로 발돋움했다.

글머리에 보여준 로스엔젤레스 경찰처럼 사회 문제를 해결하는데 빅데이터 기술을 활용할 수도 있다. 택시나 버스 같은 대중교통이 쏘는 운행 정보를 분석해 구간별 실시간 교통 상황을 전하는 서비스는 이제 당연하게 쓰인다.

■ 모바일에서 웨어러블로…, 살아 숨 쉬는 모든 일이 데이터가 되는 세상

빅데이터는 날이 갈수록 커진다. 일상생활 속에서 데이터를 만드는 기기가 계속 늘어나기 때문이다. 스마트폰에 실린 센서는 사용자 위치 정보뿐 아니라 그곳의 온도와 습도도 측정한다. 이런 정보를 모으면 기상청보다 더 정확한 실시간 날씨 지도를 만들 수도 있다.

애플 워치 같은 웨어러블 기기가 보급되면 더 많은 정보가 쏟아질 것이다. 웨어러블 기기에는 맥박이나 혈압 같은 생체 정보를 측정하는 센서가 실린다. 이런 데이터가 쌓이면 무궁무진한 일을 할 수 있다. 보험회사는 고객의 생체 정보를 바탕으로 실시간으로 보험요율(Premium Rate)을 조정할 수 있다. 술을 자주 먹는 고객은 보험료를 올리고, 규칙적으로 운동하는 고객은 보험료를 내리는 식이다. 음주 횟수가 많아지면 사고를 당할 확률이 커진다는 빅데이터 분석이 전제가 된다. 병원에서는 웨어러블 기기를 찬 환자가 갑자기 심장박동이 불규칙하게 변하면 이를 확인하고 조치를 취할 수 있다. 이 역시 특정 이상 징후가 어떤 질병의 전조라는 분석 결과를 활용하는 것이다.

시장조사 기관 가트너(Gartner, 미국 IT분야 리서치 & 어드바이저리 전문 업체)는 “데이터가 미래 경쟁력을 좌우하는 21세기 원유”라고 빗대며 빅데이터를 관리하고 이를 활용하지 못하면 경쟁에서 살아남을 수 없다고 경고했다. 조만간 빅데이터라는 말이 사라질지도 모른다. 모두가 빅데이터 기술을 바탕으로 서비스를 꾸릴 테니 말이다.

결국 중요한 건 사람이다. 빅데이터 분석은 컴퓨터가 할 일이지만, 어떤 데이터를 어떻게 분석해 어디에 활용할지 결정하는 일은 사람이 할 일이다. 통계와 컴퓨터 과학을 아우르면서 사회적인 면도 고려할 줄 아는 통섭적인 인재가 그 어느 때보다 필요하다.

<참고 자료>
1) Predictive Policing 웹사이트 : http://www.predpol.com/

글 : 안상욱 블로터닷넷 기자

저작자 표시 비영리 변경 금지
신고
사용자 삽입 이미지
서울 교외의 한 흉가에서 살인사건이 일어났다. 빈방 안에는 두 사람의 시체와 벽에 뿌려진 다량의 혈흔이 있었다. 문제는 누가 가해자이고, 누가 피해자인지 모른다는 점이다. 두 사람 중 한 사람이 다른 한 사람을 살해하고 스스로 목숨을 끊었거나, 서로 가해자이거나, 제 3자의 범행일 수도 있다. 이런 사건이 생겼을 경우 어떻게 범인을 밝혀낼까? 중요한 단서인 혈흔의 분석을 통해 함께 추적해보자!

만약 사람이 날카로운 도구에 찔리거나 뭉툭한 무언가에 얻어맞으면 피를 흘리게 된다. 이때 부상의 유형과 위치, 정도, 가해진 힘 등에 따라 서로 다른 혈흔이 만들어진다. 핏방울이 형성되는 과정, 공기 중을 이동하는 속도, 여러 형태의 표면에 부딪힐 때 핏방울이 일으키는 반응을 정확하게 파악하고 있으면 수사는 한결 쉬워진다.

혈흔형태의 분석 결과는 사건 현장을 가장 잘 설명할 수 있는 것으로 진술 또는 분석 결과들과 일치해야 한다. 만약 여러 가지 분석 결과로 범행이 입증되었다 해도 혈흔형태 등 현장의 분석 결과와 기록이 이를 입증할 수 없다면 범죄를 확인할 수 없는 결과를 가져올 수도 있다.

혈흔의 형태는 사건 현장에서 혈흔의 여러 가지 특징을 분석함으로써 다양한 추측이 가능하다. 예를 들어 범인과 피해자가 사건 당시 매우 심하게 다투었을 경우 범인도 피를 흘렸을 가능성이 있다. 이때 비산된 혈흔 가운데 자유낙하 혈흔(정지된 상태에서 중력의 힘에 의해 떨어진 혈흔)이 발견되거나 또는 다른 혈흔과 전혀 다른 각도에서 비산된 혈흔이 있다면 이는 범인이 흘린 혈흔일 가능성이 크다.

충격 각도가 예각이면 혈흔은 90도에서 만들어지는 둥근 형태가 아닌 타원형을 취하게 된다. 충격의 각도가 줄어들수록 혈흔은 더 길어지고, 약 30도에서 혈흔의 꼬리가 가장 눈에 잘 띄게 된다. 조가비 형태의 혈흔은 핏방울이 수평 방향으로 이동했다는 것을 알려준다. 각도가 예각일수록 핏방울의 한쪽에는 조가비 형태가 아예 없게 되지만 반대쪽에는 아주 긴 조가비 형태가 나타나게 된다.

또한 범인이 심하게 다쳐서 도주한 경우 혈흔이 형성된 모양을 통해 범인이 도주한 경로와 방향을 추정할 수 있다. 즉, 움직이면서 떨어진 혈흔의 경우 움직인 방향 쪽으로 위성 혈흔(본래의 혈흔 방울에서 떨어져 나가서 형성된 톱니모양의 혈흔)이 형성된다. 위성 혈흔의 가로와 세로의 비율에 따라 도주 당시의 속력을 추정하여 당시 상황을 재구성해본다. 그리고 이를 채취하여 분석을 하면 범인의 혈액형 및 유전자형을 알 수 있어 범인을 좁혀갈 수 있고, 용의자가 잡히면 그의 유전자형과 비교하여 일치하는지 여부를 판단할 수 있게 되는 것이다.

과학향기링크사건 현장에서 혈흔의 흐름과 왜곡 현상이 많이 관찰되었다면 자살의 가능성은 작아진다. 즉, 피해자가 알 수 없는 둔기 등으로 맞아 의식을 잃고 출혈된 경우 혈액은 보통 중력 방향으로 흐른다. 중간에 누군가 시신을 움직이면 왜곡이 일어나 혈흔의 흐름의 방향이 바뀌게 된다. 시신 등에서 발견되는 왜곡 혈흔은 범인이 시신을 옮기거나 다른 변화를 주었다는 것을 입증하는 것이다.

혈흔이 없는 빈공간은 어떠한 물건이 놓여 있었는데 사후에 물건이 없어졌다는 것을 의미한다. 또한 여러 가지 혈흔의 비산된 방향을 분석하면 혈흔이 어느 곳으로부터 비산되었는지를 확인할 수 있어 범행의 중심 장소를 추정할 수 있다. 이는 실험실에서도 미리 충격된 혈흔으로 줄기법(혈흔에 수많은 선을 연결하여 혈흔의 시작점을 찾는 법) 등을 사용하여 분석을 하면 기원점을 정확하게 찾을 수 있다.

이 밖에도 여러 가지의 혈흔의 모양이 실제의 사건현장에서 관찰된다. 손, 머리카락 등에 묻은 혈흔이 다른 물건에 묻은 경우의 전달된 혈흔, 코 등에서 호흡에 의해 분출된 호기 혈흔, 파리 등이 옮겨서 마치 비산된 작은 혈흔처럼 보이는 파리 얼룩 등 다양한 혈흔의 모양이 존재하고 이들은 사건 당시의 상황을 그대로 보여주고 있는 것이다.

사건 현장에 다양하게 존재하는 이러한 혈흔들은 범행도구로부터 혈흔이 이탈되는 속도에 따라 보통 저속 혈흔, 중속 혈흔, 고속 혈흔의 3가지 종류로 나눈다. 저속 혈흔의 경우 초속 25피트(약 7.62m) 이하의 속도의 힘에 의해 만들어진 것인데, 자연적으로 떨어진 자유낙하혈흔 등이 해당된다. 중속 혈흔은 초속 25피트~100피트(약 7.62m~30.48m)의 힘이 가해진 것으로, 동맥분출혈흔이나 이동하면서 흘린 혈흔 등이 해당된다. 고속 혈흔은 초속 100피트(약 30.48m) 이상의 충격에 의해 만들어지는데 주로 총상이나 폭발에 의한 혈흔, 호기된 혈액 등이 해당된다.

혈흔의 형태와는 달리 혈흔의 양이 문제가 되는 경우도 있었다. 사건이 발생했는데 피해자는 다량의 혈흔만 남기고 실종된 상태였다. 용의자는 그를 폭행한 사실은 있지만 그를 살해하지는 않았다고 했다. 유전자분석 결과 혈흔은 분명히 피해자의 것이 맞았다. 하지만 그가 죽었는지를 알 수가 없었다. 따라서 흘린 혈흔의 양이 정말 치사량에 이를 수 있는 양인지를 추정해야 했다. 정밀하게 혈흔의 양을 측정한 결과 흘린 피가 치사량에 가까운 것으로 계산되었다. 이 사건은 결국 사법사상 처음으로 간접적인 증명으로 시신이 없는 살인죄가 인정되었다.

외국은 1983년 11월에 매도널 박사에 의해 국제혈흔형태분석전문가협회(IABPA)가 결성되었으며 한국도 지난 2008년 6월 5일 한국혈흔형태분석학회가 창립되어 출범하였다. 살인 사건 등 강력 범죄가 끊이지 않고 있지만 현장에 흔적이 있는 한, 완전범죄란 없다. 사건 당시에 피해자 또는 범인이 흘린 혈흔이 진실을 말해주고 있기 때문이다.

글 : 박기원 국립과학수사연구소 유전자분석과 실장

ndsl링크 <출처 : 한국과학기술정보연구원 >
신고
1 
BLOG main image
생활에 밎줄 긋는 과학이야기♡ -KISTI의 과학향기-
by 과학향기

카테고리

분류 전체보기 (1178)
과학향기 기사 (892)
과학향기 이벤트 (1)
과학향기 독자참여 (1)
이런주제 어때요? (1)

달력

«   2017/12   »
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
tistory!get rss Tistory Tistory 가입하기!
Clicky Web Analytics

티스토리 툴바