살아 숨 쉬는 모든 것이 데이터가 되는 세상

한 사람이 성큼성큼 편의점에 들어선다. 물건은 고르지 않는다. 곧장 계산대로 향한다. 웃옷 오른쪽 주머니에서 손을 반쯤 꺼낸다. 오른손은 권총 손잡이를 쥐고 있다. 편의점 종업원이 어깨를 으쓱하며 턱으로 매장 안쪽을 가리킨다. 강도의 눈길도 턱이 가리킨 쪽을 향한다. 음료수 냉장고 앞에 선 경찰관이 허리춤에 손을 얹고 강도를 향해 고개를 젓는다. 강도는 경찰관과 눈이 마주치기 무섭게 편의점 문을 향해 내달린다.

우연의 일치가 아니다. 빅데이터의 힘이다. 영화 ‘마이터리티 리포트’에서는 예지몽을 꾸는 세 자매가 범죄가 일어나기 전에 징후를 포착했다. 현실은 영화와 다르다. 하지만 영화 같은 일은 나타난다.

로스엔젤레스 경찰청(LAPD)은 빅데이터를 분석해 범죄 발생 가능성을 점치는 범죄 예측 프로그램(Predictive Policing)을 개발했다. 이미 벌어진 범죄 종류와 범행 시간과 장소를 분석해 범죄 발생 확률을 실시간으로 순찰차에 보낸다. 순찰 중인 경찰관은 범죄 발생 확률이 높은 지역을 알아내 그 곳을 집중적으로 순찰했다¹.

경찰이 빅데이터를 순찰 근무에 활용하자 범죄 발생 건수가 획기적으로 낮아졌다. 절도사건은 33%, 폭행 사건도 21% 줄어들었다. 이런 추세는 9년 동안 이어졌다. 애초에 범죄가 일어나지 않도록 예방한 것이다. 경찰이 추구하는 최선의 결과다. 로스엔젤레스 경찰이 꿈을 실현해낸 힘은 빅데이터다.

■ 빅데이터 = 4V

빅데이터(big data)는 말 그대로 엄청나게 거대한 데이터를 뜻한다. 생활이 디지털로 이뤄지면서 사람들은 엄청나게 많은 데이터를 쏟아낸다. 2012년 한 해 동안 인류가 만든 데이터 양은 2.8제타바이트(ZB)였다. 그동안 인류가 생산한 모든 데이터보다 많다. 데이터가 너무 많은 탓에 이를 유용한 정보로 가공하기란 불가능에 가까웠다. 컴퓨터 성능이 발전하고 클라우드 서비스와 하둡(Hadoop, 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술) 같은 분석 도구가 상용화돼 대용량 정보를 저렴한 비용으로 처리할 수 있게 되면서 방대한 데이터 속에 파묻힌 의미를 사람이 헤아릴 수 있는 길이 열렸다.

단순히 데이터가 많다고 모두 빅데이터라고 부르지는 않는다. 전문가는 빅데이터가 크게 네 가지 특성을 지닌다고 말한다. 첫 번째는 물론 크기(Volume)다. 빅데이터는 페타바이트(PB) 정도 크기를 지닌다. 1페타바이트는 1,024테라바이트(TB)다.

두 번째 조건은 다양성(Variety)이다. 빅데이터는 컴퓨터가 손쉽게 분석할 수 있도록 데이터베이스(DB)로 정리된 정형 데이터뿐 아니라 동영상이나 사진, 사람이 쓴 자연어 와 같은 비정형 데이터도 포함한다. 컴퓨터가 바로 이해할 수 없는 비정형 데이터도 DB처럼 인식해야 하기 때문에 자연어 처리, 컴퓨터 비전, 기계 학습 같은 데이터 처리 기술이 필요하다.

속도(Velocity)가 세 번째 조건이다. 컴퓨터가 바로 이해할 수 없는 방대한 데이터를 처리할 수 있다고 해도 분석에 시간이 너무 많이 들면 소용없다. 시간도 비용이다. 데이터를 수집하고 가공해 분석해내는 과정을 실시간으로 또는 일정 안에 처리해야 한다.

요약해 보자. 빅데이터는 마냥 큰 데이터가 아니다. 그런 데이터를 효과적으로 처리해 의미 있는 정보를 얻어내는 기술이다. 그런데 빅데이터가 왜 필요할까. 방대한 데이터 속에서 가치 있는 정보를 발굴하기 위해서다. 구슬 서 말이라도 꿰어야 보배다. 아무리 자료가 많아도 그 속에서 의미를 찾지 못하면 아무짝에도 쓸모없다. 그래서 빅데이터가 지녀야 할 마지막 조건으로 가치(Value)를 꼽는 이도 있다. 일명 ‘4V’다.

■ 무의미 속에서 의미를 찾다

빅데이터는 사회에서 벌어지는 모든 일을 분석해 활용할 수 있도록 한다. 장님 코끼리 더듬듯 직감에 의존해 중대한 결정을 내리는 대신 객관적인 근거를 바탕으로 예측 가능한 일을 벌일 수 있다.

빅데이터를 가장 먼저 도입하는 분야는 마케팅이다. 광고나 홍보 담당자는 사람들의 숨겨진 욕구를 끄집어 내 물건을 팔기 위해 계속 시장 조사를 벌인다. 빅데이터는 굳이 소비자에게 설문지를 들이밀지 않아도 그 사람의 생각을 엿볼 길을 연다.

감기약 만드는 회사가 광고를 만든다고 치자. 제약 기술이 발전해 약 효능은 다 비슷비슷하다. 결국 마케팅으로 승부를 걸어야 한다. 이 제약 회사는 빅데이터 분석을 의뢰한다. 페이스북이나 트위터 같은 사회 관계망 서비스(SNS)에서 사람들이 감기 걸렸을 때 올린 글 수 백만건을 수집한다. 그리고 그 속에서 감기 환자가 ‘서럽다’는 단어를 많이 사용한다는 사실을 발견한다. ‘감기’와 ‘혼자’가 함께 들어간 문장을 보면 ‘서럽다’는 단어가 나올 확률이 퍽 높아졌다. 이 회사는 자사 제품이 혼자 사는 마당에 감기까지 걸려서 서러운 이를 엄마 손처럼 보듬는다는 광고를 만들어 낼 수 있을 테다. 홀로 감기에 시달려본 사람은 이 광고에 공감할 가능성이 커진다. 소비자에게 선택 받을 가능성도 덩달아 커진다.

전문가의 ‘촉’에 많이 기대는 콘텐츠 제작 분야에서도 데이터가 힘을 발휘한다. 미국에서 주문형 스트리밍 방송을 제공하는 넷플릭스(Netflix)는 고객 정보를 철저하게 분석해 그들이 원하는 콘텐츠를 공급한다. 처음엔 볼 만한 영화를 추천해주는데 그쳤던 빅데이터 분석 기술은 발전을 거듭했다. 넷플릭스는 자체 분석 알고리즘으로 고객이 무슨 드라마를 보고 싶어 하는지 알아내 맞춤형 콘텐츠를 만들었다. 유명 드라마 ‘하우스 오브 카드’다.

스토리와 감독, 배우 모두 고객 입맛에 맞췄다. 심지어 드라마 한 시즌을 몰아보는 고객의 소비 패턴에 맞춰 개봉일 드라마 13화 모두를 공개했다. 하우스 오브 카드’ 덕분에 넷플릭스는 2013년 1분기에만 300만 명이 넘는 고객을 끌어 모았다. 같은 해 매출은 37억 5천만 달러, 창사 이래 최대치였다. 부진한 실적 때문에 한때 나스닥에서 쫓겨날 지도 모를 처지였던 넷플릭스는 빅데이터 덕분에 타임워너에 맞먹는 미디어 기업으로 발돋움했다.

글머리에 보여준 로스엔젤레스 경찰처럼 사회 문제를 해결하는데 빅데이터 기술을 활용할 수도 있다. 택시나 버스 같은 대중교통이 쏘는 운행 정보를 분석해 구간별 실시간 교통 상황을 전하는 서비스는 이제 당연하게 쓰인다.

■ 모바일에서 웨어러블로…, 살아 숨 쉬는 모든 일이 데이터가 되는 세상

빅데이터는 날이 갈수록 커진다. 일상생활 속에서 데이터를 만드는 기기가 계속 늘어나기 때문이다. 스마트폰에 실린 센서는 사용자 위치 정보뿐 아니라 그곳의 온도와 습도도 측정한다. 이런 정보를 모으면 기상청보다 더 정확한 실시간 날씨 지도를 만들 수도 있다.

애플 워치 같은 웨어러블 기기가 보급되면 더 많은 정보가 쏟아질 것이다. 웨어러블 기기에는 맥박이나 혈압 같은 생체 정보를 측정하는 센서가 실린다. 이런 데이터가 쌓이면 무궁무진한 일을 할 수 있다. 보험회사는 고객의 생체 정보를 바탕으로 실시간으로 보험요율(Premium Rate)을 조정할 수 있다. 술을 자주 먹는 고객은 보험료를 올리고, 규칙적으로 운동하는 고객은 보험료를 내리는 식이다. 음주 횟수가 많아지면 사고를 당할 확률이 커진다는 빅데이터 분석이 전제가 된다. 병원에서는 웨어러블 기기를 찬 환자가 갑자기 심장박동이 불규칙하게 변하면 이를 확인하고 조치를 취할 수 있다. 이 역시 특정 이상 징후가 어떤 질병의 전조라는 분석 결과를 활용하는 것이다.

시장조사 기관 가트너(Gartner, 미국 IT분야 리서치 & 어드바이저리 전문 업체)는 “데이터가 미래 경쟁력을 좌우하는 21세기 원유”라고 빗대며 빅데이터를 관리하고 이를 활용하지 못하면 경쟁에서 살아남을 수 없다고 경고했다. 조만간 빅데이터라는 말이 사라질지도 모른다. 모두가 빅데이터 기술을 바탕으로 서비스를 꾸릴 테니 말이다.

결국 중요한 건 사람이다. 빅데이터 분석은 컴퓨터가 할 일이지만, 어떤 데이터를 어떻게 분석해 어디에 활용할지 결정하는 일은 사람이 할 일이다. 통계와 컴퓨터 과학을 아우르면서 사회적인 면도 고려할 줄 아는 통섭적인 인재가 그 어느 때보다 필요하다.

<참고 자료>
1) Predictive Policing 웹사이트 : http://www.predpol.com/

글 : 안상욱 블로터닷넷 기자

저작자 표시 비영리 변경 금지
신고
DNA와 IT기술의 융합, DNA 컴퓨터의 탄생

1953년 왓슨과 크릭은 유전자의 본체인 DNA의 이중나선 구조를 밝혀냈다. DNA 이중나선 구조의 발견으로 전통 생물학은 분자생물학으로 급격하게 재편됐고, 오늘날에는 물리학과 화학, 공학과 융합되면서 가장 촉망받는 21세기 학문분야 중 하나로 굳건히 자리매김하게 됐다. 그리고 이제는 DNA가 새로운 컴퓨터의 세계를 열만큼 공학의 발전에도 많은 영향을 미치고 있다. 그렇다면 왜 DNA와 IT 기술 융합이 시도되는 것일까?

1946년 에니악(ENIAC)이 탄생했다. 세계 최초의 전자식 컴퓨터였지만 무게가 30톤에 성능은 오늘날 싸구려 계산기보다 떨어졌다. 공교롭게도 분자생물학과 비슷한 시기에 등장한 실리콘 컴퓨터는 지난 60여 년 동안 엄청난 발전을 거듭하며 체스나 그림처럼 인간 고유의 영역이라고 간주됐던 분야까지 잠식해 들어 왔다.

컴퓨터의 발전 속도는 반도체 메모리의 집적도가 증가한데 힘입음 바가 크다. 그러나 실리콘 컴퓨터의 미래가 그리 밝은 것만은 아니다. 반도체의 집적도를 높이는 것이 날이 갈수록 어려워져 곧 그 한계에 도달할 것이라는 전망이 나오고 있기 때문이다. 그래서 과학자들은 새로운 개념의 컴퓨터를 찾기 시작했는데, 그중 하나가 DNA 컴퓨터다.

DNA 컴퓨터는 말 그대로 DNA 분자를 이용하는 분자컴퓨터(molecular computer)다. DNA 컴퓨터는 분자들의 결합을 이용한 것인데, 컴퓨터 공학자인 아들만(Leonardo M. Adleman)이 1994년 고안해 냈다. 아들만은 DNA가 유전 정보를 전달하는 것이 마치 컴퓨터에서 정보가 처리되는 것과 비슷하다는 점에서 DNA 컴퓨터를 착안해 냈다.

DNA는 인산과 당, 염기로 구성된 뉴클레오티드가 길게 결합한 분자로 A(아데닌), T(티민), G(구아닌), C(사이토신) 4가지 종류의 염기로 이루어져 있다. DNA 분자들은 스스로 조립되는 자기조립 능력, 다른 분자를 인식해서 결합하는 분자 인식 능력, 그리고 자기 복제 능력이 있어 정보를 전달하는데 이용할 수 있다. 즉 실리콘 컴퓨터에서 ‘0’과 ‘1’을 이용해 2진수로 계산을 하듯 DNA에서는 A, T, G, C의 4개의 염기를 이용해 정보를 전달한다. DNA의 특징은 A와 T, G와 C가 서로 상보적인 결합을 한다는 점인데 이것을 이용하면 정보를 전달할 수 있다.

DNA 컴퓨터는 폰노이만 구조의 컴퓨터처럼 순차적으로 작동하는 것이 아니라 병렬적인 계산방식을 사용한다. DNA 분자 개개의 결합 속도는 느리지만 3차원으로 배열된 엄청난 수의 분자들이 동시에 반응에 참여하는 병렬 연산을 통해 연산 속도를 얼마든지 높일 수 있다. 이는 마치 1,011개의 뉴런이 1,014개의 시냅스 연결을 형성하고 있는 인간의 뇌가 수많은 뉴런을 동시에 연산에 참여시키는 병렬 연산을 통해 빠르게 정보를 처리하는 것과 같은 원리다. 이와 같이 기존의 실리콘 컴퓨터가 가지지 못한 인간의 뇌가 가진 장점을 모방한 것이 바로 DNA 컴퓨터다.

또한 건조된 DNA 1g으로 CD 1조 장의 정보를 저장할 만큼 대용량의 정보를 저장할 수 있으며 반도체 컴퓨터에 비해 전력소모가 매우 적다는 것도 DNA 컴퓨터의 매력이다. 아들만은 DNA 컴퓨터로 외판원 문제(외판원이 각 도시를 모두 경유하는 최소한의 경로를 찾는 문제)를 해결해 DNA 컴퓨터의 가능성을 증명했다.

아들만 이후 한동안 새로운 개념의 DNA 컴퓨터에 대한 연구가 활발하게 이루어졌지만 사실 이렇다 할 성과가 없었다. DNA 컴퓨터를 생각만큼 빠르게 만들기 어렵고 생화학적 분자들을 에러 없이 제어한다는 것이 쉽지 않기 때문이다. 또한 실리콘 컴퓨터의 발전도 꾸준히 이루어져 실용적인 측면에서 DNA 컴퓨터가 그 자리를 대체하기가 어려웠다. 하지만 DNA 컴퓨터는 단순히 빠른 연산을 하는 것 이상의 매력이 있기 때문에 최근 다시 주목받고 있다.

DNA를 이용하면 실리콘을 대체할 수 있는 새로운 반도체 재료를 만들 수 있다. 그 재료는 바로 꿈의 신소재로 불리는 그래핀(graphene)이다. 그래핀은 실리콘 보다 100배 이상 전하를 잘 전달하면서도 강도가 우수하기 때문에 차세대 반도체 재료로 주목받아 왔다. 하지만 원자 하나 두께인 그래핀을 원하는 형태로 만드는 일은 결코 쉽지 않다.

그래서 미국의 스탠퍼드대에서는 자연의 분자 조립자인 DNA를 이용해 그래핀 트랜지스터를 만들었다. 포스텍에서는 백금 이온이 DNA의 인산기와 잘 결합하는 성질을 이용해 ‘DNA-그래핀 하이브리드’ 물질을 개발하기도 했다. 고가의 백금을 적게 사용하면서도 효율이 좋은 백금촉매를 만든 것이다. 이러한 일들이 가능한 것은 DNA 분자의 폭이 3.4나노미터(nm)로 미세하면서도 분자를 효과적으로 조작할 수 있는 로봇의 역할을 하기 때문이다.

DNA 컴퓨터가 보여주는 놀라운 미래의 모습은 여기서 끝이 아니다. DNA 컴퓨터는 영화 ‘이너스페이스’에서와 같이 소형 잠수정을 타고 몸속으로 들어가 병을 치료하는 것을 실현시켜 줄 수도 있다. 지금까지 기존의 로봇 공학으로는 이렇게 작은 분자 로봇을 만들 수 없었으며 여러 가지 물리적인 이유로 인해 가까운 미래에도 등장하기 어려운 상태다. 하지만 DNA 컴퓨터는 정확하게 프로그램에 따라 세포를 찾아내 명령을 실행할 수 있기 때문에 정상세포와 다른 암 세포를 발견하고 죽일 수 있다. 즉 프로그램 된 DNA 컴퓨터가 주사를 통해 사람의 몸속으로 투입되면 암세포를 발견하고 결합한 후 제거할 수 있다는 것이다.

이와 같이 DNA 컴퓨터는 사람의 질병을 진단하고 치료하는 나노로봇의 개념으로 발전할 가능성이 크다. 병에 걸리면 우리 몸에 투입된 수많은 DNA 로봇들이 병균을 격퇴하게 되는 꿈과 같은 일이 DNA 컴퓨팅의 미래인지도 모른다. 자연은 DNA를 만들어 냈고, 인간은 DNA로 새로운 컴퓨터의 세계를 열어가고 있다.

글 : 최원석 과학칼럼니스트

 

저작자 표시 비영리 변경 금지
신고
1 
BLOG main image
생활에 밎줄 긋는 과학이야기♡ -KISTI의 과학향기-
by 과학향기

카테고리

분류 전체보기 (1178)
과학향기 기사 (892)
과학향기 이벤트 (1)
과학향기 독자참여 (1)
이런주제 어때요? (1)

달력

«   2017/10   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        
tistory!get rss Tistory Tistory 가입하기!
Clicky Web Analytics

티스토리 툴바