메뉴 건너뛰기

오피니언

바이러스성 가명정보

데이터 3법의 재식별화에 대하여

오길영( icomn@icomn.net) 2020.02.01 09:51

세상이 요란하다. 선거를 앞둔 정치판도 시끄럽지만, 요즘 가장 떠들썩한 뉴스는 아마도 ‘신종 코로나 바이러스’ 사태일 것이다. ‘사스’와 ‘메르스’를 뒤이은 신종 코로나 바이러스 전염사태는, 전 국민을 불안에 휩싸이게 하기에 충분한 뉴스들을 쏟아내고 있다. 우리의 상황도 걱정이지만, 특히 걷잡을 수 없는 상황으로 치닫고 있는 중국의 상황은 정말이지 큰 걱정이 아닐 수 없다. 그래서 필자는 막역한 친구이자 훌륭한 의사이기도 한 절친에게 전화를 걸어, 최근의 사태에 대한 걱정과 의견을 나누어 보았다. 역학(疫學)조사관의 경험도 있는 그가 들려준 이야기들은 단순한 의학적 지식 이상이었다. 필자에게 더없이 유의미하였기에, 지면을 빌어 몇 자 적기로 한다.

 

근본적으로 답답한 질문이 있었다. “요즘이 어떤 세상인데 바이러스 하나 못 잡다니, 아직도 의학의 수준이 이 정도 밖에 안되는가?”하는 것이 그것이다. 그래서 법학자들은 공부를 열심히 하는데, 의사들은 공부를 제대로 안하는 것 아니냐는 우스갯소리로 바꾸어 물어보기도 하였다. 즐거운 반박으로 돌아온 답변에는 생각보다 큰 가르침이 있었다. ‘미물이라 하여 얕잡아보면 안 된다’는 것이 그것이다. 바이러스가 끊임없이 변화하기 때문에 박멸이 힘들다고 한다. 즉 의사들도 그리고 우리의 몸도, 처음으로 만난 바이러스를 상대로 새로운 전쟁을 벌여야 하기에 항상 버거울 수밖에 없다는 것이다. 여기서 참으로 놀라웠던 것은, 눈에 보이지도 않는 미물이 살아남기 위해 끊임없이 변신한다는 사실이다. 본래 바이러스는 증식을 하면서 수많은 변이를 하곤 하는데, 특정한 항바이러스제가 투입되면 해당 약제의 영향 하에서도 효과적으로 증식할 수 있는 능력(증식적합능력)이 우수한 변이종이 선택적으로 우세하게 증식한다고 한다. 이는 항바이러스제에 의해 억제되어가던 바이러스 증식의 총량을 다시금 증가하게끔 하고, 이러한 내성반응(바이러스 돌파 현상) 덕분에 결국 임상적인 악화로 귀결된다는 것이다. 즉 ‘예상 밖의 변신’을 하는 ‘돌연변이’가 그들의 생존법인 것이다.

 

똑똑하지 않은가? 그러나 미물이라 두뇌는 없을 것이므로, 도대체 누가 어떻게 그렇듯 신묘한 프로그램을 한 것인지 물어보았다. 여기에는 그야말로 놀라운 이야기들이 흘러나왔다. 먼저 매우 작은 크기를 가지고 있다고 한다. 바이러스의 크기는 대체로 30~300nm(나노미터, 10억분의 1m)로 1~5㎛(마이크로미터,100만분의 1m)의 크기를 가지고 있는 세균보다 훨씬 작다고 한다. 다음으로 매우 간단한 구조를 가지고 있다고 한다. 그의 표현을 그대로 빌자면, ‘단백질 캡슐과 그 속의 설계도 하나’가 전부이다. 구조가 이러하다 보니 평상시에는 무생물 상태로 버티다가, 필요시에만 생물화 한다. 다른 세포에 달라붙어서는 그 세포가 진행하는 복사작업에다 ‘슬쩍’ 자신의 설계도(DNA 또는 RNA)를 끼워 넣는 방식으로 증식한다는데, 두뇌도 없는 녀석이 그러한 방식으로 살아남을 수 있다는 것을 어찌 알게 된 것일까? 미물인데 불구하고 매우 특이한 생존법을 가지고 있다니, 참으로 신기하지 않을 수 없다. 이에 대해 돌아온 답변은 예상대로였다. 생명체 진화의 한 과정일 뿐, 프로그램의 주체는 알 수가 없다고 한다. 그 특이성 때문에, 혹자는 외계인의 선물이 아닐까 하는 견해도 있다는 즐거운 답변을 끝으로 전화를 끊었다.

 

전화를 끊고 난 뒤부터 한동안 필자의 머릿속에는 많은 생각들이 교차해갔다. 주지하는 바와 같이 ‘데이터 3법’이 결국 국회를 통과하고야 말았다. 이에 앞으로 벌어질 일들에 대한 불안감이 이만저만이 아니던 필자에게, 짧은 바이러스 강좌는 많은 시사점을 주었다. 귀한 지면에다 바이러스 이야기를 풀어놓은 것은, 단순한 흥미에서가 아니라 바로 이 때문이다. 금번 개정의 핵심은 바로 ‘가명정보’이다. 개인정보에 식별성을 주는 일정한 내용을 삭제하여 ‘가명화’시키고, 이를 유통하여 데이터의 본격적인 활용을 허하는 것이 주요한 내용이다. 지금의 시점에서 데이터의 유통과 활용을 반대하는 것은 어쩌면 우매한 일일지도 모른다. 그러나 필자가 그토록 반대했던 이유는, 개정안에 유통과 활용에 상응하는 정도의 보호책이 전무하기 때문이다. 가명상태의 정보, 그 자체는 생물도 무생물도 아니다. 마치 바이러스의 생태마냥, 필요와 상황에 따라 개인정보보다 더 내밀한 정보가 될 수도 있고 아무것도 아닌 허깨비 정보일 수도 있다. 그래서 다들 서로 다른 목소리를 낼 수 있다. 활용을 찬성하는 입장에서는 허깨비에 불과한 것으로 보일 것이니 보호에 특별한 관심을 내지 않을 것이고, 반대론자의 눈에는 내포된 위험성만이 보인다.

3-1_데이터3법.jpg

(사진 : 데이터 3법 주요 내용 , 문화체육관광부)

 

문제는 ‘돌연변이’이다. 가명정보의 예상치 못한 변신이 여기에서도 문제인데, 가명처리된 다수의 정보들이 결합하면서 다시금 식별성을 가지게 되는 ‘재식별화’의 문제가 바로 그것이다. 각각의 가명정보들 자체는 식별자를 삭제하여 분명 가명성을 가지고 있으나, 다수의 정보가 결합하면서 점차 가명화의 효과가 떨어지고 식별성이 증가하게 된다. 많이 모일수록 정확해지는 정보의 특성상 이는 당연한 것이기도 하다. 이에 대한 별다른 대책이 없기는 바이러스의 경우와 같다. 식별성이 생긴 변종을 삭제한다는 대증치료를 할 뿐이기 때문이다. 이런 식의 대응으로 안전이 담보될 수 있을지가 의문이다. 그렇다면 그 다음은 어찌되는가? 재식별로 인한 삭제가 빈번한 환경 하에서도 효과적으로 결합할 수 있는 가공방식이 우세하게 선택될 것이고, 이는 가공방식의 다양성을 훼손한다. 가공방식의 수렴은 다시금 재식별의 가능성을 증가시킨다. 수렴이 되면 될수록 가공알고리즘의 해독이 용이해지기 때문이다. 가공방식뿐만이 아니라, 결합의 방식도 마찬가지의 부작용을 가지게 된다. 결국 이러한 순환구조는 가명화정책의 효과를 저해하고, 삭제에 의해 억제되어가던 재식별의 총량을 다시금 증가하게끔 할 것이다. 다시 말해 이 또한 일종의 내성반응(가명화 돌파 현상)이 예상된다는 것이다.

 

한편 정보의 신뢰성 또한 문제이다. 정보의 유통과 활용은, 결국 가공과 결합을 통해 유의미한 정보를 새로이 생산해내기 위함이다. 만약 생산된 정보를 신뢰할 수 없거나 오류가 있다면 어찌되는가? 잘못된 결과이므로 삭제하면 그만이라고 생각하기 쉬우나, 그리 간단하지 않다. 잘못된 결과임을 뒤늦게 인지하는 경우가 있기 때문이다. 예를 들어 코로나 바이스러스에 대응하는 한국 사람만의 특유한 병리학적 특징을 담아낸 신약을 개발하기 위해, 병력과 치료과정 및 투입약물 기록 등의 의료정보들을 종합하여 가공․결합한 경우를 상정해 보자. 여기서 매우 미미한 변수 하나를 빠뜨린 경우, 예를 들어 ‘대머리’인지 아닌지의 변수가 빠져서 신약을 먹었다가 대머리 아저씨들이 모두 유명을 달리했다면 이런 사태를 어찌 감당할 수 있겠는가? 요즘 유행하는 ‘AI’가 전지전능하셔서, 죽음에 임박한 대머리 아저씨를 살려주는 것인가? 또한 잘못된 결과임을 인지하고도, 제대로 삭제가 될는지는 여전히 의문이다. 막대한 비용과 시간이 투입된 해당 결과물이 쉽사리 포기되지 않는 것도 문제이지만, 그보다는 잘못된 해당 결과물을 기반으로 새로이 작성되어져간 수많은 파생 정보들을 샅샅이 찾아내기가 곤란한 점이 가장 큰 문제이다. 전파속도를 고려할 때, 아마도 박멸은 불가능할 것이다. 뒤늦은 오류의 발견은 이렇듯 걷잡을 수 없는 참사를 불러온다. 오류정보의 전염과 그 폐해는 바이러스에 못지않다는 것이다. 결국 우리는 무조건 마스크를 끼고 살아야 한다. 신뢰할 수 없는 정보들을 가진 사람들을 끊임없이 불신하면서 말이다.

 

그나저나 국회가 데이터 3법을 통과시킨 상황에까지 와서, 정부가 ‘단백질 캡슐과 그 속의 설계도 하나’를 어떻게 처리할 지 참으로 궁금하다. 자그마한 플라스틱 조각에 자리하고 있는 13자리 DNA를 포기하지 못한 채, 데이터의 결합과 유통을 반기고 있는 행안부는 도대체 무슨 생각인 것일까? 우리나라에서 진행되는 데이터 가공에 있어 주민등록번호는, 그야말로 전지전능한 DNA이다. 데이터 가공의 대상과 방식을 불문하고, 진행하는 아무 작업에다 ‘슬쩍’ 끼워 넣기만 하면 만사가 형통된다. 찰떡같이 결합하고 모든 방어막을 허물어내며, 이로 인한 폐해의 증식은 가공할 만할 것이기 때문이다. 또한 프로파일링에 대한 정보주체의 방어권이 전무한 현재의 입법 상황에서, ‘슬쩍’ 끼워 넣어진 자신의 주민등록번호가 어느 정도로 자신을 발가벗길 수 있는 지를 대다수의 국민들이 잘 모른다는 것도 문제이다. 쉽게 말하자면 나도 모르는 나에 대한 정보가 이미 태산처럼 집대성되어 있고, 단순히 나 혼자가 아니라 내 가족과 친족 모두가 함께 도마에 올라가 있게 된다. 왜냐하면 바이러스와 마찬가지로 우리 또한 고유한 유전정보를 가지고 있고, 이 또한 정보의 하나이므로 수집․분석되어 집대성되어가고 있기 때문이다. 따라서 유전정보를 나눈 이들도 반사적인 피해자가 된다. 우리 몸에 기록된 유전정보를 시작으로 나와 관련된 모든 정보들을 세상과 연결해내는 ‘골든 키’가 바로 주민등록번호이다. 나와 정부만 알고 있으면 그나마 다행이겠으나, 이미 중국에서는 널리 공공재로 사용하고 있는 형편이 아니던가? 설계도를 포기하건 결합을 금지하건 해야 마땅할 정부가, 저렇듯 쌍수를 들고 환영하는 이유가 무엇인지 참으로 납득하기 힘들다. 바이러스 전염사태 못지않게, 하루하루가 걱정인 나날이다.

--------------------

오길영: 신경대학교 경찰행정학과, 부교수, 정보통신법

 

위로