[판사코인 사태로 본 인터넷 여론]청와대 청원사이트 얼마나 파급력이 있나?

최근 이재용 부회장에 대한 고법의 집행유예 판결에 대해 시민들의 저항이 거세다.

이 저항을 이끌고 있는 핵심은 바로, 청와대 청원 사이트이다. 이른바 “판사코인”으로 불리우면서 사람들은 “떡상 가즈아~”를 외치며 투표를 독려하고 있다. 이 청원은 하루만에 10만을 돌파하는가 하면 이미 20만명인 답변 인원수를 돌파하여 화제가 되고 있다.

언론사들은 이 사실을 다양한 관점에서 전하고 있어, 이슈의 이니셔티브를 청와대 청원이 장악한 모양새를 연출하고 있기도 하다.

그렇다면 질문한가지 해보자.

청와대가 사법부에 대한 그다지 효과적인 조치를 취할 수 없음은 자명한 일이며, 이는 대한민국에서 정상적인 초중고 교육을 받은 사람은 누구나 알고 있는 사실이다. 그런데 왜 이들은 청와대에 청원을 올린 것일까?

그만큼 청와대 청원의 파급력이 강력하다는 의미이다. 하여 시밀러 웹이라는 트레픽 측정 사이트를 통해 실제 청와대 청원 사이트의 파급력이 어느정도일지 확인해보고자 한다.

청와대 청원 사이트의 트레픽

청와대 웹 사이트의 트레픽은 월평균 487만 수준이며,  중복을 제거한 방문자수는 226만명 수준으로 평가되고 있다. 평균 2분 16초를 머무르며, 인당 페이지뷰는 3.71 수준을 차지하고 있다. 특히나 트레픽중 84.83%가 모바일 트레픽으로 보인다.

주목해 볼 것은 방문 경로인데, 검색보다 리퍼럴 페이지로부터의 방문 비중이 매우 높다는 거다. 무려 39.29%를 차지하고 있다.

리퍼럴 페이지에서 방문하는 빈도는 점점 증가하는 추세인데, 3개월 동안 총 87만명이 리퍼럴 페이지로부터 방문하였다.

주요 리퍼러 페이지는 커뮤니티 들로서, 클리앙, 오유, 일베, 뽐뿌, 딴지등의 커뮤니티에서 유입되고 있는 것으로 보인다. 즉, 청와대 청원 사이트에 유입되는 사람들은 이들 커뮤니티에서 공유된 청원의 내용을 보고 페이지로 유입된다고 볼 수 있다.

소셜 미디어는 주로 트위터로 부터 유입되고 있다.

검색의 유입은 직접 청와대 청원을 검색하여 진입하는 것으로 보인다.

 

분석결과의 의미

분석결과를 보자면, 다음과 같이 추정할 수 있다. 검색을 통해 접근하여 청원을 올리고 그 청원을 성사시키기 위해 각 커뮤니티에 공유한다.  또한 SNS 미디어 중 트위터의 활용빈도가 높은 것은 weak tie 형태의 SNS인 트위터가 확산에 더 유리하기 때문임을 짐작할 수 있다.

커뮤니티에 공유된 이슈들은 다시 청와대 청원 사이트의 리퍼러 페이지에서 보듯 재 유입의 기재가 된다. 또한 이 이슈들은 각 언론사들이 기사화하여 포털, 언론사 홈페이지등에 실리게 된다. 현재 네이버를 기준으로 청와대 청원으로 검색하였을 경우 기사수는 2만 3천여건에 달한다. 내용도 시사성 이슈뿐 아니라, 노동, 환경, 젠더의 이슈에 이르기까지 다양하다.

네이버 청와대 청원 검색결과

또한 리퍼럴 페이지의 다수를 차지하는 커뮤니티의 성향들을 보건데, 이미 이 곳은 각기 다른 사회적 이슈를 녹여 대립하는 일종의 용광로 혹은 전쟁터가 되어버린 느낌이다.

타 사이트와의 비교

이른바 아젠다를 설정하는 사이트들은 여러 군데가 있다.

그중에 조선일보, 한겨레, 오마이뉴스 등의 온라인 뉴스 사이트들이 바로 그것이다.

먼저 언론사 사이트와 비교를 해 보았다. 트레픽은 여전히 높은 편이다. 그러나 청와대 사이트의 인당 PV는 타 사이트에 비해 월등히 높은 것으로 보여진다.

특히나 유의해서 볼 것은 접근 채널에 관한 것인데, 청와대 사이트가 리퍼럴 페이지 비율이 월등히 높다. 언론사들은 주요 유입수단은 검색을 통한 유입니다.

소셜 미디어 트레픽도 차이가 나는데, 다른 미디어사들이 페이스북의 비중이 높은 반면, 청와대 사이트는 유독 트위터의 비중이 더 높다. 페이스북은 전형적인 strong tie 소셜 미디어로 이 비중이 높다는 것은, 일종의 성향이라는게 있어 유사한 성향의 친구들이 공유하는 뉴스를 통해 접근이 이뤄지는 경향이 더 크다고도 생각해 볼 수 있다.

소리굽쇠와 공명현상

모든 미디어나 온라인 이슈는 발화점이 존재하기 마련이다. 트위터가 국내에서 사용자가 급감했음에도 명맥을 유지할 수 있던 계기는 셀럽들의 트윗이나 사회이슈에 대한 참여등이 일종의 발화점 역활을 했기 때문이다. 쉬운 공유구조로 빠르게 확산되고 커뮤니티 혹은 기사화 되면서 진폭을 넓혀 나간다.

사실 이전에 언론사들의 포지션이다. 그들은 취재를 통해 새로운 이슈와 사건을 밝혀내고, 그 기사가 발화점이 되어 확산되고 진폭이 커져간다.  그러나 현재로서는 청와대 국민청원 사이트가 그 발화점이 된 듯 하다.

누군가의 청원은 그 지인에게 카카오톡 메세지, 트위터 트윗으로 전파되며, 이들은 커뮤니티에 이슈글로 등극하며, 다시 다양한 이념적 스펙트럼의 이용자들을 모은다. 이 이용자들은 청원내에서 논쟁하며 또다시 이 청원내용을 전파한다. 이런 전파 구조에서 어느덧 언론사들은 이슈 따라가기로 기사를 양산하며, 기사 댓글이라는 공간으로까지 확전의 길을 걷는다.

청와대 청원 게시판이 온라인 이슈의 생산지로, 확산지로, 종착지로 모든 이니셔티브를 장악해 버린 형국이다.

즉, 이렇게 말 할 수 있다.

청와대 청원을 때려라! 그러면 소셜 미디어, 커뮤니티, 뉴스 모든 매체가 공명하리라!

 

 

뉴스유통 이야기 – 비겁한 변명입니다.

최근, 네이버는 뉴스배열 조작에 대한 사과와 함께 재발을 방지하기 위한 대책을 발표했다.

바로가기

요약하자면, 기사배열의 중림성과 공정성을 확보하기 위하여 기사배열 이력을 공개하고 뉴스편집 자문위원회를 운영하겠다 내용과 함께 사람이 편집하는 영역을 줄이고 그 알고리즘을 공개, 뉴스유통책임제 이행,  기사배열 전문성과 윤리의식을 강화하겠다는 내용이다.

이에대해 반발하는 측은 왜 포털이 뉴스를 유통하는가 라는 근본적인 의문점을 제기하기도 한다. 말하자면 포털은 뉴스배열을 통해 미디어의 역할을 수행하지만, 일반적으로 미디어가 짊어지는 책임은 없는 묘한 구조이기 때문에 이런 이야기가 나오는 것일 게다.

그럼 한가지, 포털은 어떻게 뉴스를 유통하게 되었나?

포털사이트의 뉴스유통

네이버 뉴스섹션

초창기 우리나라 인터넷의 가장 큰 문제는 “한글로 된 문서가 없다”라는 점이었다. 한글로 된 html 문서가 없으니, 무언가 새로운 기술도, 서비스 활성화도 될 수 없는 상황이었다. 그나마 의미있는 서비스라고는 이메일류 밖에 없던 시절이었다.

김대중 정부의 초고속망 투자 등으로 인해 인터넷의 신사업은 어느덧 닷컴버블이란 이름으로 장미빛 꿈을 꾸게 해주었고, 당연히 언론사도 자신들의 뉴스를 홈페이지등을 통해 게시하게 되었다.

쓸만한 컨텐츠에 목말라 있던 포털사에게는 이런 뉴스는 가뭄의 단비와 같았고, 그들은 일정금액을 지불하고 포털에서 뉴스를 제공하기 시작했다.

상황역전

초창기 인터넷에서는 지면에 비해 온라인에서 거둘수 있는 수입이 별반 없었고, 고객의 요구에 따라 뉴스를 노출할 수 밖에 없었다. 공급자가 극히 적은 상황에서는 공급자의 협상력이 높은게 당연한 일이었다. 그러나 포털에서 뉴스를 보는 사용자층이 늘어나고, 인터넷 언론사들이 우후죽순처럼 설립되기 시작하자, 오히려 언론사의 협상력은 약화되었다.

그 극단의 사례가 파란의 스포츠 뉴스 독점사건이다.

파란은 한미르와 하이텔등 자사의 서비스를 합쳐 파란이라는 포털사이트를 런칭하게 된다. 포털사이트중 후발주자에 속했던 파란은 독점적 컨텐츠 만이 서비스를 알릴 수 있는 엣지라고 판단하고, 주요 스포츠 신문과 독점계약을 맺게 된다. 당시의 기억에도 이 업계 사람들은 겨우 1억에 다른 수익을 포기하는 스포츠 신문을 이해할 수 없었고, 독점한다고 그 컨텐츠의 희소성이 유지될 거라 판단하는 파란의 어리석음에 코웃음 쳤던 기억이 있다.

당연하게 온라인 중심의 경제미디어등에서 연예 및 스포츠 매체를 창간하고 이들의 뉴스를 스포츠 신문이 빠진 무주공산 네이버에 공급하게 된다.

참고로 그 즈음 네이버는 UV PV에서 다음을 넘어서 명실상부한 국내 1위 포털로 자리매김하게 되고,  도입한 검색광고 모델은 대박을 치게 된다.

모바일 시대의 데자뷰

네이버 모바일에서도 언론사별 뉴스를 제공

2010년 아이폰 출시 이후 본격적인 모바일 시대가 도래하자, PC에서의 뉴스유통과 모바일에서 뉴스유통은 다르므로, 언론사들은 모바일에서는 적어도 포텉에 뉴스공급을 중단해야 한다는 주장이 나오기도 했다.

그러나 그건 단순히 주장에 그쳤을 뿐이다.

왜냐면 죄수의 딜레마처럼 몇몇 매체가 빠진다고 해도 다른 매체가 그 간극을 매꿀 것이기 때문이다. 어느덧 늘어난 뉴스공급자들은 비슷한 수준의 컨텐츠를 비슷하게 자기복제하는 수준밖에는 안되었기때문이다.

 

포털로 간 뉴스는 어떻게 유통되는가

포털의 뉴스제휴는 크게 두가지가 있다. 뉴스 미디어 제휴과 검색제휴

뉴스 미디어 제휴는 그들이 운영하는 뉴스 섹션에 컨텐츠를 공급할 수 있는 권한이다.

검색 제휴는 그들의 검색에 기사가 걸릴 수 있도록 하는 제휴이다.

물론 검색제휴를 하지 않더라도, 뉴스는 수집되거 검색이 되겠지만 네이버 검색의 “뉴스”카테고리에 자신들의 뉴스를 유통시키기 위해서는 반드시 검색제휴를 거쳐야 한다.

여기서 질문은, “뉴스”검색에 뉴스를 유통 여부를 결정하는 권한이 네이버에게 있다는 것이다. 검색서비스는 일종의 공공성을 가져야 하므로, 왜 그걸 네이버가 결정하냐는 의문을 가질수 있지 않을까?

 

결론은… 네이버의 뉴스유통은 막을 수 없다.

네이버의 뉴스 유통을 막을 방법이 없다. 국가가 나서서 포털의 뉴스유통을 막는다 하더라도, 뉴스란 정보는 다른 형태로 포털사이트에 유통될 수 밖에 없다.

앞서 언급한 네이버의 변명, 사람손을 배제하고 최대한 공정하게 라는 뉴스 배열의 원칙은 오히려 미디어간의 레벨 차이를 희석시키게 될것이다. 조중동을 비롯한 종이신문에서 대형 매체들이 오히려 포털에서는 쪽도 못쓸 수도 있다는 거다.

그리고 이 사태의 근본 원인은 언론사별로 생산하는 “뉴스”라는 컨텐츠가 언론사마다 차별화된게 아니란 점에 있으며, 기간 언론사들이 온라 인을 대해 왔던 자세 – 조그만 이익에 소탐대실 하는 – 에서 비롯된 것이라고 본다.

네이버 뉴스조작사태 – 뜬금없는 알고리즘 타령

새가 날아든다. 온갖 잡새가 날아든다…

이 상황을 표현하는 딱 적절한 표현이라고 본다.

최근 네이버에서 뉴스 배열에 대한 인위적인 개입이 밝혀져 문제가 되고 있다. 국회에 출석한 이해진 창업주는 알고리즘 공개에 대한 의원들의 질의에 공개해서 검증받는 것에 찬성이라는 입장을 밝혔다. 뉴스에는 뉴스배열 알고리즘이 무슨 사해문서나 되는냥 공개 어쩌구에 초점을 맞추고 있다.  개인적은 견해임을 밝히며, 이 부분에 대해 잡설 하나 투척해 본다.

네이버 창업자 이해진

사태의 본질

사태의 원인은 다음과 같다. 네이버 스포츠의 한 담당자가 축구협회의 청탁을 받고 축구협회에 비판적인 기사들을 노출되지 않도록 조치했다는 것이다.  이걸두고 사람들의 미심쩍은 의심에 불을 붙였고, 그에 대한 공격으로 알고리즘 공개에 대한 카드를 꺼내놓은 것이다.

뉴스는 어떻게 배열되는가?

사실 필자가 포털사에 근무하던 시절까지만 하더라도, 포털의 뉴스는 사람이 수작업으로 배치했다. 다음의 경우 당시 제주도의 디지털미디어센터(다음본사가 이전하기 전이니 오래되긴 했다)에서 뉴스편집인력이 별도로 편집을 진행했다.

네이버의 기사배열 원칙

그러나 최근 포털사이트들은 알고리즘을 도입하여 뉴스배열에 활용하고 있다. 예를 들면 클러스터링같은 일종의 군집분석 알고리즘을 사용하여 이슈별, 상황별등 맥락이나 연령, 성별등 인구통계학적 특성에 따른 선호로 뉴스를 묶어 자동으로 배열하는 식이다. 일종의 스팸필터링 및 어뷰징 방지 기술도 포함되어 있을 것이다. 그런다고 해서 에디터의 역할이 사라지는 것은 아니다. 결국 보조적인 역할이라고 표현하긴 하지만, 에디터의 손에 의해 뉴스의 최종 배열이 결정된다해도 과언을 아닐 것이다.(물론 모바일의경우 연령, 성별 속성들을 위해 개인화된 배열을 자동으로 제공하기도 한다.)

포털사이트가 이런 알고리즘을 도입하는 이유는 업무효율성 측면도 있지만, 최대한 뉴스배열을 기계적으로 자동화하여 시시비비를 피하려는 속셈이 더 커 보인다. 어차피 인건비 때려박는게, 자동화를 도입하는것보다 더 싸게 먹히는게 헬조선이 현실이다.

하여 금번 사태를 빌미로 포털사이트의 뉴스배열 알고리즘을 까봐라는 압박을 주는 것이야 말로, 포털을 길들이기 위한 최적의 방안처럼 보인다.

알고리즘은 중요한게 아니다.

이해진 창업자에게 네이버의 검색 알고리즘을 공개하라고 요구했다면 어떤 일이 일어났을까?

절대 공개하지 않았을 것이다.

요즘 딥러닝 라이브러리 공개가 유행이다 보니, 일부 똥오줌 못가리는 국회의원은 그거나 이거나라고 생각하는 모양인데, 전혀 다르다. (어디 기업이 아무것도 돈 안될 것을 공짜로 베푸는 존재라고 생각하는 모양이다.)

누구나 핵심 서비스의 알고리즘은 공개하지 않는다. 구글이 검색알고리즘을 공개하지 않는 것처럼, 페이스북이 뉴스피드 알고리즘을 공개하지 않는 것처럼 말이다.

그럼 네이버 뉴스는 핵심서비스가 아니란 말이냐?

 

답은 그렇다 이다.

네이버는 국내 매출 비중이 67%정도를 차지하고 있다. 대부분은 광고 수입이고 막강한 검색 점유율을 봤을때 디스플레이 광고보다는 검색광고가 더 많은 비중을 차지하고 있다. 게다가 이를 모바일과  PC로 나누면?? 뉴스란 디스플레이 광고중에서 섹션광고에 해당하는 것으로서 전체 매출 비중을 보자면 미미할 것이 분명하다. 뉴스배열 알고리즘 공개로 서비스가 망가져도 생각보다 손해는 적다는 이야기다. (주로 망가지는 쪽은  PC쪽일 것이고, 모바일은 개인화 어쩌고이므로, 큰 영향은 없을 거다)

게다가 네이버는 검색의 최강자 자리에서 뉴스 배열에 대한 이슈를 해결하기 위해 엄청난 트레픽 감소를 감내하면서 까지 뉴스스텐드를 전격 도입했던 전력이 있다.

이후 네이버의 행보에 소설을 써보자면

사실 알고리즘을 깐다는 건 어뷰징의 위협에 노출되는 것과 같다. 그러나 어뷰징 대상들이 국내 언론사라면 이야기가 달라진다. 막상 알고리즘을 깠더니 언론사의 어뷰징 기사가 넘치는 아주 황당한 네이버 뉴스가 된다. 이 경우 네이버는 알고리즘 개편을 이야기 할 수 있다. 아니 아주 극단적으로 중국의 터우타우와 같이 완전한 개인화 알고리즘을 도입할 수도 있다.

중국에서 대박난 개인화 추천 뉴스앱, 터우타오

터우타우가 파괴적인건, 뉴스와 1인 미디어등 매체의 경계를 넘어 개인에게 의미있는 정보를 추천해 준다는 점이다.

자연히 뉴스를 만들면 포털등 어딘가 실린 데가 있던 국내언론사들에게는 당황스런 상황이 도래할 수도 있다.

게다가 언론사들과 제휴라고는 하나, 네이버는 모바일 탭 부분을 별도의 컨텐츠로 채우고 있고, 모바일에서는 이 채널과 뉴스가 같은 레벨의 서비스로 제공되고 있다. 데이터가 충분히 쌓이게 된다면, 뉴스와 채널데이터를 모두 개인화하여 제공할 수도 있다. 게다가 인공지능 추천 알고리즘  airs도 베타 중이니, 안정화되면 전면도입을 추진할 수도 있다.

네이버 뉴스추천 서비스 airs

결론적으로 – 네이버를 작살내려면 검색알고리즘을 까자고 하자

결국 이 문제는 알고리즘 문제가 아니다. 사람의 손이 완전히 배제되지 않는 이상, 이런 상황은 언제나 일어날 수 있다. 회사든, 조직이든, 개인이든 도적적 헤이가 발생하는 근본적인 원인을 약간 논리비약해서 이야기하자만, 사람이 하기 때문이다.

네이버 입장에서는 이 논란의 종지부를 찍으려면 사람손을 배제하는게 최선의선택이다.

네이버를 위해 편을 조금 들어주자면, 내 기억에서는 모든 포털들이 검색에 투자를 줄이고, 서비스를 버리려 할때 끈질기게 검색으로 버틴 회사가 네이버다. 한글 온라인 문서가 턱없이 부족할때 그걸 채우는 서비스를 만든 것도 네이버다. 회사가 성장하는데는 이유가 있고, 지금의 위치에 올라선데는 이유가 있는 법이다.

결론적으로 네이버를 엿먹이고 싶다면, 그냥 검색알고리즘 까라고 압박해라…

알파고 제로가 세상을 바꾼다?

최근 인공지능에 관한 핫한 뉴스가 떴다. 이른바 “알파고 제로”에 관한 내용이다.

단 몇시간만에 이세돌 9단과 대국을 벌였던 알파고 리를 100% 승률로 격파하고, 커제 9단과 대국했던 알파고 마스터와는 90%의 승률로 격파했다. 여타의 딥러닝 방식과는 다르게, 알파고 제로는 “제로”로 표현되는 것과 같이, 아무런 학습데이터를 주지 않고, 스스로 바둑의 룰을 깨우쳤다.

혹자는 이를 보고, 인간의 도움이 없이 스스로 사고하는 최초의 인공지능으로 받아들이는가 하면, 혹자는 터미네이터와 같은 파괴적 인공지능이 생기는 것이 아닌가, 때아닌 공포심에 빠져들기도 한다. 아니면 상당수 많은 일들이 로봇으로 대체되는 사회가 곧 다가올 것이라 생각한다.

IT 에서 밥먹는 사람으로, 이 알파고 제로에 대해 간단히 썰 한번 풀고자 한다.

알파고의 실체

알파고는 어떻게 작동하는가?

알파고 작동의 3대 원리랄까? 개인적으로 평가할 때 가장 핵심은 1) 몬테카를로 시뮬레이션 2) CNN 3) 강화학습이다.

먼저 몬테카를로 시뮬레이션은 난수의 값을 이용하여 함수를 확률적으로 계산하는 값이다. 알파고의 경우는 둬야 할 점에 대해 이길 확률이 전부 확률적으로 계산된다는 이야기이다. 둘째 CNN은 쉽게 이미지를 인식하는 딥러닝의 방법중 하나이다. 이미지의 인코딩 형태를 매트릭스로 받아, 이를 통해 각 매트릭스의 확률로 부터 이미지를 패턴을 인식한다. 마지막으로 강화학습이다. 어떤 환경에서 정의된 에이전트들이 가장 보상 확률이 높은 행동이나 순서를 선택한다.

즉 바둑판이라는 이미지를 인식하고, 그리고 모든 수에 대한 이길 확률이 계산되며, 가장 확률이 높은 점을 선택한다가 알파고가 하는 일이다. 세부적으로 정책을 정하고 행마를 정하는 각각의 알고리즘이 있긴 하지만, 단순화 하자면 그렇다는 것이다.

그렇다면, 알파고 제로의 경우는 이 강화학습의 최종판에 해당할 것이다. 혹은 최신 알고리즘인 GAN이 사용되었을 수도 있겠다.

어떤 하드웨어를 장착했는가?

tpu 2.0

알파고는 이런 세가지 원리 아래 다양한 하드웨어의 지원을 받고 있다. 특히 병렬분산처리가 가능하도록 GPU를 이용하는 것은 계산의 효율성을 극적으로 향상시켰다. 알파고 리의 경우 48개의 유닛이 동원되었으나, 알파고 제로에는 4개만이 지원되었다고 한다.

그런데 한가지 주목해야 할 사실은 구글은 이미 지난 5월 제 2세대 TPU(tensorflow processing unit)을 발표한 바 있다. 보통의 인공지능 연구자들이 별도의 유닛이 아닌 기존 CPU와 GPU를 조합하여 사용하는 것에  비하면, 알고리즘에 최적화된 전용 머신이 있는 셈이다.

TPU 2.0이 나온김에 하는 말이지만, 알파고 마스터는 1개의 TPU를 알파고 제로는 4개의 TPU를 장착하고 있다고 한다.

즉, 일반적인 딥러닝보다 새로운 버전의 강화학습은 학습에 필요한 하드웨어 자원을 더 소모한다.

TPU가 궁금하신 분들은 일반 사람들도 구글 클라우드 플랫폼에 TPU 유닛이 들어간 인스턴스를 사용할 수 있다고 하니, 관심이 있는 사람은 도전해 볼 만 하다.

그래서 알파고 제로는 사람은 넘어선 것인가?

앞서 언급한 바와 같이 알파고 제로는 두 가지의 성과물이다. 첫째 강화학습 알고리즘이 발전했다는 것과, 둘째, 알고리즘을 최적화 하기 위한 전용 유닛의 사용이다. 알파고 마스터보다 4배가 많은 TPU를 사용한 것은 그만큼 알파고 제로의 연산이 더 복잡하고 어렵다는 반증이 될 것이다.

또한 언급했다시피, 알파고의 가장 핵심적인 부분은 확률적으로 가장 좋은 값이나, 순서를 정한다는 것이다. 즉, 목적이 정확하지 않으면 이들은 연산을 할 수 없다. 바둑의 룰은 돌아가며 한수 한수를 두는 것이고, 최종적으로 돌로 둘러싼 빈 칸의 개수가 더 많을 경우 승리라는 보상이 주어져 있다. 룰 베이스로 강화학습을 시킨다면 어느 정도 결과가 예측될 수 도 있는 문제이다.

그러나 세상사 사는 것이 이렇듯 결과가 뚜렸한 일만 있겠느냔 말이다.

세상의 많은 일들이 애매하고, 뭔가 확실한 목적이 없는 일들이 더 많다. 상당수 확률에 따라 최선의 선택이 필요한 일들은 이런 인공지능이 도움이 되겠지만, 그렇다고 그 일을 모두 대체할 수 없을 것이다.

확률적으로 사람들이 많이 읽을 만한 소설이, 문학적으로 가치있는 것이 아닐수도 있다.

확률적으로 많은 사람들이 행복해 하는 일들이, 도적적으로 가치있는 것이 아닐수도 있ㄷ.

오히려 확률적으로 가장 적합한 선택을 회피해야 하는 경우를 우리는 많이 보아왔다.

 

물론, 알파고의 등장으로 세상은 변할 것이다. 확률적으로…

다만, 우리의 일들에 인공지능은 깊게 개입될 것이고, 이전에 전문적인 일들이 전혀 전문적인 일이 아니게 되거나, 오히려 이전에는 비전문적이었으나 오히려 전문적이 되는 일들이 생길지도…….

그러나 알파고 제로는 터미네이터가 될 수 없고, 우리의 일을 한꺼번에 대체하지도 않는다.

로보틱스와 결합하기에는 더 많은 기술적 난제가 도사리고 있으며, 그것이 몇년안에 바로 이뤄지지 않는다.

기술적으로 괄목할 성과이긴 하지만, 공포나 걱정보다는 “비확률”의 세계를 좀더 고찰해 봐야 하지 않을까?

IT이야기] 4차 산업혁명과 인공지능 소고

0. 들어가며

 

팟캐스트에서도 자주 언급 했듯이, 요즘 4차 산업혁명이니 인공지능이니 하는 이야기들이 유령처럼 떠돌고 있다. 일찍이 맑스   가 “공산주의라는 유령이 전 유럽을 떠돌고 있다”라고 말한 것 처럼, “4차 산업혁명”이란 유령이 떠돌고 있는 셈.

그때와 다른 점은, “모든 자본가”들과 “언론”, “수많은 사짜”들이 신성동맹을 맺었다는 점만 다르달까?  이들은 시대의 변화를 이야기하며, 노동에 의존하지 않는 신세계를 꿈꾸고, 이를 열광적으로 전파한다.

01. 유사한 데자뷰

웹이 새로운 대세로 자리잡은 2000년대 이후 이와 유사한 일을 경험한 적이 있다.

2000년대 중반은 웹2.0이란 이념의 시대였다.  기술적 기반과 함께 상황은 급변했고 기술 에반젤리스트는 열광했다. 시멘틱 웹이니 RIA니 하는 기술적 발전은 이들의 열광의 근거가 되었다. 브라우저에서 작동하나, 마치 어플리케이션과 같이 복잡한 동작과 사용성을 커버하는 기술은 사람들의 탄성을 자아내기에 충분했다. 이른바 웹 어플리케이션의 시대가 열린 것이다.

웹 서비스가 어플리케이션과 유사한, 아니 동일한 사용성을 제공할 수 있다는 점은 이른바 PC 어플리케이션의 종말을 의미했다. 특히 우리나라에서는 “네이버 독점의 시대를 끝장낼 수 있는 비장의 무기”쯤으로 보여지면서, 사람들은 전복의 쾌감에 열광했다.

수많은 사짜(이른바 사기꾼 지식인) 강연, 혹은 누군가는 지식의 보따리 장수로서 이 새로운 시대의 사상과 변화를 열광적으로 전파했고, 흡사 이들의 광신적인 사명감과 말빨은 모두에게 어슴프레 밝아오는 저 빛이 새시대의 이정표임을  기대하게 했다.

참여와 공유의 기본정신 아래, 자신의 정보를 아낌없이 공개하고, 이를 통해 사용성과 서비스의 질이 성공의 공식이 되는 신세계는 많은 IT 종사자들을 매료시키기에 충분했다 할까?

그러나 남은 것은 무엇인가 냉정히 평가해 볼 필요가 있다. 물론, 현재의 웹앱이란 용어, 그리고 블로그와 같이 쉽게 정보를 공유하고 확산하는 개인저작과 SNS와 같은 지식공유의 기재들 이들이 품은 함의는 “모든 지식을 공유하고 확산 할수 있는 rich internet platform”의 전망이 일궈놓은 땀의 결실일 것이다. 하지만, 그들이 그토록 희망찬 목소리로 외치던 신세계는 오지 않았다. 체제는 전복되지 않았다.

02. 인공지능 그리고 4차 산업혁명

지금의 인공지능 그리고 4차 산업혁명의 열풍을 생각한다.

딥러닝을 한 의료진단 인공지능의 진단 정확도는 사람의 그것을 넘어섰으며, 바둑은 인공지능의 시대를 거쳐 과거 인간이 쌓아놓은 모든 “정석”을 부정하고 있다. 블리자드는 최근 게임 API를 공개하며, 인공지능 연구자들의 도전을 기다리고 있기도 하다.

주요 player들이 내놓은 인공지능 라이브러리들은 두 손의 손가락이 부족할 만큼 많고, 각자의 헤게모니를 쟁탈하기 위해 애쓰고 있다.

선형대수학과 통계에 대한 이해, 그리고 간단한 프로그래밍 지식만 있으면 마치 누구나 인공지능 서비스를 구현할 수 있을 것 같다.  처음 이분야는 공부하는 사람들은 Mnist의 학습을 통해 손글씨 숫자를 인식하는 로직에 경악한다. 블럭깨기를 학습을 통해 인공지능이 사람보다 능숙하게 해 가는 과정을 보며, 사람들은 직감한다. 이들이 나보다 더 나아질 날 이 올 것이다.

반면 냉정하게 이야기 해 보면, 4차 산업혁명이라 불릴 만큼 혁명적인 변화가 있을 것인가 라는 의문이 지워지지 않는다.

그렇다. 우리는 전복의 쾌감과 미지에 대한 동경으로 이렇듯 열광하고 있구나.

03. 현시창, 그러나 변화는 온다.

그러나 현실은 시궁창이다. 손글씨 인식, 패션 Mnist를 통해 사진의 옷과 유사한 옷들을 자동으로 추천할 수 있다는 실현의 쾌감은 곧 새로운 절망감으로 이어진다. 결국, 데이터의 양이 모든걸 좌우하며, 그 방대한 데이터의 양을 커버하는 조직은  그리 많지 않으리라는 것.

내가 만든 로직이 어떠한 내부로직으로 돌아가는 지 모르고, 그냥 API에 데이터를 던지고 결과값을 리턴받는다. 또한, 로직이 아닌 학습은 데이터의 양과 학습의 빈도에 따라, 개발자의 예상을 곧이 곧대로 받아들이지 않는다.

전복의 쾌감과 무지 혹은 미지에 대한 공포를 라벨링하면 그것이 바로 “4차 산업혁명”이다.

당장의 혁명적인 변화가 오지는 않는다. 그러나, 조금씩 조금씩 내 폰의 앱들이 내가 좋아하는 컨텐츠들을 알아서 가져다 줄것이다. 그리고, 내가 상담하는 상담원이 로봇인지 아닌지 혼란스러워 지는 날이 도래할 것이다.

05. 세상은 쉽게 뒤집히지 않는다

4차 산업혁명의 신성동맹은, 사짜들이 Case를 과장하고 언론들이 실적과 홍보가 필요한 기업에게 success case를 확대 재생산 하는 방법으로 환상을 심어준다. 그러기에 자본가들은 기꺼이 돈을 댄다.

웹 2.0이 html5기반의 웹 어플리케이션 서비스, 그리고 자유롭게 개인이 사용할 수 있는 저작의 도구, SNS서비스를 남겼듯이 지금의 열풍이 남기는 “자산”이 있을 것이라 본다.

다만 달콤한 전망에 입맛 다시다가는 씁쓸한 결말을 맞이할 수 있다.

로직을 구현하긴 쉬우나 상용서비스로 사용하기 위해서는 험난한 길이 있을 것이기 때문이다. 기대가 클 수록 현실은 시궁창이 될 것이다.

결국 전복의 기대는 배신당할 것이다. 여전히 우리는 노동할 것이다.

다만 작금의 열풍이 어떤 자산을 남길 것인지 주목하는 것이 중요하지 않을까?

 

<같이 들으면 좋아요>

0화 (2부) 인공지능의 “인”자도 모르는 아재들의 인공지능 이야기

제0화 (1부) 인공지능의 “인”자도 모르는 아재들의 인공지능 이야기