알파고 제로가 세상을 바꾼다?

최근 인공지능에 관한 핫한 뉴스가 떴다. 이른바 “알파고 제로”에 관한 내용이다.

단 몇시간만에 이세돌 9단과 대국을 벌였던 알파고 리를 100% 승률로 격파하고, 커제 9단과 대국했던 알파고 마스터와는 90%의 승률로 격파했다. 여타의 딥러닝 방식과는 다르게, 알파고 제로는 “제로”로 표현되는 것과 같이, 아무런 학습데이터를 주지 않고, 스스로 바둑의 룰을 깨우쳤다.

혹자는 이를 보고, 인간의 도움이 없이 스스로 사고하는 최초의 인공지능으로 받아들이는가 하면, 혹자는 터미네이터와 같은 파괴적 인공지능이 생기는 것이 아닌가, 때아닌 공포심에 빠져들기도 한다. 아니면 상당수 많은 일들이 로봇으로 대체되는 사회가 곧 다가올 것이라 생각한다.

IT 에서 밥먹는 사람으로, 이 알파고 제로에 대해 간단히 썰 한번 풀고자 한다.

알파고의 실체

알파고는 어떻게 작동하는가?

알파고 작동의 3대 원리랄까? 개인적으로 평가할 때 가장 핵심은 1) 몬테카를로 시뮬레이션 2) CNN 3) 강화학습이다.

먼저 몬테카를로 시뮬레이션은 난수의 값을 이용하여 함수를 확률적으로 계산하는 값이다. 알파고의 경우는 둬야 할 점에 대해 이길 확률이 전부 확률적으로 계산된다는 이야기이다. 둘째 CNN은 쉽게 이미지를 인식하는 딥러닝의 방법중 하나이다. 이미지의 인코딩 형태를 매트릭스로 받아, 이를 통해 각 매트릭스의 확률로 부터 이미지를 패턴을 인식한다. 마지막으로 강화학습이다. 어떤 환경에서 정의된 에이전트들이 가장 보상 확률이 높은 행동이나 순서를 선택한다.

즉 바둑판이라는 이미지를 인식하고, 그리고 모든 수에 대한 이길 확률이 계산되며, 가장 확률이 높은 점을 선택한다가 알파고가 하는 일이다. 세부적으로 정책을 정하고 행마를 정하는 각각의 알고리즘이 있긴 하지만, 단순화 하자면 그렇다는 것이다.

그렇다면, 알파고 제로의 경우는 이 강화학습의 최종판에 해당할 것이다. 혹은 최신 알고리즘인 GAN이 사용되었을 수도 있겠다.

어떤 하드웨어를 장착했는가?

tpu 2.0

알파고는 이런 세가지 원리 아래 다양한 하드웨어의 지원을 받고 있다. 특히 병렬분산처리가 가능하도록 GPU를 이용하는 것은 계산의 효율성을 극적으로 향상시켰다. 알파고 리의 경우 48개의 유닛이 동원되었으나, 알파고 제로에는 4개만이 지원되었다고 한다.

그런데 한가지 주목해야 할 사실은 구글은 이미 지난 5월 제 2세대 TPU(tensorflow processing unit)을 발표한 바 있다. 보통의 인공지능 연구자들이 별도의 유닛이 아닌 기존 CPU와 GPU를 조합하여 사용하는 것에  비하면, 알고리즘에 최적화된 전용 머신이 있는 셈이다.

TPU 2.0이 나온김에 하는 말이지만, 알파고 마스터는 1개의 TPU를 알파고 제로는 4개의 TPU를 장착하고 있다고 한다.

즉, 일반적인 딥러닝보다 새로운 버전의 강화학습은 학습에 필요한 하드웨어 자원을 더 소모한다.

TPU가 궁금하신 분들은 일반 사람들도 구글 클라우드 플랫폼에 TPU 유닛이 들어간 인스턴스를 사용할 수 있다고 하니, 관심이 있는 사람은 도전해 볼 만 하다.

그래서 알파고 제로는 사람은 넘어선 것인가?

앞서 언급한 바와 같이 알파고 제로는 두 가지의 성과물이다. 첫째 강화학습 알고리즘이 발전했다는 것과, 둘째, 알고리즘을 최적화 하기 위한 전용 유닛의 사용이다. 알파고 마스터보다 4배가 많은 TPU를 사용한 것은 그만큼 알파고 제로의 연산이 더 복잡하고 어렵다는 반증이 될 것이다.

또한 언급했다시피, 알파고의 가장 핵심적인 부분은 확률적으로 가장 좋은 값이나, 순서를 정한다는 것이다. 즉, 목적이 정확하지 않으면 이들은 연산을 할 수 없다. 바둑의 룰은 돌아가며 한수 한수를 두는 것이고, 최종적으로 돌로 둘러싼 빈 칸의 개수가 더 많을 경우 승리라는 보상이 주어져 있다. 룰 베이스로 강화학습을 시킨다면 어느 정도 결과가 예측될 수 도 있는 문제이다.

그러나 세상사 사는 것이 이렇듯 결과가 뚜렸한 일만 있겠느냔 말이다.

세상의 많은 일들이 애매하고, 뭔가 확실한 목적이 없는 일들이 더 많다. 상당수 확률에 따라 최선의 선택이 필요한 일들은 이런 인공지능이 도움이 되겠지만, 그렇다고 그 일을 모두 대체할 수 없을 것이다.

확률적으로 사람들이 많이 읽을 만한 소설이, 문학적으로 가치있는 것이 아닐수도 있다.

확률적으로 많은 사람들이 행복해 하는 일들이, 도적적으로 가치있는 것이 아닐수도 있ㄷ.

오히려 확률적으로 가장 적합한 선택을 회피해야 하는 경우를 우리는 많이 보아왔다.

 

물론, 알파고의 등장으로 세상은 변할 것이다. 확률적으로…

다만, 우리의 일들에 인공지능은 깊게 개입될 것이고, 이전에 전문적인 일들이 전혀 전문적인 일이 아니게 되거나, 오히려 이전에는 비전문적이었으나 오히려 전문적이 되는 일들이 생길지도…….

그러나 알파고 제로는 터미네이터가 될 수 없고, 우리의 일을 한꺼번에 대체하지도 않는다.

로보틱스와 결합하기에는 더 많은 기술적 난제가 도사리고 있으며, 그것이 몇년안에 바로 이뤄지지 않는다.

기술적으로 괄목할 성과이긴 하지만, 공포나 걱정보다는 “비확률”의 세계를 좀더 고찰해 봐야 하지 않을까?

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다