[기타] 이세돌 VS 알파고 후기

 

[기타] 이세돌 VS 알파고 후기


 사실 후기라기보다 감상이라고 할까?

 

물론 언론에서는 엄청난 기사를 쏟아내는 것처럼 가장 지적게임(?)이라는 바둑마저 인공지능에 졌다고 난리도 아니다.

 하지만 좀더 살펴보면 사실 체스 세계챔피언이 컴퓨터에게 진 것은 정말 오래되었다.

 

하지만 바둑의 경우 경우의 수가 훨씬 많기 때문에 상대적으로 더 어려웠다고 한다.

 

아래 알파고 동영상 참고

 

 

 

 

 

 

<체스의 경우의 수와 바둑의 경우의 수의 차이>

 

 즉 모든 경우의 수의 탐색에 걸리는 프로세서 능력+판단할 알고리즘이 더 복잡하였기 때문에 사람을 이기기 힘들었던 것이다.

(10의 170승 정도?) 

  그리고 알파고에 대한 좀더 깊은(?) 이해를 위해서는 아래에 소개하는 글을 참고하면 좀더 이해가 쉬울 것이다.

 

간단하게 요약하면 AI의 발전속도는 지수함수꼴이며 약인공지능/강인공지능/초인공지능으로 나뉜다라는 것을 전재한다.

 

참고글 : http://waitbutwhy.com/2015/01/artificial-intelligence-revolution-1.html

 

1. 약인공지능 (ANI, Artificial Narrow Intelligence)
어느 특정 방면에서만 뛰어난 인공지능이다. 인류는 이미 약인공지능을 장악했다.

 예를 들어 체스 게임, 지금 보고 있는 구글의 애드센스를 통한 광고추천, 스팸메일 필터링등.

 

2. 강인공지능 (AGI, Artificial General Intelligence)
인간급의 인공지능. 강인공지능은 여러 방면에서 인간과 비슷한 수준의 지능을 가진것으로 판단되는 지능

아직 도달하지 못함

 

 

3. 초인공지능 (ASI, Artificial Super Intelligence)
옥스포드 철학가, 유명한 인공지능 사상가인 Nick Bostrom 은 초지능을 아래와 같이 정의한다.

과학기술 창조, 일반적인 지식, 사회적 능력 등을 포함한 전 영역에서 모두, 제일 총명한 인류의 두뇌보다 훨씬 총명한 지능.

 

 즉 체스처럼 바둑도 약인공지능이라면 사람이 지는 것이 당연하고, 강인공지능 이상이라면 인간을 이기기 어렵다.

  

이 약인공지능과 강인공지능 차이를 우리가 종종 사용하는 구글 번역기 및 한글 맞춤법 검사를 통해 한번 살펴보자.

 

 

 1.  없어  -> ㅇ벗어

 2.  광주  -> 고아주

 

그리고 요번에 꽃보다 청춘에서 핫했던 핫도그 세개(핫도그 세계) 주세요.

 

 

 

이건 예전에도 내가 어플 개발할때도 정말 고민했던 문제인데, 사람에겐 정말 쉬운 문제지만

 

컴퓨터에게 그걸 설명하기란 정말 완전 어렵다..

 

  꽃보다 청춘에서 제일 처음 핫도그 한개 주세요는 약인공지능의 단계라고 할 수 있다. 

 

 하지만 핫도그 세개와 핫도그 세계를 구분하는 것은 강인공지능의 단계라고 생각하면 간단하다.

 

 사람은 당연(?)한건데 이걸 로직(알고리즘)으로 구현하기란 정말 어렵다.

 

어쩔 때 세 개를 사용하고, 세계를 사용하는지는 그 유명한 앞뒤 문맥적 의미를 활용하기 때문이다.

 

 인간에게 있어서 핫도그 다음에 세개를 잘 못 들었다고 하더라도, 앞의 한 개를 들었기에 그냥 유추(?)하여 판단하기 때문에

 

세 개를 세계로 판단할 확률은 지극히 적다. 하지만 이걸 컴퓨터로 짠다고 하면 결코 그냥 만들 순 없다.

 

 사람에게 있어 그냥(?)이라는 것을 컴퓨터에게 설명하기란 어려운 일이기 때문이다.

 

 다시 알파고로 돌아가 보자.

 

 알파고의 알고리즘에 대해서 간단히 생각해보면 이것은 유트브 혹은 네이쳐의 알파고 논문을 참고하면 잘 설명되어 있다.

 

http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

 

  즉 알파고는 몬테카를로트리검색(MSTS)와 심층신경망을 활용하여 설계되었는데,

 

MSTS는 가장 유리한 선택지를 선택하는 알고리즘이다.

 

예를 들어 다음 수의 N번째 확산으로 인하여 가장 유리한 수를 찾고 그것을 토대로 둔다는 것이다.

 

 또 하나의 방식은 SL(Supervised Learning) 정책을 통해 기존의 바둑 기보를 통해서 다음에 둘 위치를 결정하고

 

강화학습(Reinforcement Learning) 정책을 통해 무수한 학습을 통해 최적의 수를 결정하는 것이다.

 

아래 그램을 보면 좀더 이해가 쉬울 것 같네요.

 

  즉 바둑의 부분부분을 쪼깨어 약인공지능으로 만들고 무수한 확률의 통계를 통해 최적의 수를 찾는다고 보면 된다.

 

 즉 이것은 알파고의 성능을 나타내는 그래프가 CPU/쓰레드가 증가할수록 성능이 좋아지는 것을 보아도 알 수 있다.(11월 DATA)

 

 저 그림의 세로축 그래프가 ELO 시스템인데

 

 이것은 http://www.goratings.org/ 싸이트에서 바둑 선수들의 ELO를 확인할 수 있다.

  구글에서는 판 후이와 대결시에 판후이보다 알파고의 ELO가 높다고 판단하고 대결을 성사시켰고,

이번 역시 이세돌  9단의 Elo인 3532보다 알파고의 Elo가 높기 때문에 진행한 것으로 판단된다.

 

작년 11월 DATA의 그래프만 보아도 CPU만 추가함으로써 3000이 넘는 것을 볼 수 있다.

 

 나는 개인적으로는 알파고가 졌으면 좋겠지만, 구글의 무서움을 알기에..

 

 아마도 결과는 알파고가 이기지 않을까 싶다.

 

 바둑은 복잡한 구조지만 약인공지능의 범주에 포함된다고 생각하기 때문이다.

 

하지만 너무 좌절할 필요는 없다. 아직 컴퓨터가 지배하기엔 사람은 너무 어려운 존재니까!

 

 

 그 예는 쉽게 찾아볼 수 있습니다.

 

 체스 게임의 경우에도 세계 챔피언을 컴퓨터가 이겼지만, 컴퓨터의 도움을 얻은 사람이 그 컴퓨터를 꺽었다는 사실을...

 

 

  사이버 포뮬라를 기억하는지 모르겠네요?

 

 요즘들어서 많은 생각이 드는데, 사이버 포뮬라에서도 저 컴퓨터가 모든 인공지능을 담당하지만, 결국 제로의 영역에서는

 

사람이 컨트롤 한다는 것을 정말 저 작가는 저 시대에 인공지능을 이렇게 기가막히게 예측했다는 사실이 놀랍다.

 



728x90

해당 블로그에서 발행되는 콘텐츠 중 일부 글에는 제휴 및 홍보 관련 링크가 포함될 수 있으며, 파트너스 활동의 일환으로 일정액의 수수료를 받을 수 있습니다.