주요 바둑 인공지능 | |||||||
{{{#!wiki style="margin:0 -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" | |||||||
AlphaGo | Zen | DeepZenGo | Crazystone | ELF OpenGo[1] | Leela | 카타고 | |
<colbgcolor=#000> | <colbgcolor=#ffffff,#191919> | <colbgcolor=#b3622d> | <colbgcolor=#ffffff,#191919> | ||||
돌바람 | 절예[2] | CGI | Fuego | 한돌 | 미니고 | 골락시 | |
[1] 별도의 로고가 없이 페이스북 로고를 쓴다. [2] 별도의 로고가 없이 한큐바둑(텐센트) 로고를 쓴다. | }}}}}}}}} |
골락시 사이트
1. 개요
현재 전체 바둑 인공지능 중에서 2위로 평가 받고 있는 인공지능골락시 바둑(이하 골락시)은 북경 선커과학기술유한회사가 개발한 고수준의 인공지능바둑프로그램이다. 이는 소량의 하드웨어 자원을 이용하여 수많은 연습들을 통해 진정한 통용성, 친화적인 고수준 바둑지능소프트웨어를 실현했다.
골락시는 다양한 바둑판 크기, 덤 룰을 모두 적용할수 있다고 한다.골락시는 인간과 동일한 계가 방식으로 형세를 판단하고 우세와 열세를 막론하고 최고의 선택를 추구하여 치열한 바둑을 둔다고한다. 이는 알파고 제로의 방식을 채택한 여러 인공지능과는 차별화된 기능이다.
2. 기술적 설명
하지만 AlphaGo-Zero를 대표로 하는 바둑AI는 여전히 문제점이 존재합니다:첫째, 수준적 제한. AlphaGo-Zero는 강화된 학습기술을 사용하면 AI의 기력을 높일수 있다고 했지만 논문의 실험 데이터로는 이런 성장속도가 점점 느려질 것이고 향후에는 정체될 것이라는 결론이 내려지고 있습니다. 현재와 같이 제한된 프레임 안에서는 분명 기력의 상향에 한계가 있습니다.
둘째, 자원 과다소비의 문제. 현존의 학습방법으로는 소모하는 계산자원이 굉장히 큽니다. 이런 자원 소모는 중소형 아카데미, 연구팀으로는 부담하기 어렵습니다. 그러므로 알고리즘 측면에서 개량하여 훈련용 계산자원에 드는 비용을 줄이는것이 필요합니다.
셋째, 알고리즘의 일반성, 유연성, 이전 가능성의 문제입니다. AlphaGo-Zero의 강화학습 알고리즘은 단일하고 특정한 바둑 룰 즉 중국 룰인 흑이 덤 3.75점을 주는것을 사용합니다. 룰이 바뀌기만 하면 재훈련이 필요하며 대량 자원의 소모를 거쳐 만들어진 모형은 이용할 가치가 없게 됩니다. 전 세계 바둑 규칙은 통일돼 있지 않았으므로 서로 다른 지역의 바둑 규칙을 기반으로 여러 개의 바둑 AI를 훈련시키려면 엄청난 낭비르 초래합니다. 이는 분명 인간이 인식하는 “하나를 보면 열을 안다” 식의 지능과는 부합되지 않습니다.
골락시는 AlphaGo의 기초상에 기술적 혁신을 하여 적은 훈련자원을 사용해 좀더 일반성 있고 유연성있는 수준 높은 바둑 지능을 실현할 수 있도록 노력하고 있습니다. 골락시의 주요 공헌은 기계학습의 두가지 중요한 영역인 다임무 학습과 전이학습에 있습니다.
멀티임무학습(MTL)은 기계학습중 굉장히 전망이 너른 영역입니다, 이는 여러 개 학습 임무중의 유효한 정보를 이용하여 매개 임무학습을 더 정확하게 진행하는 학습 기계입니다.
현실중 많은 문제들은 서로 연관이 있습니다. 만약 이러한 문제들을 독립적으로 모델링 하면 문제들간에 존재하는 풍부한 관계정보들을 소홀시하게 됩니다. 기계학습에서는 관련된 여러 개 임무를 동시에 학습하여 멀티 임무간의 공통성과 특성 등을 쉽게 학습할수 있고 연습량을 대대적으로 줄일수 있으며 학습 속도도 높일수 있어 모델의 일반화능력을 제고시킵니다, 이는 단독학습보다 더 많은 성능을 배워낼수 있습니다.
AlphaGo가 사용하는 전략네트워크(Policy Network)와 네트워크(Value Network)와 달리, 골락시는 동시에 4개의 주요임무를 학습합니다, 나머지 두 개는 바로 영역네트워크(Area Network)와 계가네트워크(Score network)입니다. 영역네트워크는 임의의 기국 기초상 바둑판의 매 교차점 최종 소속을 흑과 백을 나누어 각기 계산합니다. 계가네트워크는 임의의 기국양상을 기초로 하여 중국식 계가법으로 최종 차이를 계산합니다. 예를 들어 집, 흑과 백의 돌개수 차이, 최종 승자가 누군지 이 세 개의 연습 임무는 아주 강안 연관성이 있습니다. 사실상 점한 영역을 보면 누가 최종 승자인지를 결정할수 있습니다. 때문에 가치네트워크, 영역네트워크, 계가네트워크를 동시에 연습하여 같이 성장하고 진보합니다.
영역네트워크와 계가네트워크의 도움을 받아 상황에 대한 골락시의 판단이 더욱 전면적입니다. 이는 골락시가 사람처럼 '계가'를 배우게 하였기에 단지 승률만 의지하여 바둑을 두는것이 아닙니다. 승률이 비슷한 상황에서 골락시는 최선의 수를 택해 우세를 계속 넓혀가거나 열세한 집수를 좁혀 상황을 만회하고 승기를 찾습니다. 이 기술은 골락시로 하여금 “양보 없는 바둑”의 기풍도 형성하게 했습니다.
아주 많은 사실들이 멀티임무학습의 효과를 증명합니다.
첫째, 임무가 많을수록 태그가 많기에 매개 훈련 샘플에서 더 많은 정보를 섭취할수 있습니다. 이는 데이터량의 증가함을 의미하기 때문에 멀티임무학습은 훈련속도를 현저히 제고할수 있고 훈련데이터를 적게 소모할수 있으며 지나치게 조합하는 위험을 낮춰줄수 있습니다.
둘째, 단독으로 하나의 임무를 훈련할 때 모델은 이 임무에 대한 몇몇 숨겨진 특징 표시를 배웁니다. 권중을 공유하는 방식으로 여러 임무를 동시에 학습함으로써 모형이 더욱 쉽고 동시에 여러 임무를 수행하는데 도움되는 숨겨진 특징을 포착할수 있도록 하게 합니다. 이러한 숨겨진 특징이 보다 통용되고 새로운 환경에 대한 새로운 임무도 더 잘 표현할수 있기 때문에 모형이 더 강한 광범화 능력이 있습니다.
때로는 A 임무를 단독 훈련하면 이 임무에 도움되는 어떤 숨겨진 특징 표시를 배우기 어려울수도 있지만 이러한 특징표시는 B 임무에서 배우기 쉽습니다. 두 개의 임무를 동시에 학습할 때 B임무에서 배운 숨겨진 특징을 사용함으로써 A임무가 그 가운데서 이득을 얻습니다.
기계 학습의 모형훈련은 데이터를 기반으로 하지만 많은 경우에 데이터가 극단적으로 부족하여 전이학습은 데이터양의 부족을 해결하는 일종 중요한 방법입니다.소스 영역이 충분한 데이터를 가지고 또한 소스 문제를 해결할수 있는 모형을 이미 훈련다고 가정하면 전이학습은 소스 영역 안에 있는 기존 모형을 이용하여 훈련 샘플이 부족한 목표 영역에서 목표 임무를 해결하는 모형을 훈련하는것을 도와준다.
전이학습을 바둑AI에 응용합니다
전이학습을 사용하는데는 두가지 가설이 있습니다. 소스 영역과 목표 영역의 샘플 분포가 다르다는것과 목표 영역에는 태그가 달린 샘플이 심각하게 부족하는것입니다. 바둑규칙은 전 세계적으로 통일된 것이 아니여서 서로 다른 바둑규칙에 따른 훈련 샘플은 통용되지 않습니다.현재 바둑AI는 19선 바둑판을 많이 사용하고 있고 중국 규칙인 흑은 3.75점의 덤을 주는 규칙하의 훈련 샘플이 비교적 풍부합니다. 골락시는 전이학습 기술을 도입하는것을 통하여 흑이 3.75점의 덤을 주는 중국 규칙을 적은 자원으로 다른 규칙 아래로 전이합니다. 전이 학습은 골락시 알고리즘의 융통성을 높여줘 임의의 바둑판과 임의의 덤의 대국을 할수 있게 하고 돌을 세는 중국규칙과 집을 세는 한일 규칙에 완벽하게 적응합니다. 전이학습은 골락시로 하여금 바둑에서 '하나를 보면 열을 안다'의 지능을 실현하게 합니다.
3. 성적
2018년 4월 27일, 푸저우에서 열린 '베리 게놈배' 2018년 인공지능바둑대회에서 골락시는 커제 9단을 145수만에 흑 불계승으로 우승했다.커제와 대국하기전 골락시바둑은 저우루이양, 판팅위, 박정환등 정상급기사프로기사들을 상대로 30번기 양보전에서 28승 2패를 기록했고. 커제와의 맞대결에 이어 골락시바둑은 바둑 고수와 번갈아 양보전을 하면서 40승 1패를 기록했습니다. 골락시바둑은 박성호, 셰얼하오, 스웨, 장웨이제, 퉈자시, 당이페이, 최철한, 원성진, 저우쥔쉰 등 세계 챔피언선수들과의 대국에서 승리를 거두었습니다. 2018년 11월 17일 장씨성 푸저우에서 인공지능대회 바둑 AI 경연대회에서 백을 잡은 골락시는 백을 들고 3.75집의 덤을 주면서 세계챔피언 스웨 9단에게 불계승을 거두었습니다.
골락시바둑 2점 접바둑으로 여기사와 대결
2019년 4월 30일, '보스컵' 2019 세계인공지능바둑대회 대항경기에서 골락시바둑은 제2회 오청원배에서 2점 접바둑으로 4강기사 뤄이나이워이 9단, 왕천싱 5단, 이혁 5단, 조승아 2단과의 대국에서 4전 전승을 거두었습니다. 바둑 인공지능이 2점 접바둑 공식전에서 인간 프로기사를 이긴것은 이번이 처음입니다.
2018“중신증권배”세계 지능 바둑대회에서 우승
2018년 7월 골락시바둑이 2018 텐센트 세계인공지능바둑대회에서 준우승을 차지했습니다. 2018년 8월 13일부터 15일까지 광시성 난닝에서 거행한 제2회 “중신증권배” 세계지능바둑경기에서 골락시바둑은 중국, 미국, 일본, 한국등 나라의 고수준 AI들을 상대로 승리를 거두었고 상금까지 45만위안을 받았습니다. 이는 AI 바둑계 역사상 규격과 상금이 가장 높은 대회입니다.
2018년 12월 15일, 골락시바둑은 일본 도쿄에서 제2회 AI용성전 챔피언을 획득하였습니다.
2019년 3월 17일, 골락시바둑은 세계최강기사전 AI경기에 참가해 루이나이웨이 9단과 힘을 합쳐 챔피언을 획득하였습니다.
2019년 4월 26일부터 29일까지, 골락시바둑은 푸저우에서 거행한 “보스배” 2019세계인공지능바둑대회에 참가했고 챔피언을 획득하였습니다.
2020년 12월 30일 변상일선수가 백을 잡고 호선으로 맞붙어 골락시에게 승리를 거두었다. https://youtu.be/in35lMr-rEg
4. 활용
https://www.19x19.com 골락시와 대국 또는 골락시를 이용해 연구할수 있는 사이트다.세계대회나 중국내 기전, 또 가끔 한국이나 일본 기전의 바둑들을 실시간으로 분석해주기도 한다.