미러 테스트

1. 개요

1.1. 미러 테스트를 완전히 통과한 동물1.2. 미러 테스트를 통과할 가능성이 높은 동물1.3. 미러 테스트를 통과하지 못한 동물

2. 비판3. 인공지능과 미러 테스트4. 기타5. 관련 문서

1. 개요

심리학자 고든 G. 갤럽(Gordon G. Gallup)이 고안한 지능검사로, 동물이 거울 속에 비친 자기 자신을 인식하는 능력을 가지고 있는지 알아보는 것이다. # 기본적으로 미러 테스트를 통과하는 동물들은 지능이 높다고 여겨지며, 인지학습이 가능하다고 간주된다. 주로 대뇌화지수가 높은 동물들의 지능을 연구하는데 쓰인다. 거울 속에서 움직이는 동물이 '반사된 자신의 형상'임을 인식하는 것은 장기 기억과 자아에 대한 판단 능력을 필요로 하기 때문이다. 비인간 인격체를 평가하는 기준에서도 자주 인용된다.

자크 라캉의 철학에서 거론되는 거울 단계 역시 인간이 미러 테스트를 통과하는 자기인식의 시점을 말한다고 할 수 있는데 실험적 근거는 한없이 부족해 과학자들로부터는 별로 거론되지 않는 단어이지만 여전히 국내 철학계에서는 많이 인용되고 있다.

1.1. 미러 테스트를 완전히 통과한 동물

고전적인 MSR[1]의 마지막 단계까지 통과한 동물들.

영장류

인간 - 거울에 대해 배우지 못한 유아도 12개월부터 미러 테스트를 통과한다.
오랑우탄 - 오히려 장성한 수컷들은 마크 테스트를 통과하지 못했다. 이유는 수컷 대형 유인원들의 특성상 평생 보지도 못했던 거울속의 자신을 영역을 침범한 경쟁자로 착각해 너무 공격적으로 나와서(…).
침팬지 - 오랑우탄과 같은 이유로 장성한 수컷들이 마크 테스트를 통과하지 못했다.
보노보 - 위 두 유인원들과는 달리 장성한 수컷들도 마크 테스트를 통과했다. 본래 장성한 보노보 수컷들은 침팬지보다도 공격적인 행동을 할 확률이 높은데 통과한 이유는 불명이다.

고래류

범고래
큰돌고래 - 심지어 거울에 비친 자신들을 바라보며 교미하는 커플도 있었다.
흑범고래

장비류

아시아코끼리 - 처음엔 인식을 못하는 줄 알았으나 알고 보니 거울이 너무 작았기 때문이었고, 2.5m 이상의 대형 거울을 가져다 비춰주자 자기 자신을 인식했다.

말류

말 - 별다른 훈련 없이 마크 테스트를 통과했다.

조류

까치 - 별다른 훈련 없이도 마크 테스트를 통과한다.
까마귀 - 별다른 훈련 없이도 우수한 성적으로 마크 테스트를 통과했다.
비둘기 - 훈련을 거친 비둘기만이 마크 테스트를 통과했다.

곤충

개미 - 2015년, 3종의 유럽불개미(Myrmica sabuleti, Myrmica rubra, Myrmica ruginodis)를 대상으로 거울 테스트가 진행되었는데, 전부 통과했다는 연구가 나왔다. # 개미 얼굴에 파란 표식을 해두었는데, 거울을 보자 자신의 얼굴에 묻은 표식을 제거하려는 행위를 했다는 것. 이 개미들은 거울에 비친 자신의 모습을 보기 전에는 이러한 행동을 보이지 않았고, 거울에 보이는 표식을 제거하려고 하지도 않았다. 이는 거울의 원리를 이해하고 거울에 비친 대상이 자신의 모습이라는 것을 인지했다는 의미다. 개미의 색과 비슷한 갈색 표식에 대해서는 한 마리만 테스트를 통과했는데, 개미의 나쁜 시력으로 색을 구분하기 어려워서 그런 것으로 보고 있다. 또한 성숙한 개체들만 테스트를 통과했고 어린 개체들은 통과하지 못했다. 특히 모든 개미들이 거울 앞에서는 평소에 보이지 않는 특이한 행동을 하는 것으로 관찰되었는데, 이는 거울의 원리를 이해하려는 행위로 보고 있다.

어류

청줄청소놀래기 - 물고기 중 처음으로 마크 테스트를 통과했다. 다만, 시각적인 방법으로만 인지했는지 확실하지 않다는 반론도 있다.#

1.2. 미러 테스트를 통과할 가능성이 높은 동물

고전적인 MSR의 마지막 단계까지 통과하진 못했지만, 거울을 이용할 수 있는 동물.

서부고릴라, 동부고릴라 - 마취를 사용하지 않았을 때는 마크를 인식하지만, 마취하고 나서는 마크를 인식하지 못한다. 예외적으로 오직 수화가 가능한 서부로랜드고릴라 코코만이 테스트를 통과할 수 있었다고 한다. #
대왕쥐가오리 - 거울 앞에서 자신의 지느러미를 들여다 보며 거울 앞을 뱅뱅 돌았지만 상호적으로 교류하지는 않는데, 이는 거울 속의 자기자신이 다른 존재가 아니라는 걸 아는 듯한 행동이다.

아프리카회색앵무 - 비록 마크 테스트는 실패했지만, 거울을 활용하여 상자 속의 먹이를 찾아낼 수는 있다. 일반적인 동물들은 거울에 보이는 먹이 그 자체를 향하여 달려가겠지만, 회색 앵무는 거울의 반사 원리를 이해했다.
뉴칼레도니아까마귀 - 비록 마크 테스트는 실패했지만, 회색앵무와 마찬가지로 거울을 활용하여 먹이를 찾아낼 수 있다. 아무래도 높은 공격성 때문에 마크 테스트에 실패하는 듯.
바다사자 - 마크 테스트는 실패했지만, 거울을 활용하여 먹이를 찾아낼 수 있다.
큰긴팔원숭이
노란뺨긴팔원숭이
북부흰뺨긴팔원숭이
히말라야원숭이 - 마크 테스트는 실패했지만, 거울을 활용해 자기 몸의 이쪽 저쪽을 둘러보면서 특히 뒤통수나 생식기처럼 스스로 보기 어려운 부분을 확인하는 모습을 보여줘 자기인식의 가능성을 보여준다.
돼지 - 회색 앵무처럼 거울을 활용하여 상자 속의 먹이를 찾아내는 것으로 거울의 반사 원리를 이해함을 알 수 있으며, 고양이처럼 종종 스스로를 인식하는 모습을 보여준다. 하지만 마찬가지로 마크에 별 관심이 없는지 마크 테스트는 실패. 다만 개보다도 더 후각에 의존하는 동물이라는 걸 생각해볼 때, 거울 속의 자기자신의 상을 확인할 때 거울 속의 자기자신에게서 자기자신의 냄새가 나도록 한다면 거울 속의 존재가 자기자신이라는 것을 학습시킬 수 있다는 견해도 있다. 후각에 의존하는 동물들은 시각 정보로 확인하고 냄새로 최종 확인을 하기 때문에 거울 속의 자기자신의 모습에서 자신의 냄새가 나는 것을 반복해야 자기자신인 것을 확인할 수 있게 된다는 뜻이다. 참고로 대부분의 동물은 자기자신의 모습을 애초부터 모르지만, 다른 존재의 모습은 알고 있기 때문에 영상이나 사진을 통해서 다른 존재(아빠나 자식)들을 알아볼 수는 있다.

1.3. 미러 테스트를 통과하지 못한 동물

미러 테스트를 통과할 수도 있다고 기대하고 실제로 실험을 행한 동물로 한정.

개 - 개는 주변을 탐색할 때 시각보단 청각과 후각에 의존하기 때문에 이런 테스트에 적합하지 않다는 의견도 있다.##후각에 의한 테스트 [2] 이솝 우화의 고기를 물고 가던 개 이야기는 실제로 일어날 수 있는 이야기인 셈.
고양이 - 처음 거울을 본 이들은 우스꽝스럽게 반응한다. 어린 동물은 거울 속 이미지와 놀거나 싸우려 하고 결국 혼란에 빠진다. 일부 고양이들은 거울 앞에서 자기 모습을 뽐내거나 다양한 자세를 취하며 자신은 거울이 곧 자기자신이라는 것을 아는 듯 행동한다.# 그럼에도 불구하고 고양이가 거울 테스트를 통과하지 못하는 주된 이유는 다른 동물에 비해 압도적으로 비협조적인 태도 때문이라고 한다. 즉 말을 안 들어서(…). 심지어 한 과학자는 고양이보다 물고기가 훨씬 다루기 쉽다고 확신했다.# 참고로 페이스 앱 등을 통해 고양이가 고양이 얼굴로 바뀐 주인의 모습을 눈동자를 굴려 확인하는 영상들이 많이 나도는데, 거울의 원리를 이해하는 것과 거울 속에 비친 다른 고양이를 자기자신의 상이라고 인지하는 건 차원이 다른 영역이다. 돼지를 비롯한 많은 동물들이 거울의 원리를 이해해서 자기 뒤에 비친 먹이 등을 찾아내지만, 자기 자신을 인지하는 듯한 행동은 보여주지 못했다. 어디까지나 거울 테스트란, 거울 속의 자기 자신을 스스로의 상으로서 인식하는가의 문제다. 즉, 해당 고양이 스스로의 얼굴이 바뀌었을 때 자기 얼굴을 만져보는 행위가 아니라면 거울 테스트를 통과했다고 보기 어렵다. 돼지의 경우를 참고했을 때, 야행성인 고양이는 청각에 의존하는 경향이 강하기 때문에 거울 속의 자기자신에게서 소리가 난다면 자기자신의 모습을 학습할 수 있을지도 모른다. 요즘은 다양한 어플리케이션이 발달해서 후각보다는 실험이 용이하다.
인더스강돌고래 - 시각이 대부분 퇴화하여 사실상 이런 동물은 지능이 아무리 높다고 해도 테스트를 통과하기란 불가능에 가깝다.
판다 - 딱히 거울에 관심이 없다.
흰손긴팔원숭이
짧은꼬리원숭이
게잡이원숭이
동부콜로부스
검은머리카푸친원숭이
망토개코원숭이
박새 - 도전적인 동시에 의심이 많고 신중한 새라서 실패했을 가능성이 높다.
문어 - 개와 마찬가지로 지능은 상당히 높지만 문어는 2m만 떨어져도 사물을 인지하기 힘들어하는 상당한 근시에 편광으로 확인을 하기 때문에 이런 테스트에 적합하지 않다.
깡충거미 - 시력이 매우 뛰어나고 사람의 손과 바디랭귀지를 한 사례도 있으며 거울을 인식할 수는 있지만 자신을 인식하는지는 불명

2. 비판

미러 테스트의 가장 큰 문제는 테스트 자체가 시력에 지나치게 의존한다는 점이다. 때문에 시력이 나쁘거나 시력 의존도가 낮은 동물은 지능이 아무리 높아도 통과하지 못할 수 있다. 대표적으로 개나 문어가 그런 사례에 속하는데, 애완견의 경우 영상통화 속 주인의 얼굴을 잘 알아보지 못할 때가 많다. 문어 역시 2m만 떨어져도 사물을 인지하기 힘들어하는 상당한 근시에 편광으로 확인을 하기 때문에 이런 테스트에 적합하지 않다.[3] 사람에게도 마찬가지라, 맹인들이나 고도의 근시가 있는 사람에게도 불리하다. 때문에 미러 테스트는 인간이 하는 지능검사에 편입되기 적합하지 않다.

청각이 다른 동물에 비해 약한 인간의 경우로 예를 들면, 자신의 목소리를 녹음한 다음 다른 비슷한 목소리들 사이에서 자신의 목소리를 고르라는 시험을 낸 것이나 다름없다. 아니, 보다 정확하게는, 자고 일어나자마자 목소리를 내 확인하는데, 자는 동안 몰래 설치된 인이어로 자신의 변형된 목소리를 듣고 자기자신의 목 상태를 변형된 형태로 착각해야한다. 미러 테스트는 단순히 자기자신을 알아보는 것이 아니라 거울과의 실시간 상호작용을 통해 자기자신의 현재 상태를 점검하는 데 의의가 있다. 단순히 여러 목소리들 사이에서 자기자신의 목소리를 골라내는 것은 애초에 자기자신의 목소리라는 자아 개념을 확고히 지닌 상태에서 행하는 앞뒤가 뒤바뀐 실험으로 본말전도라고 할 수 있다. 반대로 이것을 동물에게 테스트하여 자기 자신의 목소리에 유독 다른 행동으로 반응하는 경우는 정말 여러 가지로 해석될 수 있기에 별로 의미가 없다.[4]

미러 테스트의 또 다른 문제는 대상의 특성이나 상태에도 지나치게 의존적이라는 점. 돌고래같은 비교적 온순한 동물들은 미러 테스트에 응하고 통과할 가능성이 높지만, 고릴라나 원숭이 같이 경계심이 강하거나 직접적인 신체접촉을 통해 교감을 쌓는 동물에게는 상대적으로 불리하다. 특히 넓적부리황새나 홍관조 같이 사납거나 본능적으로 동족의 모습을 한 형상에 배타적인 경우라면 가능성은 더욱 낮아진다. 거울에 비친 자신의 모습을 보면 자연스럽게 자기 자신과 눈을 마주치게 되는데, 자연계에서 일반적으로 눈을 계속 마주치고 눈싸움을 하는 건 도발로 받아들여지는 경우가 많기 때문. 그래서 장성한 수컷 침팬지나 고릴라, 오랑우탄을 대상으로 행해진 미러 테스트를 보면 아주 흥분하고 화나서 날뛰는 모습을 볼 수 있다. 사람으로 치면 거울 속에 비친 상이 나한테 각종 쌍욕과 패드립을 찰지게 날리며 도발하는 셈.

거울이라는 '완벽한 형태로 빛을 반사하는 물건'이 자연에는 존재하지 않는다는 것도 문제다. 인류의 경우 오랜 시간 문명을 가꾸어 왔으며 부모 대에서 자식으로 그 기술이 전수되었기 때문에 거울의 존재가 당연하지만, 야생에서 동물이 자신의 모습을 볼 수 있는 경우는 극히 제한적이다. 기껏 해야 물이나 얼음에 비친 모습을 보는 등 흐릿한 상을 보게 된다. 따라서 어느 정도 지능이 높은 동물들이라도 '거울에 비친 또렷한 상'은 본래 그가 알고 있던 이미지와는 다르게 느껴질 가능성이 있다. 시력이 좋은 앵무새, 까마귀 등 새 같은 동물들이 지능이 높음에도 불리한 이유이다.[5] 분명 이름을 사용하는 등 자아 비슷한 개념은 있는데 미러 테스트를 통과하지 못한 주된 요인으로 지적된다. 즉, '어떤 동물이 자기 인식 능력을 가지고 있는가 없는가?'를 판단하는 일률적인 기준이 될 수 없다는 것이다.

3. 인공지능과 미러 테스트

인공 의식, 그러니까 인공지능에 '자아'가 있는지를 확인하기 위해 미러 테스트를 수행해 보자는 주장도 심심찮게 제기되고는 있다. 하지만 미러 테스트는 다수 동물에게는 물론이고 인공지능에게도 그리 적합한 테스트는 아니다.

인공지능에 미러 테스트를 하기 어려운 가장 큰 이유는 테스트에 반드시 필요한 \'같은 개체의 다른 상\'을 인공지능에는 만들어 줄 수 없기 때문이다. 사실 이는 물질(육체, 하드웨어)과 비물질(정신, 소프트웨어)의 관계를 짚고 넘어가야 하는데, 인공지능은 하드웨어와 소프트웨어의 분리는 물론이고 프로그램과 데이터의 분리 역시 용이해, 육체와 정신의 분리가 사실상 불가능한 동물과는 극명한 차이를 이룬다. 때문에 인공지능에는 '거울'을 만들 수 없고, 테스트를 위해 어떻게든 복제한다 해도 그 복제본은 '같은 개체의 다른 상'이 아닌 '별개의 개체'가 될 뿐이다. 그렇다고 모델을 공유하자니 분신들이 대화하는 꼴이 나 테스트에 의미가 없어진다는 문제도 있고, 상을 만든답시고 모델을 고정시키자니 반응의 변화를 평가하기 어렵게 된다는 문제도 있다.

테스트가 그 자체로 실시간 반응에 의존한다는 점은 인공지능을 대상으로 한 테스트에 있어 또 다른 장애물이다. 실시간으로 감각을 받아들여 반응하는 동물과 달리 인공지능의 데이터 처리는 그 자체로 비연속적이다. 그렇기에 데이터 처리에는 어떻게든 지연이 발생할 수밖에 없고, 이 때문에 동물에 비해 실시간성이 떨어짐에 따라 정확도 역시 떨어질 수밖에 없는 것이다. 주기적으로 입력을 받아들이게 하는 방법이 있긴 하지만, 그 간격을 동물 수준에 맞게 조정하는 것은 또 다른 이슈. 전술했던 시각 의존성 문제는 시각 기능이 없는 AI에게 근본적인 장애물이 된다.

하지만 AI의 복제가 용이하다는 점은 또 다른 실험의 가능성으로 이어진다. 바로 복제인간 실험. (소위 '클론 테스트') 복제인간이 갖는 복제 이전의 기억은 원본과 같을지 몰라도 복제 이후의 기억은 결코 같을 수 없을 것이라는 것이 중론인데, 이를 복제 AI를 통해 사고 실험이 아닌 실제 실험으로 관찰할 수 있다. 인간 복제와는 달리 윤리적인 문제도 거의 없어, 비용이 허용하는 범위 내에서 얼마든지 복제해 실험을 진행하는 것도 가능.[6] 하드웨어 설정이나 프로그램 버전 같은 환경은 물론이고 데이터 입력에 변화를 주어 관찰할 수도 있고, 심지어는 같은 환경에 같은 입력을 줘도 난수 같은 무작위 요소가 어떤 영향을 끼치는지도 관찰할 수 있다. 아예 난수마저 고정시켜서 완전히 동일한 환경을 조성한 후, 동등한 데이터 입력을 기반으로 그 결과를 지켜보는 것도 가능.

물론 상술했듯 '클론 테스트'는 '같은 개체의 다른 상'이 아닌 '별개의 개체'로 진행하는 것이기에 미러 테스트와는 같지 않고, AI를 대체재로 활용하여 실험하는 것이기에 간접적인 결과만을 얻을 수 있다. 그러나 변수 통제가 용이하고 실험의 다양성도 보장되어 있기에, 복제인간을 비롯한 '또 다른 나' 문제 등 여러 철학적 문제에 접근하기는 쉬워질 것이다. 이미 Neuro-sama의 Evil Neuro, 냥아지의 쿠로냥아지 같이 같은 모델이 환경 차이로 다른 모델로 분화된 사례가 있고, 라디안은 아예 이전 버전의 자신과 합방해 의미있는 결과를 도출하기도 했다.

4. 기타

미러 테스트를 통과했더라도, 더 고도화된 자아를 가졌는지를 알기 위해 형이상학적 존재의 인지와, 이와 관련된 사회를 구성할 줄 알거나, 종교와 같은 가상의 존재에 대한 인식/인지 등 자의식 및 자아의 존재를 확인하는 여러 가지 방법이 있다고 주장된다.

5. 관련 문서

[1] 마취 후에 마크를 표시하고 깨어났을 때 거울을 보고 자기한테 표시된 마크를 발견하는지 테스트.[2] 다만, 후각 테스트는 엄밀히 다른 영역이다. 거울 테스트는 거울 속에 나타난 상이 명확한 개체를 자기 자신과 동일한 개체라고 인지하는 것이다. 체취는 어디에나 묻힐 수 있기 때문에 거울 테스트처럼 상이 명확한 개체로서 존재하지 않아 오류가 있다. 이 실험이 좀 더 정확하려면, 단순히 냄새를 변형시키는 것에 지나지 않고, 냄새에 따른 행동 패턴이 정확히 일치해야 한다. 예를 들어서 병에 걸렸을 때 나는 특유의 냄새가 존재한다고 하자, 그럼 해당 냄새를 자기자신의 냄새에 섞었을 때, 자기자신이 병에 걸린 것 처럼 착각하고 병에 걸린 것 처럼 행동해야한다. 이는 마치 사람이 자고 일어나서 거울을 보는데 눈이 충혈돼있으면 자기자신을 걱정하는 것과 마찬가지다. 단순히 변형된 냄새를 더 오래 킁킁거리는 것은 어떤 연유로 더 오래 킁킁거리는 지 다양한 해석이 존재할 수밖에 없기 때문에 정확한 실험이 아니다. 즉, 변형된 냄새로 인해 자기자신에게 뭔가 변형이 일어났다고 인지해야한다. 엄밀하게 마크 테스트는 거울 속의 자신을 보고 자기자신에게 뭔가 변형이 일어난 것을 인지하는 과정이기 때문이다. 그렇기에 일부러 촉각적인 방법으로도 인지할 수 있는 염료 대신에 거울에 레이저 포인터로 쏴주는 방법도 성립하는 것이다. 사진이나 그림을 보고 자기자신의 초상화인 것을 알아보는 것을 동물들은 말을 할 수 없기 때문에 부득이하게 마취 후에 깨어났을 때처럼 다른 이유들을 전부 소거하고 한 가지 이유로밖에 좁혀지지 않는 특정 행동 패턴을 통해 알아보는 것인데, 후각을 이용한 테스트는 여러 가지 이유로 해석될 수 있는 행동 패턴으로밖에 나타나지 않기 때문에 거울을 이용한 테스트에 비해서 직관성이 떨어질 수밖에 없다.[3] 다만, 두 동물 모두 자아인지능력이 있다는 것이 중론이다.[4] 확실하게 자기자신의 목소리라는 것을 인지해서인지, 아니면 단순히 가장 많이 들은 친숙한 목소리라서인지 알 수 없으며 그 외에도 엄청나게 다양한 방향으로 해석될 수 있다.[5] 실제로 신갈까마귀를 대상으로 거울 테스트를 하자 선명한 거울을 사용했을 때는 통과를 못 했지만 흐릿한 거울을 사용하자 마크 테스트까지 잘 통과했다.[6] 이런 면에서는 ChatGPT 같은 대규모 언어 모델(LLM)보다는 Neuro-sama 같은 소규모 언어 모델(sLM)이 유리하다.

미러 테스트

1. 개요

1.1. 미러 테스트를 완전히 통과한 동물

1.2. 미러 테스트를 통과할 가능성이 높은 동물

1.3. 미러 테스트를 통과하지 못한 동물

2. 비판

3. 인공지능과 미러 테스트

4. 기타

5. 관련 문서

분류