Ezs 과학문명/퍼지의 theory

Ezs 오진수 2020. 2. 26. 12:30

인공지능이 아직 글을 이해하지 못한다니, 무슨 뚱딴지같은 소리인가 생각할지도 모르겠다. 한국전자통신연구원이 개발한 엑소브레인 인공지능은 2016년 장학퀴즈 우승을 차지했다. 음성인식 스피커는 귀신같이 내 말을 알아듣고 오늘 날씨를 알려준다. 그런데도 인공지능이 글을 이해하지 못한다니?

하지만 언어처리 전문가들은 지금의 인공지능이 글을 이해하는 단계에 이르지 못했다고 입을 모은다. 몇 가지 예를 들어 보자.

휴대폰 음성인식 비서에 “맥도날드가 아닌 다른 패스트푸드 식당 찾아줘”라고 질문해 보면, 기대와 달리 검색 결과에 주변 맥도날드만 표시된다. 질문의 의도를 전혀 이해하지 못한 셈이다. 지금의 음성 인식비서는 미리 입력해 놓은 형식의 질문에만 답할 수 있는데, “맥도날드가 아닌”이라는 표현은 정형화된 질문 형식에 들어있지 않아서 일어나는 일이다.

구글은 2018년 ‘책에 물어보세요(Talk to Books)’라는 인공지능 서비스를 출시했다. 일상용어로 질문을 하면 인공지능이 10만 권의 책에서 답을 찾아주는 서비스라고 홍보했다. 이제 사람이 직접 책을 읽을 필요 없이 그저 인공지능에 물어보면 되는 시대가 왔다고들 이야기했다.

하지만 막상 서비스를 이용해 본 결과 실망이 컸다. 가령 “1980년 미국 대법관 중 나이가 가장 많은 사람은 누구였는가?”라거나 “은 30냥에 스승을 팔아넘긴 사람은 누구인가?”라는 간단한 질문에도 답을 찾지 못했다. 구글의 인공지능은 그저 질문과 비슷한 문장을 책에서 찾아서 보여줄 뿐이었다. 그러니 질문에 꼭 맞는 답변이 책에 나와 있지 않다면 답을 찾을 수 없었다.

최근 10년 동안 인공지능 기술이 크게 발전했지만, 인공지능은 유독 글을 이해하는 데 어려움을 겪고 있다. 현재 널리 사용되는 인공지능 기술을 흔히 딥러닝 기술이라고 한다. 수만, 수십만 개 이상의 인공 뉴런을 연결하여 정교하게 구축된 인공신경망을 이용하는 것이다. 딥러닝 기술은 사물을 판별하고, 음성을 인식하는데 탁월한 성능을 보인다. 방대한 데이터에서 반복된 패턴을 찾아내는 일을 잘 수행하는 덕분이다. 하지만 앞으로 딥러닝 기술이 더 발전하더라도 글을 진정으로 이해하는 인공지능을 개발하기란 쉽지 않을 것이라고들 이야기한다. 글을 이해하는 인공지능이 그토록 어려운 이유가 뭘까?

글은 추상적이고 함축적으로 정보를 전달하는 도구다. 따라서 글을 이해하고 질문에 답하려면 글에 쓰여 있지 않은 내용까지 알아야 한다.

사람은 이미 상식적으로 알고 있는 배경 지식이 많다. 가령 앞선 질문에서 1980년 미국 대법관 중 최연장자를 찾으려면 ‘나이’가 무슨 뜻인지 알아야 한다. 사람은 너무도 당연히 알고 있는 개념이지만 인공지능은 그렇지 않다. 나이의 의미와 그 계산 방법을 따로 알려 주어야 한다.

그래서 연구자들은 인공지능이 글을 이해하려면 ‘상식’을 갖추어야 한다고 지적한다. 하지만 인공지능에 상식을 알려 주는 일은 쉽지 않다. 우선 그 양이 워낙 많기 때문이다. 사람이 제대로 된 상식을 갖추려면 적어도 십수 년 이상의 교육과 경험이 필요하다.

오랜 기간 동안 인간이 학습하는 수많은 내용을 컴퓨터에 입력하기란 쉽지 않다. 게다가 상식은 많은 경우 암묵지(暗默知) 형태로 돼 있다는 문제도 있다. 암묵지란 명시지(明示知)와 달리 문서화나 형식화가 어려운 유형의 지식이다. 암묵지는 문화권마다도 달라서, 사람도 다른 문화권으로 옮기면 그곳의 암묵지를 새로 습득해야 한다.

이제껏 몇몇 인공지능 연구자들이 인간의 상식을 모두 정리한 데이터베이스를 구축해보고자 시도했지만, 큰 성과를 내지 못했다.

인공지능이 사람보다 뛰어난 능력을 보이는 영역도 많지만, 정작 기본이 되는 상식을 갖추지 못하고 있다는 점은 역설적이기도 하다. 현재 많은 연구자가 상식을 갖춘 인공지능을 개발하고자 애쓰고 있지만, 여러 아이디어가 제안되는 단계에 있는 듯하다. 그래서 인간과 유사하게 생각하는 인공지능을 구현할 수 있으리라는 바람은 적어도 현재의 기술 수준에서는 아직 요원하다. 언제가 될지 짐작하기 어렵지만, 상식을 갖춘 인공지능이 등장하는 때야말로 인공지능 기술의 돌파구가 열리는 시점이 될 것이다.

김병필 KAIST 기술경영학부 교수

사업자 정보 표시
소빛 | 오진수 | 경기 의정부시 외미로 92-12 703호 | 사업자 등록번호 : 101-18-64923 | TEL : 010-7777-2137 | Mail : 5cheui@hanmail.net | 통신판매신고번호 : 제 2018-의정부호원-0127 호호 | 사이버몰의 이용약관 바로가기

 
 
 

Ezs 과학문명/퍼지의 theory

Ezs 오진수 2019. 3. 13. 15:27


1956년 인공지능(AI)이라는 단어가 등장한 이래, ‘지능’의 의미에 대해서는 아직 의견이 분분하다. 쌓아놓은 데이터를 기반으로 기계적 답만을 내놓는 AI부터, 스스로 학습을 통해 점차 지능을 향상하는 AI까지 범위와 기능이 제각각이기 때문. 

단순히 계산을 하는 AI는 엑셀과 다를 바 없다. AI가 가야 할 길은 기존의 인간 지식을 바탕으로 새로운 이론과 시각을 제시할 수 있어야 한다는 것이 마인드AI의 생각이다.

마인드AI는 사람들이 주입한 세상에 대한 지식, 즉 온톨로지(명제·Ontology)를 활용해 인간이 나아갈 길을 제시하는, 말 그대로의 인공의 ‘지능’을 만들고자 한다. 지난 4일 만난 마이드AI의 폴 리 대표는 지능의 뜻을 분명히 했다. 폴 리 대표는 “엑셀이 처음에 나왔을 때, 세무사·회계사 직업이 없어질 것이라고 다들 말했지만 결국 그렇게 되지 않았다. 이를 어떻게 활용하는지에 대한 사람의 의지가 중요한 것이다. AI는 기존의 지식을 바탕으로 ‘카피 앤 페이스트(copy & paste)’가 아닌 주어진 상황을 바탕으로 한 적절한 답을 내려야 한다”고 말했다.

마인드AI는 기존 AI에 많이 적용되는 의사결정트리(Decision-tree), 신경망 네트워크(Neural NetworK) 등의 모델과 구분되는 새로운 기본 추리 단위인 캐노니컬(Canonical)을 내놓았다. 의사결정트리는 주어진 입력값에 대한 출력 값, 해석을 예측해낸다. 주로 마케팅에서 고객 분석 등에 사용된다. 신경망 네트워크는 참과 거짓을 구분하는 방식으로 동작해 음성인식 AI 등에 자주 쓰인다. 


반면 마인드AI의 추론 엔진 캐노니컬은 사람이 입력한 어떠한 단어, 혹은 단위에 대한 대명제와 소명제를 기반으로 답을 추리해 나간다. 그래픽으로 보면 삼각형의 꼭지점 마다 언어를 배치, 상호 간의 연결을 통해 맥락의 고리를 만들어낸다. 방대한 정보에서 필요한 정보만을 추출해 내는 것이 아닌, 하나하나의 명제를 바탕으로 지식에 대한 문맥을 짚어내 결과를 추론하는 것이다. 또한 사람의 언어, 즉 자연어로 입력된 명제로 구동되기 때문에 법, 의료, 과학 연구 등 어떤 분야에서도 쓰일 수 있다. 

마인드AI 데모 버전인 딜라이트를 통해 캐노니컬의 추리 과정을 살펴볼 수 있다. 딜라이트는 9살 소녀 수준으로 설정되어 있으며 어린왕자 한 챕터 분량의 정보가 입력됐다. 딜라이트에게 책의 내용에 관해“Adult(어른)이 뭐라고 말했니?”라고 물어보자. 어린왕자 책에는 어른이라는 단어가 없다. 딜라이트는 그러나 입력된 책 내용 맥락을 통해 “어른이 grown up(다 큰 사람)입니까?”라는 반문을 내놓는다. 다 큰 사람이라는 명제를 통해 어른이라는 명제를 추리해 내는 것.

조금 더 어려운 문장을 가지고 살펴보자. “갸가 갸고 갸가 갸가?”라는 질문이 있다고 치자. 풀이하자면 “그 사람(A)가 A고, 다른 사람(B)가 B인가”다. 여기서 사람이라면 어느 정도의 기반 지식을 가지고 A와 B를 구분해낼 수 있다. 그러나 기존 소프트웨어의 경우 문맥을 알지 못하기 때문에 사람 = 사람으로 인식할 뿐 A와 B의 다름을 구분하지 못한다. 반면 마인드AI의 캐노니컬 구조는 사람과 같이 전후 사정을 추적해내 문장의 의미하는 바를 ‘인지’할 수 있도록 한다.


캐노니컬은 비단 인간과 같은 사고의 과정을 거치는 것이 아니라 인간보다 한 단계 더 나아간 사고가 가능하다는 것이 리 대표의 설명. 그는 “인간이 A와 B를 연결할 수 있다면, 마인드AI는 A와 Z를 연결할 수 있다”며 “궁극적으로 인간보다 더 방대한 데이터에서 지식들 간의 연관관계를 찾고, 새로운 학설을 AI가 스스로 낼 수 있게 되는 것을 목표로 한다”고 말했다. 

이 방대한 지식을 가지고, 인간보다 똑똑한 AI가 소수의 손에 들어간다면 어떻게 될까. 테러리스트들이 기존에 없던 무기를 만들기 위해 AI를 사용한다면? 한 국가가 자신들의 이익만을 위해 이를 사용하려 한다면? 리 대표는 이러한 특징 때문에 블록체인의 필요성을 느꼈다고 말한다. 리 대표는 “수 십, 수 천 개의 블록체인이 새로운 형태의 데이터를 수집하고 데이터를 정렬하게 되는 시대가 오게 될 때, 블록체인이라면 아무도 이를 통째로 갖고 있지 않은 탈 중앙화 AI를 만들 수 있다”며 “블록체인을 이용하면 그러한 지식, 데이터를 넣어주는 사람들을 추적해 낼 수 있기 때문에 어뷰징을 색출할 수 있고, 양질의 데이터를 넣어주는 사람들에게는 응당한 보상을 제공할 수 있다”고 말한다. 

물론 좋은 지식만이 입력될 수는 없다. 도덕과 사상, 법과 규칙은 시대에 따라 바뀌고 국가에 따라 바뀐다. 이 때문에 마인드AI는 입력되는 지식을 거르지 않고 모두 받아들인다. 리 대표는 “지식 간의 우선순위와 보편적인 윤리적 판단을 위한 윤리 위원회를 운영할 것”이라고 말했다. 

마인드AI는 현재 캐노니컬 추론 엔진을 통해 차량 사고 대처 방법을 알려주는 챗봇 AI 개발을 국내외 자동차 업체들과 함께 준비 중이다. 연말에는 캐노니컬 추론 엔진의 활용을 통한 실제 서비스를 속속 선보일 예정이다. 

/원재연 기자 wonjaeyeon@decenter.kr

- 첨부파일

데자뷰.mp3  
   
사업자 정보 표시
소빛 | 오진수 | 경기 의정부시 외미로 92-12 703호 | 사업자 등록번호 : 101-18-64923 | TEL : 010-7777-2137 | Mail : 5cheui@hanmail.net | 통신판매신고번호 : 제 2018-의정부호원-0127 호호 | 사이버몰의 이용약관 바로가기