ChatGPT 어떻게 쓸까 (상)
거대 언어 모델 활용법 가운데 하나
사용자 피드백으로 오류 고쳐나가
개발자 대체보다 생산성 향상 기대
요즘 챗GPT (ChatGPT)에 관한 이야기가 여기저기서 봇물 터지듯 쏟아지고 있다.
이미 아마존에서는 ChatGPT와 GPT-3를 주제로 한 책이 100권 이상 출간되었다. 한국에서도 ChatGPT로 내용을 만들고 파파고로 번역한 책이 출판되었는데 이는 애교 수준이다. 2023년 1월 ‘인공지능이 주도하는 시대에 ChatGPT와 기타 챗봇 (Chatbot)을 위한 1,337가지 활용 방안’ (1337 Use Cases for chatGPT & other Chatbots in the AI-Driven Era)이라는 긴 제목의 책이 출간됐다. ChatGPT 활용 방안을 소개하며, ChatGPT가 만능일 것 같은 인식을 하게 한다. SNS, 유튜브, 언론 및 세미나 등에서도 ChatGPT에 대한 논의가 끊이지 않는다.
ChatGPT는 이제 현상이 되었다. 그러나 과거의 경험과 기술 발전의 특성에 견줘 볼 때, 과도한 기대의 거품과 매캐한 디지털 분진을 경계해야 한다. ChatGPT를 비롯한 거대 언어지능은 실시간 학습이 불가능하며, 논리력이 부족하다. 또 환각, 기억력 한계, 저작권 침해, 편향, 복잡성, 지식 교조화 등의 한계를 가지고 있다. 일부 한계는 기술 발전으로 인해 점차 완화될 수 있지만 편향과 지식 교조화 같은 한계는 그 해결이 쉽지 않다.
이런 한계와 제약에서 비교적 자유롭게 ChatGPT를 활용할 수 있는 분야는 어디일까?
ChatGPT 활용의 3가지 유형
ChatGPT는 GPT-3라는 거대 언어 모델 (Large Language Model)의 활용법 가운데 하나다. 따라서 GPT-3의 활용 범위는 ChatGPT보다 다양하고, 거대 언어 모델의 활용 범위는 GPT-3보다 넓다.
ChatGPT를 GPT-3.5라고도 하나, 이는 반은 맞고 반은 틀리다. 개발업체인 OpenAI가 ChatGPT의 차별성을 강조하기 위해 버전 3.5라고 한 것인데, ChatGPT에서 추가 학습된 내용은 GPT-3에도 반영되었으므로, 둘의 속살은 크게 다르지 않다.
ChatGPT 활용 분야는 사용자가 ChatGPT 대화창에 입력하는 내용의 크기와 출력하는 크기를 기준으로 크게 3가지 유형으로 나눌 수 있다.
<표> GPT-3 활용 유형 및 내용
▲ <표>에서 상세 활용 유형을 구분하는 데는 OpenAI 홈페이지, 인터넷의 ChatGPT 쓰임새 (use cases) 등을 참조했다. 활용 타당성과 설명은 ChatGPT 질문, 인터넷 탐색 및 직접 검증 등을 통해 확인했다. 거대 언어 모델로 할 수 있는 모든 것을 나열하지는 않았다. 할 수도 없다. 활용은 개발자의 몫보다는 사용자의 몫이기 때문이다.
위의 <표>를 분석하면, 입력량에 비해 출력량이 많은 경우, 즉 유형 1에서 활용 타당성이 낮다는 것을 알 수 있다. <표>에서 제시하지 않았으나 입력량은 최대 3,000단어다. 이는 ChatGPT 개발사인 OpenAI 관계자가 홈페이지에서 답변한 내용을 참고했다.
유형 1 (입력량보다 생성량이 많음)에서 환각과 오류에 의한 답변은 신경망 알고리즘에 본질적인 것이다. 단 컴퓨터 코딩은 예외다. 일부 주장에 따르면 거대 인공지능의 매개변수 규모를 늘린다고 하더라도 유형 1의 한계와 오류는 일정 수준 이하로 낮출 수 없다. 예컨대 페이스북의 인공지능은 흑인을 영장류로 분류했고, 이를 보완하지도 못하는 한계를 보였다. 거대 언어 모델이라고 해서 이런 한계에서 쉽게 벗어날 수 없다.
더구나 언어 인공지능은 단어와 문장, 문맥의 유형이 매우 다양하므로 그 복잡도가 매우 크다. 매개변수의 크기가 거대하여 거대 언어 모델이라 했는데, 이를 다른 말로 하면 거대 복잡 모델이 된다.
ChatGPT를 무료로 공개한 이유
다만 ChatGPT는 사용자 피드백을 통해 환각과 오류를 보완하고 있다. ChatGPT를 무료로 대중에게 공개한 이유는 사용자 피드백을 받아서 GPT-3 품질을 높이고, 인공지능 시장을 선점하기 위한 것이다. 그렇더라도 이 문제를 완전히 극복할 수는 없을 것으로 판단된다. 피드백끼리 충돌할 위험이 있으며, 상호 복잡하게 얽힌 신경망 알고리즘의 특성상 예상할 수 없는 부작용을 일으킬 수 있다. ChatGPT는 일부 설명 가능한 인공지능을 구현하기는 했으나, 완벽하지 않다고 스스로 고백했다.
입력량은 기억의 규모이기도 하다. 대화를 진행할 때 그 이전의 대화까지 모아서 되먹임하여 입력하기 때문이다. 3,000개의 단어는 적은 양이 아니다. 폰트 크기 11로 쓴 영문 에세이 8매에 포함된 단어 수는 3,000개가 채 되지 않는다. 그리고 가장 먼저 입력한 내용이 사라져도 어느 정도 연속성 있는 대화가 가능하기는 하다.
ChatGPT에 다수의 사람이 동시에 접속하므로 사용 효율성을 높이기 위해 입력량의 제약을 추가로 둘 수 있다. GPT-3에 접근할 수 있는 API에 따라 최대 단어 수를 100개 혹은 60개 등으로 제약을 두었다. ChatGPT에서도 추가 제약이 가능하다.
▲ <기술의 미래를 만드는 데 동참하세요.> ChatGPT 운영사 OpenAI 홈페이지
ChatGPT가 개발자를 대체할 수 있을까
그렇다면 최대 입력량을 늘릴 수 있을까? 이 한계가 GPT-3 자체의 한계인지 혹은 정책적 한계인지는 알 수 없다. 정책적 한계라 하더라도 입력량이 무한하지는 않을 것이며 일정한 한계가 있을 수밖에 없다. 입력량이 많다는 것은 변수가 많다는 것을 의미하며, 변수를 처리하기 위해서는 인공지능도 그만큼 혹은 기하급수적으로 복잡해져야 함을 의미한다. 인공지능의 복잡성은 매개변수 규모의 문제이며, 매개변수의 규모는 하드웨어의 규모 증가로 이어진다. 이를 극복하기 위해서는 인공지능의 패러다임 전환이 필요하다.
유형 2 (입력량과 출력량이 유사)와 유형 3 (입력량보다 출력량이 적음)에서는 활용을 안정적으로 할 수 있다. 유형 1의 경우라 하더라도 참조를 위해서 적극적으로 사용할 수 있다. 그런데 이를 제대로 활용할 수 있으려면 비판적 사고 역량과 필요한 지식을 검색할 수 있는 디지털 문해력이 필요하다.
유형 1에서 전반적으로 활용 가능한 부분은 컴퓨터 프로그래밍 영역이다. OpenAI가 제시한 사용 예시 40여 개 중 컴퓨터 프로그래밍과 관련된 항목이 15여 개다. 프로그래밍 언어가 사용하는 단어의 수에 제한이 있어, 유형 1의 제약이 크지 않기 때문이다. 또 그렇기 때문에 GPT-3 개발자가 프로그래밍과 관련된 사용 예시를 다수 제시한 것으로 보인다.
그렇다고 ChatGPT나 GPT-3가 개발자를 완전히 대체할 수는 없을 것으로 판단된다. 컴퓨터 프로그래밍에 상당한 복잡성이 있기 때문이다. 수백 개의 환경 변수, 수천 개의 테이블, 수만 개의 인터페이스를 통합적으로 이해하면서 창의적이고 효율적인 컴퓨터 알고리즘을 작성할 것을 현재 수준의 인공지능에 요구하기는 어렵다.
대신 ChatGPT는 개발자의 생산성과 컴퓨터 언어 교육의 효과성을 높이는 데는 큰 기여를 할 것으로 기대한다. 다만 이 분야에서 ChatGPT나 GPT-3가 시장의 승자가 될지는 불확실하다. 인공지능으로 컴퓨터 개발의 지원을 받는 것을 노-코드 (no-code) 혹은 로-코드 (low-code)라 하는데 깃허브 (Github)의 코파일럿 (Coplilot) 같은 다수의 경쟁자가 있기 때문이다. 향후 등장할 거대 언어 모델의 다수도 유사한 기능을 탑재하고 있어 더욱 그렇다.
윤기영 (한국외대 경영학부 미래학 겸임교수, FNS컨설팅 미래전략연구소장)