GPT의 경쟁자 '바드'가 말한다. 챗GPT와 바드의 차이는?

구글 바드, 실시간 정보에 접근할 수 있어
ChatGPT, 더 많은 데이터 학습해 언어적으로도 더 뛰어나
각 AI의 특성에 따라 용도 맞게 골라 사용해야

사진 = 구글의 AI '바드'와 OpenAI의 AI 'ChatGPT' / 구글, OpenAI. 챗GPT의 경쟁자 '바드' 출시…바드가 말하는 'GPT와 바드의 차이'는?

[문화뉴스 우현빈 기자] 11일 구글이 AI챗봇 '바드(Bard)'의 정식 서비스를 시작했다.

바드는 구글이 개발한 챗봇 AI로, 챗GPT처럼 생성형 AI에 속한다. 생성형 AI란 인공신경망을 이용해 사용자의 의도에 맞는 새로운 데이터를 생성해낼 수 있는 인공지능을 말한다.

그렇다면 챗GPT와 바드의 차이는 무엇일까? 재미있게도 바드에게 챗GPT와의 차이에 대해 묻자, 바드가 대답했다.

바드가 말하는 챗GPT와 바드의 설명을 바탕으로 두 AI에 대해 알아본다.

▶공통점 : 대규모 언어 모델(LLC)

사람과 마찬가지로 생성형 AI가 데이터를 만들어내는 데에는 기존 데이터와 그 데이터의 학습이 필요하다. 챗봇 AI는 언어 모델로서, 텍스트 데이터를 학습해 새로운 데이터를 만들어낸다.

언어모델은 어떤 말뭉치에 대해 그 다음 올 말뭉치의 확률을 할당하는 딥 러닝 언어 모델을 말한다. 사용자가 어떤 말을 입력했을 때 그 말에 대한 대답 또는 그 말에서 이어지게 될 말로 어떤 말이 가장 어울리는지를 찾는 프로그램이다.

바드와 챗GPT는 신경망 모델에 속한다. 신경망 모델은 통계적 모델보다 더 큰 규모의 데이터셋과 고성능 하드웨어가 필요하지만, 복잡한 패턴의 학습과 다양한 자연어 처리 등 어려운 문제 처리에 있어 통계적 모델보다 더 높은 성능을 보인다.

이에 대규모 언어 모델(LLC)은 주로 신경망 모델을 이용하며, 삼성과 애플의 인공지능 비서 '빅스비'와 '시리' 역시 신경망 모델을 사용하고 있다.

특히 챗 GPT나 바드를 포함해 최신 모델은 대부분 트랜스포머(Transformer)라는 기술을 사용해 언어 처리 분야 전반에서 더 높은 성능을 보이며 데이터의 병렬 처리가 가능해 대규모 데이터 세트의 학습에 있어서도 훨씬 유리하다.

▶차이점 1. 최신 정보 접근성

챗봇의 대답은 챗봇이 활용할 수 있는 정보를 바탕으로 만들어진다. 따라서 그 정보를 어디까지 활용할 수 있는지가 챗봇의 용도를 결정하는 요소가 된다.

바드는 구글에서 만든 AI답게 구글 검색을 통해 정보를 수집해 대답할 수 있도록 만들어져, 최신 정보를 확인해 대답에 이용할 수 있다.

실제로 바드에게 당일의 기사에 대해 묻자 바드는 그날 올라온 기사의 제목을 답했다.

이와 달리 ChatGPT는 OpenAI사에서 웹사이트, 뉴스, 소셜미디어 등 다양한 매체에서 수집한 텍스트 데이터셋을 바탕으로 학습이 이루어진다. 그 데이터를 바탕으로 대답을 생성하며, 한정된 정보 밖의 대답은 생성할 수 없다.

실제로 ChatGPT에게 사용 가능한 정보의 범위를 묻자, 2021년 9월까지의 정보만을 활용할 수 있다고 대답했다.

사진 = ChatGPT(GPT-4)의 문답 / OpenAI ChatGPT 화면 캡처

다만 GPT Plus를 사용하는 유저의 경우, 플러그인 사용을 승인받으면 ChatGPT를 통해 외부 정보에도 접근할 수 있는 것으로 알려졌다.

▶차이점 2. 학습된 데이터의 양과 언어적 유창성

언어 모델의 대답이 얼마나 잘 만들어지는지는 결국 얼마나 많은 데이터로 얼마나 많은 학습이 이루어졌는지에 따라 결정된다. 즉, 학습에 활용한 학습 데이터의 양이 많을수록 AI가 더 복잡하고 더 어려운 문제를 해결할 수 있게 된다.

실제로 이들 AI의 구체적인 학습 데이터량에 대해서는 정보를 확인하기 어려웠지만 바드는 ChatGPT의 학습 데이터량이 바드의 학습 데이터 양보다 크다고 대답했고, ChatGPT의 GPT-3.5는 스스로의 학습 데이터 양이 '45TB'라고 대답했다. 또 GPT-4는 구체적인 양은 밝힐 수 없지만 3.5보다는 많은 데이터를 학습했다고 대답했다. ChatGPT가 정확성 등의 면에서 더 나은 대답을 내놓을 것으로 기대할 수 있다.

사진 = 사용할 수 있는 언어에 대한 AI들의 답. 위에서부터 바드, GPT-3.5, GPT-4의 대답 / 구글 '바드' 화면, OpenAI 'ChatGPT' 화면 캡처

바드와 ChatGPT에게 사용할 수 있는 언어의 종류를 묻자, 바드는 11가지라고 대답한 반면 ChatGPT는 55가지라고 대답했다. 또 GPT-4는 언어별로 그 수준이 다를 수 있고, 일부 언어는 더 유창하게 다룰 수 있다고 대답했다.

사진 = "'눈(snow)'을 주제로 한 시를 하나 써 볼래?"라는 질문에 대한 바드(좌)와 ChatGPT(GPT-3.5, 우)의 대답 / 구글 '바드' 화면, OpenAI 'ChatGPT' 화면 캡처

바드와 ChatGPT(GPT-3.5)에게 '눈을 주제로 한 시'를 쓰라고 하자, 바드에 비해 ChatGPT가 더 자연스럽게 표현한 것을 확인할 수 있다.

▶차이점 3. 대화의 연속성

바드는 이전 대화 세부 정보를 기억하지 못한다고 대답했다. 바로 직전에 나누고 있던 대화의 맥락은 어느 정도 파악해 대답에 반영할 수 있지만, 그보다 더 이전에 나누었던 대화의 내용은 기억하지 못하는 것을 확인할 수 있다.

사진 = 첫 질문 "혹시 챗GPT에 대해 알고 있어?"에 대한 바드의 대답. / 구글 '바드' 화면 캡처

실제로 바드에게 처음 했던 질문이 무엇이었는지를 묻자, "챗GPT에 대해 알고 있어?"라는 원래의 첫 질문 대신 "당신의 이름은 무엇입니까?"라고 대답했다.

사진 = GPT-3.5(위)와 GPT-4(아래)의 대답. GPT-3.5와의 해당 대화에서 첫 질문은 "LLM(Large Language Model)에 대해 설명해줘."였다 / OpenAI ChatGPT 화면 캡처

이와 달리 ChatGPT는 그 대화의 맥락을 기억하고 있는 모습을 보였지만, 두 버전에서 그 수준의 차이가 크게 나타났다. GPT-3.5는 대화의 맥락과 비슷한 답을 내놓았지만 정확한 질문을 내놓지는 못했다. 반면 GPT-4는 첫 질문은 물론 그 질문의 의미와 대략적인 대답의 내용까지도 정확하게 대답했다.

챗GPT와 바드, 용도에 맞게 잘 골라 사용해야

바드는 실시간으로 정보에 접근할 수 있어 일상적인 활용도가 높다. 예를 들어 내일 입을 옷의 종류를 추천받고 싶다면, ChatGPT보다는 날씨 정보에 접근할 수 있는 바드가 도움이 될 수 있다. 최신 정보가 필요한 경우에도 구글 검색을 통해 정보 수집이 가능한 바드가 도움이 될 수 있다.

ChatGPT는 코딩을 하다가 막힌 경우처럼 복잡하고 어려운 문제를 해결해야 하는 경우에 도움이 될 수 있다. 특히 학습 데이터량이 많은 GPT-4를 활용한다면 복잡하고 많은 절차를 필요로 하는 문제 해결에 도움이 될 수 있다.

한편, 바드는 현재 무료로 모두가 사용할 수 있도록 공개되어 있다. 반면 ChatGPT는 무료로 사용 시 시간당 사용 횟수에 제한이 있고, GPT-3.5만을 이용할 수 있다. GPT Plus를 가입하면 GPT-3.5는 제한 없이 이용할 수 있고 GPT-4도 이용할 수 있지만, GPT-4는 3시간당 25번의 메시지만 보낼 수 있다.