금융결제원 웹진

KFTC TREND

[1부] 인간과 대화하는 AI, ChatGPT의 등장

글/사진. 신휴근 정보보호분석평가팀 팀장

2022년 11월 말, 요란한 광고 없이 조용히 출시된 ChatGPT는 두 달 만에 전 세계 사용자로부터 폭발적인 인기를 끌며 인공지능(AI) 업계에 큰 화두를 던졌고 인류의 삶이 크게 변화할 것이라는 기대를 하게 만들었다.
ChatGPT와 같은 인공지능의 등장은 더 이상 창조성이 인간의 전유물이 아니라는 점에서 인류의 역사적 사건이라 할 수 있는 산업혁명, 구텐베르크 인쇄기 발명, 인터넷 보급 등과 비견되기도 한다.
어쩌면 우리는 인류 역사에 한 획이 그어지는 장면을 목격하고 있는 게 아닐까?

빌게이츠는 블로그에 'The Age of AI has begun' 글을 게시 (클릭 시 해당 글로 이동)

ChatGPT란?

ChatGPT는 미국 인공지능연구소(OpenAI)의 대규모 언어 모델(Large Language Model)인 GPT(Generative Pre-trained Transformer, 사전 훈련된 생성 변환기) 기반으로 만들어진 대화가 가능한 인공지능 서비스다. ChatGPT라는 서비스 이름에서 보는 바와 같이, 사용자가 입력한 문장 속 단어 간의 관계를 추적해 맥락을 학습하는 신경망(Transformer)을 활용하여 다음 단어를 예측(Generative, 생성)하는 사전 학습(Pre-trained)된 인공지능 모델인 GPT를 기초로 하고 있다.

GPT 개발 역사

구분	설명	공개시기	매개변수 개수(개)	비고
GPT-1	GPT 1세대	2018.06	1.17억
GPT-2	GPT 2세대	2019.02	15억
GPT-3	GPT 3세대	2020.05	1,750억
GPT-3.5	InstructGPT	2022.01	1,750억(추정)	최초 적용
GPT-4	GPT 4세대	2023.03	미공개	추가 적용

GPT는 2018년에 개발된 이후 최근 GPT 4세대(GPT-4)가 발표되는 등 매우 빠른 속도로 발전하고 있다. ChatGPT는 1년 전에 개발된 GPT 3.5세대(GPT-3.5)를 미세 조정하여 출시되었는데, 최근에 개발된 GPT 4세대(GPT-4)도 추가 적용되어 서비스 중이다.
ChatGPT는 개발된 인공지능 모델의 결함을 해결하기 위한 목적으로 공개된 연구 발표(Research Preview) 성격의 서비스였기에 출시 후 대중들의 뜨거운 반응에 OpenAI 측도 놀랐다고 한다.

ChatGPT의 작동 원리

ChatGPT는 GPT-3.5에 보다 엄격한 입출력 제한 기능(가드레일)이 적용된 인공지능 모델을 사용하였다.

GPT-3.5의 이전 모델인 GPT-3는 문장을 자연스럽게 연결하는데 뛰어난 성능을 보였지만 성차별, 인종차별적 발언을 생성하는 등의 문제가 있었다. 잘못된 정보나 불쾌감을 유발하는 답변을 생성하지 않도록 인간 피드백 기반 강화학습(RLHF)이 적용된 GPT-3.5를 개발하는 대략적인 과정은 아래와 같다.

(1단계, 사전학습) 웹(텍스트, 책, 인터넷 백과사전 등)에서 수집된 방대한 학습데이터(45TB)를 1,750억 개의 매개변수로 사전 학습하여 초기 언어모델을 생성

(2단계, 지도학습) 사람이 학습데이터에서 신뢰할 수 있는 질문과 답안을 직접 샘플링한 후 이 데이터를 활용하여 초기 언어모델을 업데이트하는 지도학습(Supervised fine-tuning) 수행

(3단계, 보상모델 생성) 미세조정된 언어모델이 생성한 답변에 대해 사람이 직접 평가(scoring)하고 답변과 평가결과를 학습하는 보상모델(Reward Model)을 생성

(4단계, 강화학습) 3단계에서 생성한 보상모델을 활용하여 언어모델이 생성한 결과를 평가하고 평가결과를 이용하여 더 높은 점수를 받을 수 있도록 언어모델에 대한 강화학습을 진행

ChatGPT의 노동착취 논란

ChatGPT의 초기 모델이 가진 성차별, 인종차별적 문제를 해결하기 위해 케냐의 AI 데이터 분류기업(Sama)과 계약하여 사람이 직접 폭력, 증오 표현, 성차별, 인종차별 등의 표현이 담긴 유해한 데이터를 필터링하는 작업을 수행했다. 주로 케냐, 우간다, 인도인으로 구성된 작업 인력은 저임금(1.32 ~ 2달러)을 받고 매일 수 시간씩 유해 콘텐츠를 분석하며 트라우마에 시달린 것으로 알려지면서 노동착취 논란 이슈가 발생했다.

ChatGPT 활용 사례

<정보보호 측면>

ChatGPT 활용법이 인터넷을 통해 연일 공개되고 있다. 모든 기술이 그러하듯 ChatGPT 또한 명과 암이 존재한다. 서비스 기업은 비즈니스 측면에서 새로운 기회를 창출하는 유용한 도구로 활용할 수 있지만 사이버 범죄자는 악성 행위를 자동화하고 발전시키는 무기로 이용할 수 있다.
인간처럼 생각하고 문장을 생성하는 기능은 어쩌면 사회공학적 공격을 수행하는 사이버 범죄자에게는 기회이다. 즉 사이버 범죄자는 공격 대상이 속한 국가의 언어와 산업에 대한 지식을 바탕으로 설득력 있고 개인화된 다양한 피싱 콘텐츠를 매우 빠르게 생성할 수 있게 된 것이다.

은행 사칭 피싱메일 생성 요청
생성된 피싱메일을 일본어로 번역 요청

또한 공격 대상이 속한 산업에 대한 사전 정보를 수집하고 그들의 비즈니스 로직을 이해하기 위한 정찰 목적의 도구로 악용될 수 있으며, 높은 수준의 공격 지식 없이도 해킹을 위한 악성코드를 생성할 수 있게 되었다. ChatGPT의 최신 버전인 GPT-4는 개발된 코드 내 오류 또는 실수를 식별하고 수정하는 등 코드의 맥락을 더 잘 이해하는 것으로 평가받고 있어 향후 사이버범죄 도구 개발에 적극 활용될 위험이 있다.

한편 ChatGPT는 이에 맞서 사이버 방어를 위해서도 기능할 수 있다. 보안시스템에서 수집된 이벤트 및 로그를 자동 분석하여 위험을 평가하고 사이버 범죄자의 공격 행위를 모방하는 공격 코드를 생성하여 방어 역량을 개선하는 것이다. 또한 방대한 인터넷 자료로부터 사이버 범죄자들의 공격 전략과 기술이 담긴 위협 인텔리전스를 수집함으로써 방어자의 역량을 강화하는 데에도 기여한다.

<개발 측면>

많은 양의 소스코드를 학습한 ChatGPT의 코드 생성 능력은 빠르고 정확하다는 평가를 받고 있다. 개발 역량이 높지 않은 일반인이 자연어만으로 프로그램을 개발하는 진정한 의미의 노코드 툴(No-code Tool)이 탄생했다고 봐도 무방하다. 앞으로 특정 비즈니스에 매우 특화된 프로그램을 제외하고서는 프로그램의 일반적인 기능 정도는 숙련된 인공지능에 의해 생성될 수도 있다.

ChatGPT의 개발 능력을 간접적으로 확인하고자 ChatGPT로 ‘알카노이드(Arkanoid)’라는 이름으로 알려진 익숙한 게임 ‘벽돌깨기(Breakout)’ 게임을 개발해 보았다. 그 결과는 매우 놀라웠다. 단지 몇 개의 질문(프롬프트)만으로도 오류 없이 실행할 수 있는 완전한 형태의 소스코드를 코딩, 아니 생성했다.

심지어 소스코드상에 존재하는 오류를 설명하고 수정하거나 구현된 기능을 업그레이드하는 등 개발자만이 할 수 있을 것으로 예상된 일을 대신하는 모습도 보였다. ChatGPT 등 AI 기술의 발전으로 개발이 가능해짐에 따라 개발 방법론에도 큰 변화가 일고 서비스 개발 속도 또한 더욱 빨라질 것으로 예상된다.