개발

[IT지식] 생성형(대화형) AI란 무엇인가

gyuniverse 2023. 12. 14. 14:20

정의 및 설명

생성형 AI란 이용자의 특정 요구에 따라 결과를 능동적으로 생성해 내는 인공지능 기술을 의미한다. 기존까지의 딥러닝 기반 AI 기술이 단순히 기존 데이터를 기반으로 예측하거나 분류하는 정도였다면, 생성형 AI는 이용자가 요구한 질문이나 과제를 해결하기 위해 스스로 데이터를 찾아서 학습하여 이를 토대로 능동적으로 데이터나 콘텐츠 등 결과물을 제시하는 한 단계 더 진화한 AI 기술이다.
 
AI 개발사들은 다양한 생성형 AI 모델을 개발하고 적용하고 있다. Chat GPT와 같은 챗봇 서비스에 가장 널리 쓰이고 있는 생성형 AI 모델은 대규모언어모델(LLM, Large Language Model)이다. 쉽게 설명하자면, 텍스트와 같은 언어 데이터를 학습하여 결과를 제공하는 생성형 AI 모델이다. 아래 표는 기업 별 서비스와 AI 모델을 보여준다.

기업서비스AI 모델
오픈AI(OpenAI)Chat GPTGPT-3, GPT-3.5, GPT-4 등
구글(Google)바드(Bard)PaLM(Pathways Language Model : 구글의 LLM)
네이버하이퍼클로바X오션(OCEAN : 네이버의 LLM)

 
AI와 머신러닝, 딥러닝 및 생성형 AI와의 관계는 아래 그림과 같다. 초기 AI 등장 이후 머신러닝 단계까지는 특징 추출과 분류가 중요하였고, 이 둘의 기능은 각각 독립적으로 동작했다. 그러나 딥러닝 이후로는 인공신경망 구성, 특징 추출과 분류가 독립이 아닌 하나의 통합 모델로 유기적으로 이루어져 계층적으로 학습한 결과를 바탕으로 결과물을 만들어내는 하나의 지능체계를 구성하게 된다.

인공지능의 주요 개념과 생성형 AI의 관계

 
 

기업이 원하는 맞춤 LLM 모델을 만드는 3가지 방법

1. 제로 베이스에서 맞춤형 LLM 모델 개발하기

맞춤형 모델을 직접 바닥부터 개발하는 방법이 있다. 아주 뛰어나고 숙련된 ML 엔지니어를 확보해야 하고, 많은 양의 관련 데이터가 필요하며 모델 학습을 위한 충분한 인프라를 갖추고 있어야 한다. 현시점에서 이런 방식으로 LLM을 출시하는 기업들을 살펴보면 보면 Google, Meta 그리고 국내에서는 네이버, LG AI Research 등 기업들의 규모가 상당하다는 점을 알 수 있다.
 

2. 파인 튜닝하기

파인 튜닝

파인 튜닝이란, 사전 학습 모델(pre-trained model)에 도메인 특화 데이터를 추가 학습시켜 맞춤형 모델로 업데이트하는 것을 의미한다. 제로 베이스에서 LLM을 개발하는 것보다는 진입 장벽이 낮지만 이 역시 정교한 작업을 할 수 있는 ML 전문가가 필요하다.
 

3. 사전 훈련 모델(pre-trained model)을 활용하되 관련 있는 맥락을 검색(retrieve)하기

RAG

RAG(Retrieval Augmented Generation)라는 방법. 이 기법은 베이스 모델의 외부에서 데이터를 가져와 임베딩을 얻어 Vector DB에 저장하고, 사용자가 질문을 하면 관련도가 가장 높은 임베딩을 찾아내서 모델에 이를 제공하는 방식이다. 비용적으로 저렴하고, 외부의 데이터를 지속적으로 새로이 가져올 수 있으므로 데이터의 최신성 문제를 해결할 수 있다. 또한 ‘근거 있는 생성’을 하기 때문에 LLM의 태생적 문제 중 하나인 할루시네이션(Hallucination)에 대한 대비도 가능하다. 전통적인 ML 학습의 과정이 불필요 하기 때문에 앞서 제시한 2가지 방법보다 더 빠르게 원하는 LLM 애플리케이션을 만들 수 있는 방법이다.
 

결론

최근 회사에서 생성형 AI에 대해 간단한 보고를 받고 싶어 하여 조사해 본 내용이다. 조사를 하면서 우리처럼 작은 회사에서도 생성형 AI 모델을 만들 수 있을까 생각해 봤지만 전문업체나 인력을 통하지 않고서는 어렵지 않나 생각된다. RAG 방식으로 특정 업무에 대한 AI 모델을 구축해주는 전문업체는 많은 것 같았다.
가능하다면 직접 AI 모델을 아주 간단히라도 구축해보고 싶었는데 참고해서 해볼만한 튜토리얼을 찾지 못했다. 머신러닝이나 딥러닝은 그나마 개발자들이 공부 목적으로 구현해 본 것이 있었지만 말이다.
익숙하지 않은 분야를 조사하는게 어려움도 있었지만 신기하기도 하고 보람도 있었다.
 
 
 
 

출처 및 참고자료
https://www.zendesk.kr/blog/customers-really-feel-conversational-ai/
https://emotion.co.kr/magazine/43/
https://techscene.tistory.com/entry/%EC%B1%97GPT-%EC%97%94%EB%B9%84%EB%94%94%EC%95%84-GPU-Fine-Tuning
https://www.skelterlabs.com/blog/rag-vs-finetuning
https://blog.ml6.eu/leveraging-llms-on-your-domain-specific-knowledge-base-4441c8837b47

'개발' 카테고리의 다른 글

[React Native] google fit API 종료와 health connect 출시  (0) 2025.02.19
[git] gitlab으로 협업하기  (0) 2023.12.19