AI 입문| AIpedia 편집팀

생성 AI의 구조를 알기 쉽게 해설|GPT·확산 모델·RAG란?【초보자용】

생성 AI의 구조를 초보자도 이해할 수 있도록 알기 쉽게 해설합니다. GPT, 확산 모델, RAG, Transformer 등의 핵심 기술을 그림과 예시로 설명합니다.

"ChatGPT는 어떻게 문장을 생성하는가?" "Midjourney는 어떻게 이미지를 만드는가?" 이 글에서는 생성 AI의 구조를 초보자도 이해할 수 있도록 해설합니다.

생성 AI란?

생성 AI(Generative AI)란 새로운 콘텐츠(텍스트, 이미지, 음악, 동영상 등)를 생성할 수 있는 AI의 총칭입니다.

텍스트 생성 AI의 구조(GPT)

Transformer 아키텍처

GPT(Generative Pre-trained Transformer)는 "Transformer"라는 아키텍처를 기반으로 합니다. 핵심은 "어텐션 메커니즘"으로 문장 내 단어 간의 관계성을 파악합니다.

학습 프로세스

1. 사전 학습: 인터넷 상의 방대한 텍스트를 학습 2. 미세 조정(Fine-tuning): 특정 태스크에 맞게 조정 3. RLHF: 인간의 피드백으로 응답 품질 향상

텍스트 생성의 구조

GPT는 "다음에 올 가능성이 가장 높은 단어"를 예측하여 문장을 생성합니다.

이미지 생성 AI의 구조(확산 모델)

확산 모델이란

Stable Diffusion이나 DALL-E가 채택한 기술입니다.

1. 순방향 과정: 이미지에 서서히 노이즈를 추가 2. 역방향 과정: 노이즈에서 서서히 이미지를 복원 3. 텍스트 조건부: 프롬프트의 의미를 이해하고 그에 맞는 이미지를 생성

RAG(검색 증강 생성)란?

RAG는 AI가 응답하기 전에 외부 데이터베이스에서 관련 정보를 검색하여 응답에 반영하는 기술입니다.

RAG의 구조

1. 사용자가 질문을 입력 2. 관련 문서를 데이터베이스에서 검색 3. 검색된 정보를 컨텍스트로 AI에 전달 4. AI가 정보에 기반하여 응답을 생성

핵심 용어 정리

용어의미
LLM대규모 언어 모델
Transformer현대 AI의 기반 아키텍처
어텐션단어 간 관계를 파악하는 메커니즘
확산 모델이미지 생성 AI의 핵심 기술
RAG외부 정보를 참조하는 AI 기술
Fine-tuning특정 용도에 맞게 AI를 조정
RLHF인간 피드백으로 AI를 개선

정리

생성 AI는 복잡한 기술이지만 기본적인 구조를 이해하면 AI 도구를 더 효과적으로 활용할 수 있습니다. 중요한 것은 AI가 "이해하고" 응답하는 것이 아니라 "패턴을 학습하고" 생성한다는 점입니다.