CS/Chat Bot

AI 챗봇 핵심 기술 : 벡터, LLM, RAG

annovation 2025. 4. 10. 08:52

벡터(Vector)

벡터는 텍스트(문장이나 단어 등)를 숫자로 표현한 것입니다. 자연어는 기계가 그대로 이해하기 어렵기 때문에, 숫자의 나열로 바꾸어 수학적으로 다룰 수 있게 만드는 과정이 필요합니다.

 

예를 들어,
👉 "고양이"라는 단어를 [0.12, -0.34, 0.91, ...] 같은 숫자 배열로 표현합니다.

 

✔️ 왜 중요한가요?

벡터로 표현된 문장이나 단어는 의미적으로 가까운 것끼리 유사한 숫자 배열을 가집니다.
즉, 비슷한 의미의 문장을 비교하거나, 관련 있는 정보를 찾을 때 매우 유용합니다.

 

✔️ 어디에 사용되나요?

  • 사용자의 질문을 벡터로 변환한 뒤,
  • 미리 벡터로 저장해둔 문서들과 비교해서,
  • 가장 관련 있는 정보를 찾아주는 데 사용됩니다.

LLM (Large Language Model)

LLM은 ‘대규모 언어 모델(Large Language Model)’의 줄임말로, GPT와 같은 모델들이 대표적입니다. 방대한 양의 텍스트 데이터를 학습하여, 사람처럼 자연스러운 문장 생성이 가능하도록 만들어졌습니다.

 

✔️ 어떤 역할을 하나요?

  • 사용자의 질문에 자연스럽게 답변을 생성합니다.
  • 정보를 요약하거나 정리할 수도 있고,
  • 이메일, 블로그, 코드 등을 작성하는 데도 활용됩니다.

✔️ 한계점은?

LLM은 학습 당시의 데이터에 기반하기 때문에, 최신 정보특정 기업 내부 지식 등은 알지 못할 수 있습니다.


RAG (Retrieval-Augmented Generation)

RAG는 ‘검색 기반 생성(Retrieval-Augmented Generation)’ 기술입니다.
LLM이 단독으로 답변하지 않고, 외부 지식(문서 등)을 함께 활용하여 더 정확하고 신뢰할 수 있는 답변을 생성하는 구조입니다.

 

✔️ 동작 방식은 다음과 같습니다:

  1. 사용자의 질문을 벡터로 변환합니다.
  2. 그 벡터를 바탕으로 관련 문서를 벡터 DB에서 검색합니다.
  3. 검색된 문서 + 원래 질문을 LLM에 함께 전달합니다.
  4. LLM이 그 정보를 바탕으로 최종 답변을 생성합니다.

✔️ 장점은?

  • LLM이 모르는 정보를 검색으로 보완할 수 있습니다.
  • 특정 도메인 지식, 최신 데이터, 사내 문서 등도 반영 가능합니다.
  • 결과적으로 정확도와 신뢰도가 높아집니다.

요약

개념 역할
벡터 텍스트를 수치로 표현해 비교 및 검색 가능하게 합니다.
LLM 사람처럼 자연스럽게 텍스트를 생성합니다.
RAG 검색된 정보를 바탕으로 더 정확한 답변을 생성합니다.
반응형