뉴스레터

뉴스레터 24'10'20 -✔️ LLM(Large Language Model, 대규모 언어 모델)과 RAG(Retrieval-Augmented Generation, 검색 증강 생성)

ttoance 2024. 10. 20. 20:18

daily devblog @20241020

https://www.howdy-mj.me/ai/llm-rag-for-beginners

 

LLM과 RAG, 쉽게 이해하기

ChatGPT가 등장하면서 모든 분야가 급격하게 변화하고 있다. 텍스트만 입력하면 영상을 만들어주는 Sora, 기존 노래의 목소리를 다른 인물의 목소리로 바꾸는 AI 커버, 아나운서 말투를 학습한 AI 앵

www.howdy-mj.me

 

LLM과 RAG, 그리고 미래의 AI 기술

**LLM(Large Language Model, 대규모 언어 모델)**은 수십억에서 수조 개의 토큰(단어, 스페이스, 특수 문자 등)으로 훈련된 모델입니다. ChatGPT, Claude, Gemini 등이 대표적입니다. LLM은 컴퓨터가 언어를 이해하고 생성할 수 있도록 학습하며, 단어를 더 작은 단위(토큰)로 나누어 처리합니다. 하지만 최신 정보에 대한 즉각적인 업데이트에는 한계가 있습니다.


LLM의 작동 방식

  • 토큰화(Tokenization): 단어를 작은 조각으로 분해(예: '안녕하세요' → ['안', '녕', '하', '세', '요'])하여 컴퓨터가 처리할 수 있게 함.
  • 가중치 학습(Weights): 처음에는 무작위로 설정된 가중치가 데이터 학습을 통해 조정됩니다. 예를 들어, '안녕' 뒤에 '하세요'가 자주 오는 패턴을 학습해 문장을 완성합니다.
  • 한계점: 학습된 데이터 이후의 정보는 반영되지 않으며, 최신 데이터를 실시간으로 업데이트하기 어렵습니다.

RAG(Retrieval-Augmented Generation, 검색 증강 생성)

RAG는 기존 언어 모델외부 데이터베이스 검색을 결합한 방식으로, 최신 정보를 제공하고 오류(환각) 발생을 줄입니다.

  • 작동 원리:
    1. 사용자가 질문을 하면, 외부 데이터베이스에서 관련 문서를 검색.
    2. 검색된 정보를 바탕으로 언어 모델이 응답 생성.
  • 예시 서비스:
    • Microsoft Bing Chat: 실시간 웹 검색 기반 응답.
    • Perplexity AI: 외부 문서 검색을 통한 정확한 답변 생성.
    • Humata AI: 논문과 기술 문서의 정보를 요약·분석.

RAG의 데이터 처리와 벡터 DB

RAG를 활용하기 위해서는 벡터 데이터베이스가 필요합니다.

  • 벡터화: 문서나 텍스트를 벡터(숫자 배열)로 변환하여 유사한 의미를 가진 데이터가 가까운 위치에 배치됩니다.
    • 예: '프로젝트 A의 2023 매출 보고서'와 '프로젝트 B의 2023 매출 보고서'는 벡터 공간에서 가까이 위치.
  • 질문 처리: 질문도 벡터로 변환된 후, 벡터 DB에서 관련성 높은 데이터를 찾아 응답 생성에 사용됩니다.

멀티모달 AI와 AI 에이전트

  1. 멀티모달 AI: 텍스트와 이미지 같은 여러 데이터 유형을 동시에 처리하는 기술입니다.
    • 예: NotebookLM은 문서를 기반으로 팟캐스트 형식의 대화를 생성합니다.
  2. AI 에이전트: 목표를 달성하기 위해 자율적으로 학습하고 의사 결정을 수행하는 AI입니다.
    • 예: LangChain, CrewAI는 GPT 기반으로 다양한 업무를 수행할 수 있는 프레임워크입니다.
    • 미래 전망: Siri나 Bixby와 같은 가상 비서가 여행 계획부터 결제까지 모두 처리하는 시대가 머지않아 올 가능성이 있습니다.
반응형