Langchain with OpenAI, weaviate, RAG

728x90

1. RAG 를 동작단계, 문의사항이 prompt 기반에 바로 LLM 모델로 흘러가는 것이 아니라 아래 그램처럼

Retrieve 단계를 걸쳐, Augment 된 내역을 기반으로 Generate 됨 > 줄여서 RAG

(궁극적인 목표는 문의내역을 LLM 모델이 잘 인식할 수 있도록 변환해 주는 역할! by reducing hallucinations)

2. 궁극적으로 Retrieve 을 어떻게 만드냐에 따라 결과는 달라질 수 있음

- 외부 소스로 부터 질문에 대한 컨텍스르를 검색하고, 임베딩 모델을 이용하여 추가 컨텍스트가 저장된

Vector DB에 저장. 유사도 검색을 통해 Vector DB(weaviate 등) 에서 가장 유사한 상위 n개의 Data 를 반환

- 개발자는 가장 유사도가 깊은 내용을 기반으로 Prompt를 작성, 이를 LLM 모델을 통해 답변도출이 가능하다.

3. Weaviate 사용 관련(다음 블로그에 상세설명예정)

Weaviate Cloud

console.weaviate.cloud

728x90

김빌의 기술 블로그 Bill Kim