임베딩·벡터 검색 설정¶

본 챕터는 지식 검색의 핵심인 임베딩 모델·리랭커·벡터 데이터베이스 설정을 다룹니다.

구성 요소¶

지식 검색은 다음 3개 구성요소가 함께 동작합니다.

좌측 메뉴 관리 설정 → 환경 설정 → 검색 / 임베딩을 선택하고 임베딩 모델 탭으로 이동합니다.

+ 모델 추가 클릭
다음 항목 입력
- 모델명
- 프로바이더 (OpenAI / vLLM 등)
- 모델 식별자 (예: text-embedding-3-large, 사내 모델명)
- 차원(Dimension) — 모델이 출력하는 벡터의 차원 수 (예: 1536)
연결 테스트 → 실제 임베딩 호출 성공 확인
저장

차원 변경 시 재임베딩 필요

이미 임베딩한 컬렉션의 차원과 다른 모델로 변경하면 기존 벡터를 사용할 수 없습니다. 컬렉션을 통째로 재임베딩해야 합니다 (시간·비용 발생).

리랭커는 1차 검색 결과(예: 상위 50개)의 순위를 더 정확하게 재조정합니다. 정확도 향상에 효과적이지만 응답 시간이 늘어납니다.

리랭커는 선택사항입니다. 사용 여부와 임계치는 개별 컬렉션 또는 에이전트플로우에서 설정합니다.

기본 지원 엔진은 Qdrant 입니다.

벡터 데이터베이스 탭 → 연결 설정
다음 항목 입력
- 호스트: qdrant.internal.example.com
- 포트: 기본 6333 (HTTP), 6334 (gRPC)
- API 키 (인증 활성화된 경우)
연결 테스트 → 저장

디스크 모니터링

벡터 데이터베이스는 컬렉션이 늘수록 디스크를 빠르게 소비합니다. 시스템 모니터의 디스크 사용률을 주기적으로 확인하고, 임계치 알림을 설정하세요.

임베딩·벡터 검색 관련 문의는 Xgen 솔루션 관리자에게 문의해 주세요.