가드레일 모델 설정¶
본 챕터는 외부 Guard 모델(예: Qwen3Guard-Gen vLLM) 호출 설정을 다룹니다. PII·금칙어 등 정책 자체는 PII 보호 정책 챕터의 AI 통제 정책 화면에서 관리하며, 본 챕터는 그 정책을 평가·실행하는 모델 엔드포인트 만 다룹니다.
화면 진입¶
좌측 메뉴 관리 설정 → 환경 설정 → 가드레일 을 선택합니다.
화면은 두 영역으로 구성됩니다.
| 영역 | 표시 항목 |
|---|---|
| 상단 — 현재 활성 제공자 | 현재 어떤 가드 제공자를 사용 중인지 + 연결 상태 (✓ 연결됨 / ✕ 연결 불가). 우측에 설정 초기화 · 연결 테스트 버튼 |
| 본문 — 사용 가능한 가드 제공자 | 선택 가능한 카드 목록. 카드를 클릭해 활성 제공자를 변경 |
가드 제공자 옵션¶
| 제공자 | 설명 | 연결 정보 |
|---|---|---|
| 사용 안 함 | 가드 모델을 호출하지 않음 — 정책 매칭은 정규식 기반으로만 동작 | 없음 |
| VLLM Server | 외부 vLLM 서버(OpenAI Chat Completions 호환 API) 호출 — 예: Qwen3Guard-Gen | 엔드포인트 URL, API 키, 모델 이름 (선택 시 입력 영역 노출) |
기본값은 사용 안 함 입니다.
VLLM Server 활성화 절차¶
- VLLM Server 카드 클릭 → 입력 영역이 노출됩니다.
- 다음 항목 입력
- 엔드포인트 URL: 예
https://guard.internal.example.com/v1 - 모델 이름: 예
Qwen3Guard-Gen - API 키: 인증 토큰 (선택사항이지만 운영 환경에서는 권장)
- 타임아웃 / 최대 토큰 등 호출 파라미터 (옵션)
- 엔드포인트 URL: 예
- 우상단 연결 테스트 — 200 OK 응답이 오면 연결 성공.
- 설정 저장 — 카드의 상태가
사용 중으로 표시되며 상단 "현재 활성 제공자" 도 갱신됩니다.
설정 수정 후 반드시 초기화 필요
화면 상단 노란색 배너 "설정 수정 후 반드시 초기화가 필요합니다" 는 가드 호출 파이프라인 캐시 무효화를 의미합니다. 새 엔드포인트로 변경 후에는 설정 초기화 버튼을 한 번 더 눌러 캐시를 비우세요. 비우지 않으면 변경 직전 모델로 일정 시간 라우팅될 수 있습니다.
가드 모델이 비활성일 때의 동작¶
- "사용 안 함" 상태에서는 본문 하단에 안내가 노출됩니다 — "가드 모델이 비활성화되어 있습니다. 'VLLM Server' 를 선택하면 외부 가드 엔드포인트 호출 설정이 표시됩니다."
- 이 상태에서도 PII 보호 정책 의 정규식 기반 탐지·마스킹은 정상 동작합니다.
- 다만 정규식으로 잡기 어려운 미묘한 PII(예: 자연어로 풀어 쓴 주소), 의미 기반 금칙(예: 의도된 비방·차별 표현)은 가드 모델 없이는 탐지가 어렵습니다. 규제 산업에서는 VLLM Server 활성화를 권장합니다.
운영 권장사항¶
- 엔드포인트는 내부망 우선 — Guard 모델 호출은 사용자 입력·LLM 응답을 모두 거쳐가므로 외부 노출 엔드포인트를 사용하지 않습니다.
- 타임아웃은 짧게 — Guard 모델이 응답 지연되면 사용자 체감 응답 시간이 길어집니다. 권장 1초 이내.
- 연결 실패 시 정책 적용 방식 — Guard 호출 실패 시 "허용(통과)" vs "차단" 정책을 명시적으로 설정. 금융권 권장: 차단 (실패 시 안전 측 동작).
- 분기별 모델 평가 — Guard 모델 자체의 정확도(False Positive/Negative)를 분기 1회 점검하고 필요 시 교체.
관련 챕터¶
문의¶
가드레일 모델 설정 관련 문의는 Xgen 솔루션 관리자에게 문의해 주세요.
