콘텐츠로 이동

가드레일 모델 설정

본 챕터는 외부 Guard 모델(예: Qwen3Guard-Gen vLLM) 호출 설정을 다룹니다. PII·금칙어 등 정책 자체는 PII 보호 정책 챕터의 AI 통제 정책 화면에서 관리하며, 본 챕터는 그 정책을 평가·실행하는 모델 엔드포인트 만 다룹니다.

화면 진입

좌측 메뉴 관리 설정 → 환경 설정 → 가드레일 을 선택합니다.

가드레일 — '현재 활성 제공자' 영역과 사용 가능한 가드 제공자(사용 안 함 / VLLM Server) 카드. 우상단 설정 초기화·연결 테스트 버튼

화면은 두 영역으로 구성됩니다.

영역 표시 항목
상단 — 현재 활성 제공자 현재 어떤 가드 제공자를 사용 중인지 + 연결 상태 (✓ 연결됨 / ✕ 연결 불가). 우측에 설정 초기화 · 연결 테스트 버튼
본문 — 사용 가능한 가드 제공자 선택 가능한 카드 목록. 카드를 클릭해 활성 제공자를 변경

가드 제공자 옵션

제공자 설명 연결 정보
사용 안 함 가드 모델을 호출하지 않음 — 정책 매칭은 정규식 기반으로만 동작 없음
VLLM Server 외부 vLLM 서버(OpenAI Chat Completions 호환 API) 호출 — 예: Qwen3Guard-Gen 엔드포인트 URL, API 키, 모델 이름 (선택 시 입력 영역 노출)

기본값은 사용 안 함 입니다.

VLLM Server 활성화 절차

  1. VLLM Server 카드 클릭 → 입력 영역이 노출됩니다.
  2. 다음 항목 입력
    • 엔드포인트 URL: 예 https://guard.internal.example.com/v1
    • 모델 이름: 예 Qwen3Guard-Gen
    • API 키: 인증 토큰 (선택사항이지만 운영 환경에서는 권장)
    • 타임아웃 / 최대 토큰 등 호출 파라미터 (옵션)
  3. 우상단 연결 테스트 — 200 OK 응답이 오면 연결 성공.
  4. 설정 저장 — 카드의 상태가 사용 중 으로 표시되며 상단 "현재 활성 제공자" 도 갱신됩니다.

설정 수정 후 반드시 초기화 필요

화면 상단 노란색 배너 "설정 수정 후 반드시 초기화가 필요합니다" 는 가드 호출 파이프라인 캐시 무효화를 의미합니다. 새 엔드포인트로 변경 후에는 설정 초기화 버튼을 한 번 더 눌러 캐시를 비우세요. 비우지 않으면 변경 직전 모델로 일정 시간 라우팅될 수 있습니다.

가드 모델이 비활성일 때의 동작

  • "사용 안 함" 상태에서는 본문 하단에 안내가 노출됩니다 — "가드 모델이 비활성화되어 있습니다. 'VLLM Server' 를 선택하면 외부 가드 엔드포인트 호출 설정이 표시됩니다."
  • 이 상태에서도 PII 보호 정책 의 정규식 기반 탐지·마스킹은 정상 동작합니다.
  • 다만 정규식으로 잡기 어려운 미묘한 PII(예: 자연어로 풀어 쓴 주소), 의미 기반 금칙(예: 의도된 비방·차별 표현)은 가드 모델 없이는 탐지가 어렵습니다. 규제 산업에서는 VLLM Server 활성화를 권장합니다.

운영 권장사항

  • 엔드포인트는 내부망 우선 — Guard 모델 호출은 사용자 입력·LLM 응답을 모두 거쳐가므로 외부 노출 엔드포인트를 사용하지 않습니다.
  • 타임아웃은 짧게 — Guard 모델이 응답 지연되면 사용자 체감 응답 시간이 길어집니다. 권장 1초 이내.
  • 연결 실패 시 정책 적용 방식 — Guard 호출 실패 시 "허용(통과)" vs "차단" 정책을 명시적으로 설정. 금융권 권장: 차단 (실패 시 안전 측 동작).
  • 분기별 모델 평가 — Guard 모델 자체의 정확도(False Positive/Negative)를 분기 1회 점검하고 필요 시 교체.

관련 챕터

  • PII 보호 정책 — 정규식 기반 PII/금칙어 정책 정의 (Guard 모델과 별개로 항상 동작)
  • LLM 설정 — 생성 LLM 프로바이더 등록 (Guard 모델과 분리됨)

문의

가드레일 모델 설정 관련 문의는 Xgen 솔루션 관리자에게 문의해 주세요.