토큰 예산 관리 — 롤링 윈도우 & 센서 구조화 주입
01 · 구조화 주입
센서 구조화 컨텍스트 주입
18개 센서이 각자의 상태값을 독립 프래그먼트로 관리 — 필요한 정보만 프롬프트에 병합
1
센서 순차 실행
18개 센서를 Priority 100~260 순으로 실행하며, 각 센서는 상태가 유의미할 때만 프래그먼트를 생성합니다
Priority 100 → 260
2
프래그먼트 병합
활성화된 센서의 프래그먼트만 Plugin Orchestrator가 최종 프롬프트에 병합합니다
Plugin Orchestrator 병합
3
Mismatch 자동 교정
AI 응답이 센서 상태값과 불일치 시 최대 3회 재생성합니다
불일치 → 최대 3회 재생성02 · 대화 이력 관리
롤링 윈도우 — 최근 3~5턴
누적 100턴 대화 시 전체 이력 전송 방식 vs 롤링 윈도우 방식의 토큰 구성 비교
전체 이력 전송 (롤링 없음)
합계: ~8,500 토큰
대화 누적 시 선형 증가
DNM: 롤링 윈도우 3~5턴
합계: ~1,000 토큰
대화 100턴 이후도 일정 유지
롤링 윈도우란?
전체 대화 이력 대신 최근 3~5턴만 주입합니다. 일반 턴은 5턴, continue 요청 시 3턴으로 조정됩니다. 대화가 아무리 길어져도 프롬프트 토큰이 일정 수준으로 유지되어 비용 폭증을 방지합니다.
전체 대화 이력 대신 최근 3~5턴만 주입합니다. 일반 턴은 5턴, continue 요청 시 3턴으로 조정됩니다. 대화가 아무리 길어져도 프롬프트 토큰이 일정 수준으로 유지되어 비용 폭증을 방지합니다.
03 · 절감 효과
비용 절감 효과 요약
동일 API 예산으로 처리 가능한 대화량이 증가합니다
~88%
장기 대화
이력 토큰 절감
이력 토큰 절감
3~5턴
롤링 윈도우
주입 크기
주입 크기
18개
구조화 상태
관리 센서
관리 센서
최대 3회
Mismatch
자동 교정
자동 교정
롤링 윈도우는 장기 대화에서 토큰 폭증을 방지하는 핵심 구조입니다. 센서 상태값은 대화 이력 없이도 캐릭터 설정을 일관되게 유지합니다.