모델별 time-based compact 기준과 compact 메타 노출을 경량화

- service:model 조합별로 time-based tool_result 정리 기준을 분리해 Claude는 보수적으로, Qwen/vLLM 계열은 빠르게 오래된 결과를 걷어내도록 조정
- compact 메타 카드를 제목과 한 줄 요약 중심으로 단순화해 transcript 운영 노이즈를 축소
- README와 DEVELOPMENT 문서에 2026-04-12 22:19 (KST) 기준 작업 이력 반영
- 검증: dotnet build src/AxCopilot/AxCopilot.csproj -c Release -v minimal -p:OutputPath=bin\verify\ -p:IntermediateOutputPath=obj\verify\ (경고 0, 오류 0)
This commit is contained in:
2026-04-12 21:53:05 +09:00
parent bdd4444deb
commit ef58e93e38
4 changed files with 109 additions and 39 deletions

View File

@@ -631,3 +631,17 @@ owKindCounts를 함께 남겨 %APPDATA%\\AxCopilot\\perf 기준으로 transcript
- 오래된 세션을 다시 이어갈 때 과거 `tool_result` 때문에 첫 요청이 불필요하게 비대해지는 현상이 줄어듭니다.
- compact 직후 transcript에 운영 문구가 한 번 더 끼어드는 노이즈가 줄어듭니다.
## 모델별 time-based 기준 / compact 메타 카드 경량화 (2026-04-12 22:19 KST)
- `claw-code``timeBasedMCConfig`처럼 하나의 고정값 대신, AX도 모델/서비스별로 time-based tool result 정리 기준을 다르게 적용하도록 조정했습니다.
- `src/AxCopilot/Services/Agent/ContextCondenser.cs`
- Claude: `60분 / 최근 5개 유지`
- Gemini, GPT-4: `45분 / 최근 3개 유지`
- DeepSeek: `30분 / 최근 2개 유지`
- Qwen, LLaMA, vLLM 계열: `20분 / 최근 1개 유지`
- 기본값: `30분 / 최근 2개 유지`
- 이렇게 분리해 긴 캐시 TTL과 큰 컨텍스트를 가진 모델은 덜 공격적으로, 로컬/vLLM 계열은 더 빠르게 오래된 `tool_result`를 비우도록 맞췄습니다.
- `src/AxCopilot/Views/ChatWindow.TimelinePresentation.cs`
- compact 메타 카드를 긴 line-by-line 상세 표시 대신 제목 + 짧은 한 줄 설명으로 단순화했습니다.
- `run id`와 내부 경계성 문구를 transcript에 다시 노출하지 않아 compact 메타가 일반 assistant 응답 흐름을 덜 끊게 했습니다.