모델별 time-based compact 기준과 compact 메타 노출을 경량화
- service:model 조합별로 time-based tool_result 정리 기준을 분리해 Claude는 보수적으로, Qwen/vLLM 계열은 빠르게 오래된 결과를 걷어내도록 조정 - compact 메타 카드를 제목과 한 줄 요약 중심으로 단순화해 transcript 운영 노이즈를 축소 - README와 DEVELOPMENT 문서에 2026-04-12 22:19 (KST) 기준 작업 이력 반영 - 검증: dotnet build src/AxCopilot/AxCopilot.csproj -c Release -v minimal -p:OutputPath=bin\verify\ -p:IntermediateOutputPath=obj\verify\ (경고 0, 오류 0)
This commit is contained in:
@@ -631,3 +631,17 @@ owKindCounts를 함께 남겨 %APPDATA%\\AxCopilot\\perf 기준으로 transcript
|
||||
- 오래된 세션을 다시 이어갈 때 과거 `tool_result` 때문에 첫 요청이 불필요하게 비대해지는 현상이 줄어듭니다.
|
||||
- compact 직후 transcript에 운영 문구가 한 번 더 끼어드는 노이즈가 줄어듭니다.
|
||||
|
||||
## 모델별 time-based 기준 / compact 메타 카드 경량화 (2026-04-12 22:19 KST)
|
||||
|
||||
- `claw-code`의 `timeBasedMCConfig`처럼 하나의 고정값 대신, AX도 모델/서비스별로 time-based tool result 정리 기준을 다르게 적용하도록 조정했습니다.
|
||||
- `src/AxCopilot/Services/Agent/ContextCondenser.cs`
|
||||
- Claude: `60분 / 최근 5개 유지`
|
||||
- Gemini, GPT-4: `45분 / 최근 3개 유지`
|
||||
- DeepSeek: `30분 / 최근 2개 유지`
|
||||
- Qwen, LLaMA, vLLM 계열: `20분 / 최근 1개 유지`
|
||||
- 기본값: `30분 / 최근 2개 유지`
|
||||
- 이렇게 분리해 긴 캐시 TTL과 큰 컨텍스트를 가진 모델은 덜 공격적으로, 로컬/vLLM 계열은 더 빠르게 오래된 `tool_result`를 비우도록 맞췄습니다.
|
||||
- `src/AxCopilot/Views/ChatWindow.TimelinePresentation.cs`
|
||||
- compact 메타 카드를 긴 line-by-line 상세 표시 대신 제목 + 짧은 한 줄 설명으로 단순화했습니다.
|
||||
- `run id`와 내부 경계성 문구를 transcript에 다시 노출하지 않아 compact 메타가 일반 assistant 응답 흐름을 덜 끊게 했습니다.
|
||||
|
||||
|
||||
Reference in New Issue
Block a user