# AX Agent 런타임 품질 계획 업데이트: 2026-04-15 18:20 (KST) ## 1. 기준 - 대상 범위: 명령 처리, 권한/훅, plan/run 내구성, 세션/로그 관리 - 문서 목적: AX Agent 런타임 경로의 품질 기준과 마감 조건을 명확히 고정 ## 2. 주요 갭 - Hook 출력의 구조화 계약 적용 범위가 일부 경로에 아직 제한적입니다. - 세션 재개와 이벤트 replay 품질은 시나리오별 편차가 남아 있습니다. - 도구 선택 실패 뒤 재시도 전략의 메시지와 다음 행동이 완전히 표준화되지는 않았습니다. ## 3. 실행 순서 1. Hook 계약 고도화 2. 세션/이벤트 내구성 정리 3. 실패 복구 메시지 표준화 4. 완료 품질 게이트 고정 ## 4. 완료 판정 - 내부 벤치마크 목표 성공률 충족 - 세션 재개/이벤트 재생 오류 0건 - 빌드 경고 0 / 오류 0 유지 ## 5. 점검 스냅샷 - 기준 시점: 2026-04-03 - 계획 대비 현재 수준: 약 92~95% - 테스트 상태: `dotnet test` 374/374 통과 - Hook 계약: 구현 완료 수준 - 세션/이벤트 내구성: 복원/재생 경계 케이스 테스트 반영 - 실패 복구 표준화: unknown-tool/권한/정체 경로 반영 - 완료 품질 게이트: 문서화와 코드 반영 완료 ## 6. 관리 대상 1. 도구 계층: 목록, 별칭 정규화, unknown-tool 복구, 선택 정책 2. 스킬 계층: 로더, frontmatter, 파일 기반 운영, 조건부 활성화 3. 훅/권한: pre/post hook 계약, permission update 반영, ask/auto/deny 일관성 4. 세션/상태: run 복원, 이벤트 replay, 중복 억제, resume 신뢰성 5. 계획/실행: plan 승인/수정 이력, 실행 게이트, 조기 완료 방지 6. MCP/외부도구: 연결, 리소스 조회, 실패 복구, internal 정책 7. 설정/UI 연동: 설정값, 실행 코드, UI 반영 동기화 ## 7. 다음 순서 1. Agentic loop E2E 시나리오를 회귀 테스트로 계속 고정 2. 벤치마크 합격 기준과 증적을 배포 체크리스트에 연결 유지 3. 수치와 상태 문구를 `README.md`, `docs/DEVELOPMENT.md`, 로드맵 문서와 동기화 ## 8. 운영 기준 - 내부 벤치마크와 replay 안정성 테스트는 릴리즈 전 최소 조건으로 유지 - 문서에는 비교·모사 표현보다 AX 기준 완료 조건과 검증 결과만 기록