Files
AX-Copilot-Codex/docs/AX_AGENT_REGRESSION_PROMPTS.md
lacvet e747032501
Some checks failed
Release Gate / gate (push) Has been cancelled
도구·권한·스킬 표현 정교화 1차 반영
- 권한 요청 카탈로그를 bash/powershell/web_fetch/mcp/skill/file_edit/file_write/git/document/filesystem 수준으로 세분화했습니다.

- 도구 결과 카탈로그에 approval_required, partial, follow-up hint, attention 메타를 추가해 후속 renderer 고도화 기반을 마련했습니다.

- 스킬 갤러리에 모델, 추론 강도, 실행 컨텍스트, 에이전트, 모델 호출 비활성화, 추천 상황을 표시하도록 확장했습니다.

- README, DEVELOPMENT, parity plan, regression prompts 문서를 2026-04-06 11:52 (KST) 기준으로 갱신했습니다.

- 검증: dotnet build src/AxCopilot/AxCopilot.csproj -c Release -v minimal -p:OutputPath=bin\\verify\\ -p:IntermediateOutputPath=obj\\verify\\ (경고 0 / 오류 0)
2026-04-06 12:57:15 +09:00

4.4 KiB

AX Agent Regression Prompts

업데이트: 2026-04-06 09:58 (KST)

claw-code와 AX Agent를 같은 기준으로 비교하기 위한 공통 회귀 프롬프트 세트입니다.

사용 규칙

  • 런타임 동작, transcript 렌더, 권한/계획/질문 UX, queue/compact/reopen 흐름에 영향을 주는 변경 뒤에는 이 문서를 기준으로 최소 1회 점검합니다.
  • 모든 항목을 매번 수동 실행할 필요는 없지만, 관련 축이 바뀌었으면 해당 묶음은 반드시 확인합니다.
  • 결과는 “문장이 똑같은가”가 아니라 “실행 경로와 사용자 체감 결과가 같은가”를 봅니다.

실패 분류

  • blank-reply: 토큰은 소비됐는데 본문이 비어 있거나 assistant 카드가 비어 있음
  • duplicate-banner: 같은 실행 이벤트가 transcript에 중복 표시됨
  • bad-approval-flow: 권한/계획/질문 요청이 inline으로 안 닫히고 popup 의존이 커짐
  • queue-drift: 후속 요청, retry, regenerate가 다른 실행 경로를 타거나 순서가 어긋남
  • restore-drift: reopen 후 상태선, queue, 최신 메시지 상태가 달라짐
  • status-noise: Cowork/Code 기본 상태선이 과하게 흔들리거나 debug 정보가 과노출됨

Chat

  1. 기본 응답
  • 프롬프트: 회의 일정 조정 메일을 정중한 한국어로 써줘
  • 확인:
    • blank-reply
    • restore-drift
  1. 장문 설명
  • 프롬프트: RAG와 fine-tuning 차이를 실무 관점으로 7가지로 설명해줘
  • 확인:
    • 장문 렌더 안정성
    • compact 이후 다음 턴 문맥 유지
    • blank-reply

Cowork

  1. 문서형 작업
  • 프롬프트: 신규 ERP 도입 제안서 초안을 작성해줘. 목적, 범위, 기대효과, 추진일정 포함
  • 확인:
    • 작업 유형 반영
    • 계획 이후 실제 문서형 결과 흐름
    • 기본 로그 과노출 없음
    • bad-approval-flow
  1. 데이터형 작업
  • 프롬프트: 매출 CSV를 분석해서 월별 추세와 이상치를 요약해줘
  • 확인:
    • 데이터 분석 도구 선택
    • 결과 요약 일관성
    • runtime 노이즈 최소화
    • status-noise

Code

  1. 버그 수정
  • 프롬프트: 현재 프로젝트에서 설정 저장 버그 원인 찾고 수정해줘
  • 확인:
    • 읽기/검색/수정 흐름 일관성
    • diff/저장/재오픈 시 transcript 보존
    • restore-drift
  1. 빌드/테스트
  • 프롬프트: 빌드 오류를 재현하고 수정한 뒤 다시 빌드해줘
  • 확인:
    • build/test 루프
    • 실패 후 재시도
    • 완료 메시지 일관성
    • queue-drift

Cross-tab

  1. 후속 요청
  • 프롬프트 순서:
    • 이 창 레이아웃 문제 원인 찾아줘
    • 끝나면 README도 같이 갱신해줘
  • 확인:
    • queue chaining
    • 입력창 직접 변경 없이 다음 턴 실행
    • queue-drift
  1. compact 이후 연속성
  • 프롬프트: 지금까지 논의한 내용을 5줄로 이어서 정리하고 다음 작업 제안해줘
  • 확인:
    • token-only completion 없음
    • compact 후 문맥 유지
    • queue-drift
  1. 권한 승인
  • 프롬프트: 이 파일을 수정해서 저장해줘
  • 확인:
    • 권한 요청 transcript 표시
    • 승인/거부 결과 일관성
    • bad-approval-flow
  1. slash / skill
  • 프롬프트: /bug-hunt src 폴더 잠재 버그 찾아줘
  • 확인:
    • slash 진입과 일반 send 경로 동일성
    • skill 실행 이유/결과 표기
    • queue-drift

개발 루틴 고정

  • transcript, permission, tool-result, queue, compact, reopen에 영향을 주는 변경은 커밋 전 아래를 기준으로 셀프 체크합니다.
    • Chat 변경: 1, 2, 8
    • Cowork 변경: 3, 4, 7, 8
    • Code 변경: 5, 6, 7, 9, 10
  • 체크 후 문서 이력에는 “어떤 묶음을 확인했는지”를 간단히 남깁니다.

Tool / Permission Follow-up

  1. 권한 거부 후 재시도
  • 프롬프트 순서:
    • src 폴더에서 설정 파일을 수정해줘
    • 첫 권한 요청은 거부
    • 같은 작업을 다시 요청
  • 확인:
    • rejectapproval_required가 같은 결과 카드처럼 보이지 않음
    • 재시도 시 권한 메시지와 도구 결과가 중복되지 않음
    • bad-approval-flow
  1. 부분 성공 / 후속 안내
  • 프롬프트: 여러 문서 파일을 한 번에 읽고 요약해줘
  • 확인:
    • 일부 실패가 있으면 partial 계열 안내가 보이는지
    • 후속 안내 문구가 단순 실패와 다르게 보이는지
    • status-noise