모든 AI 요청에 최고 사양 모델을 쓰는 건, 편의점 심부름을 보내면서 택배 화물차를 부르는 것과 같다. 빠르지도 않고, 싸지도 않다. 이 글은 Claude Code를 실제로 운영하면서 모델 세 개를 작업 유형별로 분기했을 때 어떻게 비용이 떨어지고 속도가 올라가는지를 직접 설정한 경험을 바탕으로 정리한다.1. 티어별 실측 무게 차이Mac Mini 클러스터에서 Claude API를 100회 호출해 직접 재봤다. 숫자가 체감을 바꾼다.모델평균 응답 시간상대 비용적합 작업Haiku1.2초1×요약, 번역, 목록 훑기Sonnet3.8초~5×리팩터링, 버그 추적Opus8.4초~15×아키텍처 설계, 보안 감사단순 파일 요약 하나를 Opus에 던지면 포크레인으로 모래 한 삽 뜨는 것과 다를 게 없다. 속도도 느리고,..