'api-cost-optimization' 태그의 글 목록

작업 무게에 따라 Haiku·Sonnet·Opus를 골라 쓰는 Claude 모델 티어 라우팅 비용 설계

모든 AI 요청에 최고 사양 모델을 쓰는 건, 편의점 심부름을 보내면서 택배 화물차를 부르는 것과 같다. 빠르지도 않고, 싸지도 않다. 이 글은 Claude Code를 실제로 운영하면서 모델 세 개를 작업 유형별로 분기했을 때 어떻게 비용이 떨어지고 속도가 올라가는지를 직접 설정한 경험을 바탕으로 정리한다.1. 티어별 실측 무게 차이Mac Mini 클러스터에서 Claude API를 100회 호출해 직접 재봤다. 숫자가 체감을 바꾼다.모델평균 응답 시간상대 비용적합 작업Haiku1.2초1×요약, 번역, 목록 훑기Sonnet3.8초~5×리팩터링, 버그 추적Opus8.4초~15×아키텍처 설계, 보안 감사단순 파일 요약 하나를 Opus에 던지면 포크레인으로 모래 한 삽 뜨는 것과 다를 게 없다. 속도도 느리고,..

Code 활용 2026.05.07

« 2026/06 »

일

월

화

수

목

금

토

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Seunghyeon's lab.

api-cost-optimization 1

티스토리툴바