Seunghyeon's lab.

  • 홈
  • 태그
  • 방명록
  • 글

api-cost-optimization 1

작업 무게에 따라 Haiku·Sonnet·Opus를 골라 쓰는 Claude 모델 티어 라우팅 비용 설계

모든 AI 요청에 최고 사양 모델을 쓰는 건, 편의점 심부름을 보내면서 택배 화물차를 부르는 것과 같다. 빠르지도 않고, 싸지도 않다. 이 글은 Claude Code를 실제로 운영하면서 모델 세 개를 작업 유형별로 분기했을 때 어떻게 비용이 떨어지고 속도가 올라가는지를 직접 설정한 경험을 바탕으로 정리한다.1. 티어별 실측 무게 차이Mac Mini 클러스터에서 Claude API를 100회 호출해 직접 재봤다. 숫자가 체감을 바꾼다.모델평균 응답 시간상대 비용적합 작업Haiku1.2초1×요약, 번역, 목록 훑기Sonnet3.8초~5×리팩터링, 버그 추적Opus8.4초~15×아키텍처 설계, 보안 감사단순 파일 요약 하나를 Opus에 던지면 포크레인으로 모래 한 삽 뜨는 것과 다를 게 없다. 속도도 느리고,..

Code 활용 2026.05.07
이전
1
다음
더보기
프로필사진

Seunghyeon's lab.

Claude Code와 바이브코딩의 입문·활용·실전·인사이트를 기록합니다.

  • 분류 전체보기 (124) N
    • Code 입문 (32) N
    • Code 활용 (7)
    • Code 실전 (22) N
    • Code 빌드 (1)
    • AI 인사이트 (40) N
    • AI 건축 (0)
    • AI 마켓노트 (4)

Tag

Claude.md, claudecode, only, Anthropic, AI 도구, 보안, Claude-Code, n8n, 셀프호스팅, Mac-Mini, Blog, Code Intro, Plugin, 자동화, 개발생산성, ai 코딩, AI자동화, claude code, AI 자동화, Claude Code 입문,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바