효율적으로 쓰는 사람과 금방 막히는 사람의 차이
Claude Code를 사용하다 보면 생각보다 빨리 토큰 제한에 도달하는 순간을 경험하게 된다. 특히 Pro 플랜을 사용하는 경우 체감 속도가 더 빠르고, 요즘은 Max 플랜도 금방 다 썼다고 하는 커뮤니티 글들이 많이 보인다.
이 글에서는 실제로 사용하면서 효과가 있었던 토큰 절약 방법과 운영 전략을 정리했다. 불필요한 설명은 줄이고, 바로 써먹을 수 있는 기준 중심으로 정리했다.
1. 프롬프트 설계만으로도 토큰은 크게 줄어든다
토큰 사용량은 모델이 “얼마나 많은 것을 생성하느냐”에 따라 결정된다.
즉, 출력 범위를 어떻게 제한하느냐가 핵심이다.
❌ 범위가 없는 요청
이렇게 요청하면 모델은 다음을 포함하려는 경향이 있다.
- HTML / CSS / JS 분리 구조
- 추가적인 기능 (애니메이션, 반응형 등)
- 배포 가이드, 테스트 코드
- 불필요한 설명
결과적으로 토큰을 많이 사용하게 된다.
✅ 범위를 명확히 제한한 요청
- 단일 HTML 파일로 작성
- 이름, 소개, SNS 링크만 포함
- 외부 라이브러리 사용하지 않기
- 배포, 테스트, 최적화 내용 제외
- 300줄 이하로 작성
이렇게 요청하면 결과가 달라진다.
- 출력 범위가 줄어든다
- 코드 구조가 단순해진다
- 불필요한 설명이 제거된다
핵심 원칙
프롬프트에서 반드시 아래 요소를 명시해야 한다.
- 범위: “간단한”, “최소 기능”
- 구조: “단일 파일”, “한 페이지”
- 제외 조건: “배포/테스트 제외”
- 제한 조건: “~줄 이하”
이 네 가지만 잘 잡아도 토큰 사용량은 눈에 띄게 줄어든다.
2. 모델을 상황에 맞게 선택해야 한다
Claude Code는 모델에 따라 성능과 비용이 다르다.
모든 작업을 고성능 모델로 처리하는 것은 비효율적이다.
Haiku 모델이 적합한 경우
- 간단한 기능 구현
- 코드 수정 및 디버깅
- 기본 개념 학습
- 반복적인 실습 작업
Sonnet 모델이 적합한 경우
- 복잡한 구조 설계
- 품질이 중요한 결과물
- 긴 컨텍스트를 사용하는 작업
실전 전략
- 평소에는 가벼운 모델을 기본으로 사용한다
- 필요한 순간에만 상위 모델로 전환한다
이 방식이 가장 효율적이다.
특히 학습 단계에서는 Haiku만으로도 충분한 경우가 많다.
속도와 토큰 사용량 모두에서 이점이 있다.
3. 컨텍스트 관리가 토큰 관리의 핵심이다
Claude Code는 단순히 “질문 → 답변” 구조가 아니다.
이전 대화와 파일들이 계속 쌓이면서 컨텍스트를 구성한다.
이 컨텍스트가 커질수록 토큰 사용량도 증가한다.
/context — 현재 상태 확인
현재 세션에 어떤 파일과 내용이 포함되어 있는지 확인할 수 있다.
언제 사용하면 좋은가
- 예상보다 응답이 느릴 때
- 불필요한 파일이 포함된 것 같을 때
- 작업 범위를 점검할 때
/clear — 불필요한 컨텍스트 제거
쌓여 있는 컨텍스트를 초기화한다.
언제 사용하면 좋은가
- 작업 주제가 완전히 바뀌었을 때
- 이전 코드/파일이 더 이상 필요 없을 때
- 토큰 사용량을 리셋하고 싶을 때
주의할 점
- 현재 작업 중인 정보도 함께 사라진다
- 필요한 내용은 미리 복사해 두는 것이 좋다
/compact — 컨텍스트 압축
전체를 삭제하지 않고, 핵심만 남기고 정리한다.
언제 사용하면 좋은가
- 작업을 이어가야 하지만 컨텍스트가 너무 클 때
- 긴 대화를 유지하면서 토큰을 줄이고 싶을 때
세 가지 명령어의 역할 정리
- /context → 현재 상태 확인
- /clear → 완전 초기화
- /compact → 필요한 것만 남기고 정리
이 세 가지를 상황에 맞게 쓰는 것이 핵심이다.
4. 실제로 효과 있는 운영 패턴
토큰을 아끼는 것은 단순한 기능 사용이 아니라 “작업 방식”의 문제다.
다음 패턴을 적용하면 체감이 확실히 달라진다.
1) 작업 단위를 쪼개서 요청한다
한 번에 많은 것을 요청하면 토큰이 급격히 증가한다.
- ❌ 전체 서비스 만들어줘
- ✅ 로그인 기능만 먼저 구현해줘
작게 나누는 것이 효율적이다.
2) 출력 형식을 제한한다
- 코드만 출력
- 설명 제외
- 특정 형식(JSON, 표 등)으로만 출력
이런 조건을 추가하면 토큰 사용량이 줄어든다.
3) 필요 없는 설명은 제거한다
이 한 줄로도 토큰을 크게 줄일 수 있다.
4) 반복 작업은 패턴화 한다
비슷한 요청을 계속할 경우
프롬프트를 템플릿으로 만들어두는 것이 좋다.
마무리
Claude Code에서 토큰은 단순한 사용량 문제가 아니라
작업 효율과 직결되는 자원이다.
핵심은 세 가지다.
- 프롬프트로 범위를 제한한다
- 모델을 상황에 맞게 선택한다
- 컨텍스트를 지속적으로 관리한다
이 세 가지만 제대로 운영해도
같은 시간 동안 더 많은 작업을 처리할 수 있다.
결국 중요한 것은 도구가 아니라 사용하는 방식이다.
'Claude Code' 카테고리의 다른 글
| 클로드 코드로 가상 사용자 A/B 테스트 Skill 만들기 (0) | 2026.03.20 |
|---|---|
| 기획자가 바로 써먹는 Claude Code Skill 10개 (0) | 2026.03.13 |
| Claude Code에서 말하는 ‘스킬(Skill)’이란 (0) | 2026.03.12 |