같은 모델인데, '얼마나 생각할지'를 내가 정한다고요?
Claude를 쓰다 보면 이런 답답함 느껴본 적 있으시죠? 간단한 질문엔 너무 오래 뜸을 들이고, 정작 어려운 문제엔 좀 더 깊게 파줬으면 싶은 순간이요. 본인도 그래서 매번 "더 깊게 생각해줘"를 프롬프트에 붙이곤 했어요.
Anthropic이 2026년 5월 28일 공개한 Claude Opus 4.8은 이 문제를 손잡이 하나로 풀었어요. claude.ai와 Cowork의 모델 선택기 옆에 노력(effort) 조절이 새로 생겼거든요. 올리면 더 깊게 생각하고, 내리면 빠르게 답하며 사용 한도를 천천히 써요. Opus 4.8은 기본값이 high고, 더 어려운 작업엔 extra·max를 고를 수 있어요.
가격은 Opus 4.7과 같아요 — 입력 100만 토큰당 5달러, 출력 25달러예요. 그런데 코딩 결함을 표시 없이 넘기는 비율이 Opus 4.7보다 약 4배 줄었어요. 이번 글은 본인이 7가지 작업 유형에 노력 단계를 바꿔 돌려보면서, 언제 max가 본전이고 언제 high로 충분한지 정리한 거예요.

노력 조절이 뭔지부터 — 속도·품질·한도의 저울
노력 조절은 Claude가 답을 내기 전 '얼마나 깊게 오래 생각할지'를 정하는 슬라이더예요. 세 가지가 같이 움직여요. 노력을 올리면 답 품질은 오르지만 속도는 느려지고 한도는 빨리 닳아요. 내리면 그 반대고요.
본인은 이걸 '저울'로 이해했어요. 한쪽엔 품질, 다른 쪽엔 속도와 한도가 있어요. 작업마다 무게 중심이 다르거든요. 깊은 분석이 필요한 일엔 품질 쪽으로 기울이고, 빠른 초안엔 속도 쪽으로 기울이는 거예요.
Opus 4.8은 기본값이 high라, 아무것도 안 건드려도 꽤 깊게 생각해요. extra와 max는 그 위에 있는 추가 단계예요. 본인 노하우 — 대부분의 일상 작업은 기본 high로 끝나요. 슬라이더를 만질 일은 '평소보다 훨씬 어려운 일'이나 '품질보다 속도가 급한 일'일 때예요.
여기서 헷갈리기 쉬운 게 하나 있어요. 노력 조절은 '모델을 바꾸는' 게 아니에요. 같은 Opus 4.8이 얼마나 오래 생각하느냐만 바뀌는 거예요. 본인은 처음에 "노력을 올리면 더 똑똑한 모델로 갈아타는 건가?" 했는데, 아니에요. 모델은 그대로고 사고 시간만 늘어나요. 마치 같은 사람에게 "5분만 생각해줘"와 "한 시간 푹 고민해줘"를 부탁하는 차이예요. 사람은 그대로지만 답의 깊이가 달라지죠.
그래서 노력을 올린다고 없던 능력이 생기는 건 아니에요. Opus 4.8이 애초에 못 푸는 문제는 max로 올려도 못 풀어요. 노력 조절이 빛나는 건 '시간을 더 들이면 더 잘 풀 수 있는' 문제예요. 추론 단계가 길고, 검토할 경우의 수가 많은 작업이요. 이 구분을 알아야 슬라이더를 헛되이 올리지 않아요.
max가 본전인 작업 — 틀리면 비싼 일
본인 실측으로 max가 확실히 본전인 건 '한 번에 끝내야 하고 틀리면 다시 푸는 비용이 큰' 작업이에요. 일곱 가지 중 세 가지가 여기 들어가요.
첫째, 복잡한 리팩터링이에요. 여러 파일이 얽힌 구조를 바꿀 때 max로 돌리면 의존 관계를 더 꼼꼼히 따져요. 둘째, 여러 파일에 걸친 버그 추적이에요. 증상은 한 곳인데 원인은 다른 데 있는 경우, 깊은 추론이 답을 찾아줘요. 셋째, 긴 법률·계약 문서 분석이에요. 조항 사이의 모순을 잡아내야 하니 사고 깊이가 결과를 좌우해요.
본인 노하우 — 기준은 단순해요. "이걸 사람이 검수하는 데 30분 넘게 걸릴 작업인가?"예요. 그렇다면 max가 아깝지 않아요. 어차피 답이 어긋나면 다시 푸는 데 그보다 더 큰 시간이 드니까요. Opus 4.8은 코딩 오류 방치율이 4배 줄어서, max로 돌린 리팩터링은 표시 없이 넘어가는 실수가 확 줄었어요.
이 '4배'라는 수치가 실무에서 어떤 의미냐면, 본인 체감으로는 '리뷰 부담'이 줄어든다는 거예요. 예전엔 AI가 짠 코드를 받으면 "어디 조용히 망가진 데 없나" 하고 한 줄 한 줄 의심하며 봤어요. Opus 4.8로 max를 돌리면 그 의심의 강도가 낮아져요. 물론 검수를 안 해도 된다는 건 아니에요. 다만 '발견되지 않은 결함'이 줄어드니, 같은 시간을 들여도 더 안심하고 넘어갈 수 있어요.
본인 노하우 한 가지 더 — max로 돌릴 땐 프롬프트도 그에 맞게 자세히 써요. 노력을 최대로 올려놓고 "대충 고쳐줘" 식으로 던지면 깊은 사고가 엉뚱한 데 쓰여요. 어려운 작업일수록 요구사항·제약·기대 결과를 또박또박 적어주면, max의 사고력이 제대로 된 방향으로 흘러가요. 좋은 손잡이도 어디로 갈지 알려줘야 제값을 해요.
high로 충분한 작업 — 일상의 대부분
반대로 일곱 가지 중 나머지는 기본 high로 충분했어요. 단순 요약, 번역, 짧은 코드 스니펫, 일반 질의응답 같은 거요. 이런 작업에 max를 쓰면 답 품질 차이는 거의 없는데 속도만 느려지고 한도만 빨리 닳아요.
본인 체감 — 처음엔 '좋은 게 좋은 거지' 하고 다 max로 돌렸는데, 한도가 평소보다 빨리 바닥났어요. 그래서 거꾸로 갔어요. high로 먼저 답을 받고, 검증해보니 빈틈이 있을 때만 단계를 올리는 식으로요. 이렇게 바꾸니 같은 한도로 훨씬 많은 작업을 처리하게 됐어요.

본인 실측으로 한 가지 더 확인한 게 있어요. high에서 답이 미묘하게 빈 것 같을 때, 같은 질문을 max로 다시 던지면 답이 '더 길어지는' 게 아니라 '더 촘촘해져요'. 빠뜨렸던 엣지 케이스를 짚거나, 근거를 한 단계 더 파고들거나, 모순을 먼저 발견해 정리하는 식이에요. 단순히 말이 많아지는 게 아니라 사고의 빈틈이 메워지는 느낌이에요. 그래서 max가 필요한지 아닌지는 '답의 길이'가 아니라 '내가 검증했을 때 빈틈이 있었나'로 판단해야 해요.
여기서 Opus 4.7의 Fast 모드를 기억하는 분이라면, 노력 조절이 그 연장선임을 느낄 거예요. 속도와 품질을 직접 고르는 흐름이 더 세분화된 거죠. Opus 4.7 Fast 모드 활용법을 봤다면 이번 노력 슬라이더가 더 직관적으로 다가올 거예요.
노력을 일부러 낮추는 작업 — 속도가 품질을 이길 때
세 번째 패턴은 '일부러 노력을 내리는' 경우예요. 브레인스토밍, 초안 잡기, 빠른 변환 같은 작업이요. 본인은 이런 일엔 슬라이더를 아래로 내려요.
이유는 명확해요. 어차피 초안은 다듬을 거고, 빠르게 여러 번 돌리는 게 한 번 깊게 생각하는 것보다 나으니까요. 본인 노하우 — 아이디어 10개를 빠르게 뽑고 그중 2개를 고른 뒤, 그 2개만 high·max로 다시 깊게 파는 2단계 방식이 효율이 좋았어요.
한도가 빠듯한 날에도 노력을 낮춰요. 같은 한도로 더 많은 작업을 처리할 수 있거든요.
본인이 정착한 하루 운영법을 정리하면 이래요. 아침에 머리가 맑을 때 max가 필요한 무거운 작업(설계·리팩터링)을 먼저 처리하고, 한도가 한참 남은 오전에 끝내요. 오후엔 high로 일상 작업을 돌리고, 한도가 빠듯해지는 저녁엔 노력을 낮춰 초안·정리 같은 가벼운 일을 처리해요. 이렇게 '무거운 일은 한도가 넉넉할 때, 가벼운 일은 한도가 빠듯할 때'로 배치하니, 정작 중요한 작업에서 한도가 막히는 일이 사라졌어요.
Dynamic Workflows라는 기능도 같이 알아두면 좋아요. Opus 4.8과 함께 리서치 프리뷰로 나온 건데, Claude Code가 수백 개의 병렬 서브에이전트를 돌려 아주 큰 작업을 나눠 처리해요. 노력 조절이 '한 작업의 사고 깊이'를 다룬다면, Dynamic Workflows는 '여러 작업을 동시에 펼치는 규모'를 다뤄요. 결이 다른 두 손잡이라, 큰 코드베이스를 통째로 점검하는 일에는 노력 조절보다 이쪽이 어울려요. 긴 작업을 여러 모델에 나눠 맡기는 방법이 궁금하면 AI 에이전트에게 긴 작업 위임하는 가드레일도 같이 보면 좋아요.
노력 조절을 팀·협업에 쓸 때
혼자 쓸 때와 팀에서 쓸 때는 노력 조절을 다루는 법이 좀 달라요. 본인이 팀과 Claude를 같이 쓰며 정리한 기준이 있어요. 팀원마다 "이 작업엔 어느 노력을 쓰는 게 맞나"의 감이 다르거든요. 그래서 작업 유형별로 권장 노력을 간단한 표로 공유했어요. '문서 요약은 high, 코드 리뷰는 max, 초안은 낮게' 같은 식으로요.
본인 체감 — 이 기준을 공유하니 두 가지가 좋아졌어요. 첫째, 신입 팀원이 무작정 다 max로 돌려 한도를 태우는 일이 줄었어요. 둘째, 중요한 작업에 노력을 안 올려 품질이 떨어지는 일도 줄었고요. 노력 조절은 개인 손잡이지만, 팀에선 '언제 어느 단계를 쓸지'에 대한 약속이 있으면 한도와 품질을 같이 지킬 수 있어요.
본인 노하우 — 새 모델이 나오면 기본값도 바뀔 수 있으니, 한 번씩 "지금 내 기본 노력이 뭐지"를 확인하세요. Opus 4.8은 high가 기본이지만, 도구나 버전에 따라 다를 수 있어요. 기본값을 알아야 "이건 평소보다 올려야 하나"를 판단할 수 있거든요.
지금 바로 할 수 있는 것
claude.ai를 쓰고 있다면, 오늘 모델 선택기 옆 노력 슬라이더를 한 번 찾아보세요. 그리고 평소 하던 작업 하나를 골라, high와 max로 각각 돌려 답을 비교해보세요.
본인이 7가지를 돌려보고 내린 결론은 이거예요. 기본 high로 일상의 80%는 끝나고, 틀리면 비싼 일에만 max를 꺼내고, 속도가 급한 초안엔 일부러 노력을 내려요. 모든 작업에 최고 노력을 쓰는 건 한도를 태우는 지름길이에요. 노력 조절은 '더 똑똑한 모델'이 아니라 '같은 모델을 작업마다 알맞게 쓰는' 손잡이예요.
처음 일주일은 의식적으로 슬라이더를 만져보세요. 같은 작업을 high와 max로 번갈아 돌려 답을 비교하다 보면, "아, 이런 일엔 max가 의미 없네", "이런 일엔 high론 부족하네" 하는 감이 몸에 배요. 그 감이 잡히면 그다음부턴 거의 무의식적으로 알맞은 단계를 골라요. 도구를 잘 쓴다는 건 결국 이 감각을 가지는 거예요. 며칠만 의식해서 써보면 한도는 아끼고 품질은 챙기는 자기만의 기준이 생겨요.