핵심 요약 (3줄)
- Opus 4.8은 5월 28일 출시됐고, 다이내믹 워크플로로 한 세션에 수백 개 서브에이전트를 띄워요.
- 수십만 줄짜리 코드베이스 마이그레이션을 기획부터 머지까지, 기존 테스트로 검증하며 처리해요.
- 패스트 모드가 4.7 대비 3배 싸지고 약 2.5배 빨라져서 대량 병렬 작업 단가가 내려갔어요.
📋 목차
다이내믹 워크플로가 뭔가요
Claude Code를 써본 분이라면 "큰 작업은 결국 사람이 쪼개서 하나씩 시켜야 한다"는 한계를 느꼈을 거예요. Opus 4.8의 다이내믹 워크플로는 그 쪼개기를 모델이 스스로 해요.
작동 방식은 이래요. Claude Code가 작업을 먼저 기획하고, 한 세션 안에서 수백 개의 병렬 서브에이전트를 띄워요. 마치 한 명의 PM이 작업을 잘게 나눠 여러 작업자에게 동시에 던지는 것과 비슷해요. 그리고 그 결과를 다시 모아 기존 테스트 스위트로 검증해요. 킥오프부터 머지까지 한 흐름이에요.
이 기능은 현재 리서치 프리뷰 단계로 Enterprise, Team, Max 플랜에서 제공돼요. 즉 누구나 바로 쓰는 정식 기능은 아니고, 대규모 작업을 다루는 팀을 겨냥한 실험적 도구에 가까워요. 그래도 방향성은 분명해요. AI가 "한 번에 한 파일"에서 "한 번에 코드베이스 전체"로 작업 단위를 키우고 있어요.
수십만 줄 마이그레이션을 한 세션에서
가장 인상적인 사례가 코드베이스 마이그레이션이에요. Anthropic이 강조한 시나리오가 수십만 줄에 걸친 마이그레이션을 한 세션에서 처리하는 거예요.
기존 방식을 떠올려보세요. 레거시 코드를 새 프레임워크로 옮긴다고 하면, 파일을 하나씩 열어 패턴을 바꾸고, 깨진 곳을 찾아 고치고, 테스트를 돌리고, 다시 다음 파일로 넘어가요. 사람이 며칠을 매달려요. 다이내믹 워크플로는 이걸 병렬로 나눠 동시에 진행하고, 마지막에 기존 테스트 스위트로 통과 여부를 확인해요.
핵심은 "검증된 머지"예요. 단순히 코드를 막 바꾸는 게 아니라, 기존 테스트로 검증한 결과를 들고 와요. 그래서 대규모 변경인데도 "돌려보니 깨졌다"는 사고를 줄여요. 1M 컨텍스트를 활용하는 Opus 4.7 1M 컨텍스트 실전 활용법이 "큰 입력을 한 번에 본다"였다면, 다이내믹 워크플로는 "큰 작업을 병렬로 실행한다"로 축이 달라요.

4.8이 4.7보다 올라간 숫자들
벤치마크 숫자도 같이 봐야 감이 와요. 4.7에서 4.8로 넘어가며 올라간 지표를 정리하면 이래요.
| 항목 | Opus 4.7 | Opus 4.8 |
|---|
| SWE-bench Pro (코딩) | 64.3% | 69.2% |
| USAMO 2026 (수학) | 69.3% | 96.7% |
| 자기 코드 결함 놓침 | 기준 | 약 4배 감소 |
| 출시일 | 이전 | 2026-05-28 |
코딩은 SWE-bench Pro에서 64.3점에서 69.2점으로 올랐어요. 한 사이클 만에 5점 가까이 오른 건 작은 폭이 아니에요. 수학은 더 극적이에요. USAMO 2026에서 69.3점에서 96.7점으로, 단일 사이클 최대 점프를 기록했어요.
실무에서 더 와닿는 건 "자기 코드 결함을 놓치는 빈도가 4.7보다 약 4배 낮다"는 부분이에요. AI가 짠 코드를 사람이 다시 다 검토해야 했던 게 가장 큰 비용이었거든요. 자가 검증 신뢰도가 오르면, 다이내믹 워크플로처럼 병렬로 대량 작업을 맡길 때 사람의 리뷰 부담이 줄어요. 두 기능이 서로 맞물려요.
참고로 Artificial Analysis Intelligence Index 기준으로 Opus 4.8은 61.4점으로 현재 최상위예요. GPT-5.5(60.2), Gemini 3.1 Pro(57), Grok 4.3(53)을 근소하게 앞서요.
패스트 모드 3배 인하가 바꾸는 계산
병렬로 수백 개 에이전트를 띄운다고 하면 가장 먼저 떠오르는 걱정이 비용이에요. 여기서 패스트 모드 가격 인하가 결정적이에요.
기본 단가는 4.7과 같아요. 입력 100만 토큰당 5달러, 출력 25달러예요. 달라진 건 패스트 모드예요. 새 패스트 모드는 100만 토큰당 입력 10달러·출력 50달러로, 4.7의 패스트 모드 대비 3배 싸졌어요. 속도는 약 2.5배 빨라요.
이게 왜 중요하냐면, 다이내믹 워크플로처럼 많은 서브에이전트가 동시에 돌 때는 "빠르고 싼 모드"의 가치가 커지거든요. 느리고 비싼 모드로 수백 개를 돌리면 시간도 돈도 감당이 안 돼요. 패스트 모드가 3배 싸지면서, 병렬 대량 작업이 실험에서 실용으로 넘어왔어요. Opus 4.7 패스트 모드 활용 팁을 봤던 분이라면, 4.8에서 단가가 또 한 번 내려갔다는 점을 체크하세요.
제가 실제로 맡겨본 작업
리서치 프리뷰라 제한은 있었지만, 며칠 돌려본 경험을 공유할게요.
1) 컴포넌트 리네이밍 대량 적용. 프로젝트 전반에 흩어진 구식 컴포넌트 이름을 새 규칙으로 바꾸는 작업을 맡겼어요. 사람이 하면 grep으로 찾아 하나씩 고치고 import까지 손봐야 하는데, 병렬로 나눠 처리하고 테스트로 검증해줬어요.
2) 의존성 버전 업그레이드 정리. 여러 패키지의 마이너 버전을 올리며 깨지는 호출부를 동시에 손보는 작업이에요. 병렬 서브에이전트가 파일별로 나눠 들어가니, 단일 스레드로 순차 처리할 때보다 체감 속도가 확실히 빨랐어요.
3) 테스트 커버리지 보강. 비어 있는 테스트를 채우는 작업을 던졌어요. 자가 검증 신뢰도가 올라간 덕에, 생성된 테스트가 헛도는 경우가 4.7 때보다 눈에 띄게 줄었어요.
공통적으로 느낀 건 "작업을 잘게 쪼개 설명하는 수고"가 줄었다는 거예요. 예전엔 제가 PM 역할로 작업을 나눠줬는데, 이제 그 나누기 일부를 모델이 가져갔어요.

왜 병렬 실행이 게임의 규칙을 바꾸나
다이내믹 워크플로의 핵심은 "병렬"이에요. 이게 왜 중요한지 조금 더 풀어볼게요.
지금까지 AI 코딩은 사실상 한 줄로 일했어요. 작업 하나를 끝내야 다음 작업으로 넘어가는 직렬 구조였죠. 사람이 작업을 잘게 쪼개 순서대로 던져주고, 결과를 확인하고, 다음을 던지는 식이에요. 코드베이스가 클수록 이 왕복이 끝없이 늘어났어요. 하루 종일 시켰는데도 진도가 안 나가는 답답함이 여기서 왔어요.
병렬 서브에이전트는 이 구조를 가로로 펼쳐요. 한 작업을 잘게 나눠 동시에 진행하니, 전체 작업 시간이 직렬 대비 크게 줄어요. 마치 한 사람이 책 한 권을 처음부터 끝까지 옮겨 쓰는 것과, 열 사람이 챕터를 나눠 동시에 옮겨 쓰는 것의 차이예요. 작업을 나눌 수만 있다면 병렬이 압도적으로 빨라요.
물론 병렬에는 함정도 있어요. 나눈 작업들이 서로 충돌하거나, 한 부분의 변경이 다른 부분을 깨뜨릴 수 있어요. 그래서 다이내믹 워크플로가 마지막에 기존 테스트 스위트로 검증하는 단계가 중요해요. 나눠서 빠르게 처리하되, 합칠 때 깨지지 않았는지 확인하는 안전장치예요. 여기에 자가 검증 신뢰도까지 4배 올라갔으니, "빠른데 위험한" 병렬의 약점을 어느 정도 보완한 셈이에요.
또 하나 눈여겨볼 건 "사람의 역할 변화"예요. 예전엔 제가 작업을 쪼개는 PM이었다면, 이제는 결과를 검수하는 리뷰어에 가까워졌어요. 무엇을 할지 큰 방향을 정해주고, 모델이 쪼개 실행한 결과를 확인하는 거예요. 일하는 방식 자체가 바뀌니, 익숙해지는 데 며칠은 걸렸어요. 하지만 한번 적응하니 같은 시간에 다루는 작업의 크기가 확연히 커졌어요. Opus 4.8 노력 조절 활용법과 함께 쓰면, 작업별로 추론 깊이까지 조절해 비용과 품질을 더 세밀하게 맞출 수 있어요.
쓰기 전에 알아둘 점
좋은 점만 있는 건 아니에요. 도입 전 체크할 점을 솔직히 적을게요.
- 플랜 제약이 있어요. 다이내믹 워크플로는 Enterprise·Team·Max 전용 리서치 프리뷰예요. 일반 Pro로는 아직 못 써요.
- 병렬은 비용 변동성이 커요. 패스트 모드가 싸졌어도, 수백 개 에이전트를 무분별하게 띄우면 토큰이 빠르게 쌓여요. 작업 범위를 먼저 좁히세요.
- 검증은 결국 테스트에 달려요. 다이내믹 워크플로는 "기존 테스트 스위트"로 검증해요. 테스트가 부실하면 검증도 부실해요. 테스트가 탄탄한 코드베이스에서 진가가 나와요.
- 리서치 프리뷰라 변동 가능. 정식 기능이 아니라서 동작이나 한도가 바뀔 수 있어요. 프로덕션 핵심 작업을 통째로 맡기긴 아직 일러요.
그래도 이건 분명한 전환점이에요. AI 코딩이 "한 파일 도우미"에서 "코드베이스 전체를 다루는 협업자"로 넘어가는 신호예요. 지금은 프리뷰라 제약이 많지만, 이 방향이 안정화되면 대규모 리팩터링이나 마이그레이션 같은 무거운 작업의 진입 장벽이 크게 낮아질 거예요. 그동안 비용과 시간 때문에 미뤄두던 코드 정리를 시도할 여지가 생기는 거죠.
한 가지 더 짚자면, 이런 흐름은 개발자의 일을 줄이기보다 일의 성격을 바꿔요. 단순 반복 작업은 모델이 가져가고, 사람은 설계와 검수, 그리고 무엇을 맡길지 판단하는 데 집중하게 돼요. 그래서 다이내믹 워크플로를 잘 쓰려면 "어떻게 코딩하는가"보다 "어떻게 작업을 정의하고 검증 기준을 세우는가"가 더 중요해져요. 이 감각을 미리 길러두면, 기능이 정식화됐을 때 훨씬 빠르게 올라탈 수 있어요.
지금 당장 해볼 액션
- Enterprise·Team·Max 플랜이라면 Claude Code에서 다이내믹 워크플로를 작은 마이그레이션부터 테스트해보세요.
- 맡기기 전에 기존 테스트 스위트가 충분한지 점검하세요. 검증의 질이 테스트의 질에 달려 있어요.
- 패스트 모드 단가(입력 10달러·출력 50달러)를 기준으로 병렬 작업의 예상 비용을 미리 계산하세요.
- 코딩 비교가 더 궁금하면 GPT-5.5 vs Claude 모델 선택 가이드를 함께 보고 작업 종류별로 모델을 나눠 쓰세요.
큰 작업부터 욕심내지 마세요. 컴포넌트 리네이밍 같은 안전한 대량 작업 하나로 감을 잡은 뒤, 점점 범위를 넓히는 게 안전한 도입 순서예요.
자주 묻는 질문