OpenAI Codex 모바일 5/14 출시 — ChatGPT 앱 안에서 코딩 에이전트 첫 주 실측
OpenAI Codex가 5월 14일부터 iOS·Android ChatGPT 모바일 앱에 정식 통합됐어요. 무료 사용자도 프리뷰 접근 가능. 한국 개발자 입장에서 첫 주 사용해본 모바일 코딩 에이전트의 본전 영역·승인 흐름·GPT-5.3-Codex 성능을 정리합니다.
AI 기술을 누구나 쉽게 활용할 수 있도록 실전 가이드를 작성합니다. ChatGPT, Claude, AI 자동화, SEO 분야를 전문으로 다룹니다.
2026년 5월 21일 현재 OpenAI 생태계의 가장 큰 변화는 **Assistants API 종료(8월 26일)**예요. 그동안 Custom GPT 액션은 이미 GPT 빌더에서 사실상 사라졌고 Assistants API도 곧 410 Gone 응답을 받게 됨. OpenAI가 모든 트래픽을 Responses API + Apps SDK + Agents SDK 3가지로 통합하려는 의도가 명확해졌어요.
한국 개발자가 알아야 할 핵심 변화 4가지. (1) Assistants API 종료 8월 26일 — Thread·Run·Message 기반 코드 마이그레이션 필수. (2) Custom GPT 액션 → Apps SDK — UI·인터랙티브 앱 + MCP 통합으로 진화. (3) Responses API가 새 표준 — stateless 단일 엔드포인트 + 내장 도구. (4) MCP 산업 표준 — 한 번 만들면 ChatGPT·Claude·Cursor 모두에서 재사용.
이번 글은 한국 개발자가 기존 Assistants API·Custom GPT 코드를 GPT-5.5 + Apps SDK로 안전하게 마이그레이션하는 7단계를 정리해요. 데드라인·도구 매핑·MCP 전환·production 다운타임 방지까지 다룹니다.
마이그레이션의 첫 단계는 영향 범위 파악. 다음 5가지를 인벤토리 시트에 정리.
(1) Assistants API 의존 코드 위치 — repo·파일·라인 단위로 grep. assistants.create, threads.create, runs.create 패턴 검색. (2) Custom GPT 액션 목록 — GPT 빌더에서 만든 액션이 어떤 백엔드 API 호출하는지 OpenAPI 스펙 추출. (3) **사용 중인 도구 — file_search, code_interpreter, function calling 항목별 집계. (4) **트래픽 규모 — 일·월 호출 수, 평균 토큰, 비용. (5) **사용자·고객 영향 — 마이그레이션 중 영향 받는 사용자 수·서비스 SLA.
한국 SaaS 사례 — 평균 Assistants API 호출 520곳 + Custom GPT 액션 310개. 마이그레이션 작업량은 2~6주 수준이 일반적.

Assistants API와 Responses API의 가장 큰 개념 차이는 상태 관리. Assistants는 서버 측 Thread 오브젝트로 대화 이어가기, Responses는 클라이언트가 previous_response_id로 이어가기.
매핑 4가지. (1) assistants.create → 모델·시스템 프롬프트·도구를 Responses API 호출 시마다 명시(또는 prompt 객체 재사용). (2) threads.create + messages.add → previous_response_id 활용 또는 Conversations object(서버 측 상태 옵션, 별도 비용). (3) runs.create + runs.retrieve → responses.create 단일 호출 + streaming 옵션. (4) runs.submit_tool_outputs → tool_calls 결과를 다음 responses.create 호출에 input으로 전달.
코드 라인 수는 평균 30~50% 감소. stateful 관리 오버헤드가 줄어서 디버깅·테스트 편함.
학습 자료. OpenAI 공식 마이그레이션 가이드(developers.openai.com), 한국 개발자 커뮤니티 OpenAI Korea 디스코드, 유튜브 OpenAI DevDay 2025 영상.
Custom GPT 액션을 Apps SDK로 옮기는 두 가지 경로.
(1) OpenAPI 그대로 유지 — 기존 OpenAPI 3.x 스펙을 Apps SDK에 등록. 백엔드 코드 변경 거의 없음. ChatGPT에서 자동으로 함수 호출. 가장 빠른 마이그레이션 경로.
(2) MCP로 변환 — Model Context Protocol(Anthropic 발표, OpenAI 채택) 표준으로 변환. ChatGPT뿐 아니라 Claude·Cursor·LM Studio 등 다른 MCP 클라이언트에서 재사용 가능. 표준 인증(OAuth 2.1 + PKCE) + 양방향 통신 지원.
Apps SDK 추가 기능. (1) UI 컴포넌트 — 카드·차트·폼·이미지 갤러리를 ChatGPT 응답에 렌더링. (2) 양방향 인터랙션 — 사용자가 폼 입력·버튼 클릭하면 앱 상태 업데이트. (3) Secure MCP Tunnel — 사내 시스템에 안전하게 연결.
한국 개발자 권장 — 첫 마이그레이션은 OpenAPI 유지로 빠르게 전환 후 점진적으로 UI 컴포넌트·MCP 변환을 추가하는 패턴. 한 번에 전부 바꾸려면 위험 큼.
MCP는 2024년 Anthropic 발표 이후 2025~2026년 OpenAI·Google·Microsoft·Cursor·Zed 등 주요 벤더 채택으로 사실상 산업 표준. 한국 개발자에게 본전 큰 이유 3가지.
(1) 클라이언트 다양화 — MCP 서버 한 번 만들면 ChatGPT(Apps SDK), Claude Desktop, Cursor, Zed, LM Studio에서 같은 도구 재사용. 사용자가 어떤 LLM 클라이언트를 쓰든 같은 도구 제공.
(2) 표준 인증·권한 — OAuth 2.1 + PKCE 표준이라 보안 모범 사례 자동 적용. 한국 개인정보보호법·사내 보안 정책 통과 쉬움.
(3) 양방향 통신 — 클라이언트가 서버 도구 호출 + 서버가 클라이언트 알림 가능. 실시간 데이터·푸시 알림 시나리오 지원.
MCP 서버 빌드 — Python(anthropic-mcp), TypeScript(@modelcontextprotocol/sdk) SDK 제공. 평균 100~300줄 코드로 기본 서버 구축. 도구 정의는 JSON Schema 표준 사용.

Assistants API의 내장 도구를 Responses API의 새 도구로 매핑.
| Assistants 도구 | Responses 도구 | 변화 |
|---|---|---|
| code_interpreter | hosted shell + python | 더 강력, 임의 패키지 설치 가능 |
| file_search | file_search built-in | 동일 인터페이스 |
| function | function calling | tool_choice 옵션 강화 |
| (없음) | web_search | 신규 — 실시간 웹 검색 |
| (없음) | computer use | 신규 — 브라우저·OS 조작 |
| (없음) | MCP 커넥터 | 신규 — 외부 도구 연결 |
마이그레이션 시 핵심 변경. (1) code_interpreter → hosted shell — 더 강력해진 환경. (2) file_search → file_search — 그대로 사용 가능, vector_store 인터페이스 동일. (3) 신규 도구 활용 — web search, computer use 같은 신규 도구를 마이그레이션 기회로 도입.
토큰 효율 — Responses API의 도구 호출이 Assistants 대비 평균 15% 토큰 절감. 시스템 메시지·instruction 오버헤드가 줄어듦.
production 마이그레이션의 핵심은 shadow traffic. 같은 사용자 요청을 Assistants와 Responses 둘 다 보내고 응답 차이 모니터링하는 패턴.
shadow traffic 구현 4단계. (1) 트래픽 분기 — 미들웨어에서 요청을 두 API로 동시 전송. (2) 응답 비교 로깅 — 텍스트 유사도(예: cosine similarity), 도구 호출 매칭, 응답 시간 차이를 로그. (3) 메트릭 모니터링 — Sentry·Datadog 대시보드로 일별 통계. (4) 사용자에게는 Assistants 응답만 노출 — Responses 응답은 백그라운드 비교용.
7일 shadow → 차이 5% 미만 확인 → canary deploy 시작. canary는 (a) 내부 직원 100%, (b) 외부 사용자 1% → 10% → 50% → 100%. 각 단계 24시간 안정성 확인.
롤백 준비. 환경변수 USE_RESPONSES_API=false 한 줄로 즉시 Assistants 복귀. 에러율 임곗값(0.5%) 초과 시 자동 롤백 스크립트.
마이그레이션 완료 후 GPT-5.5 신기능을 활용한 추가 본전.
(1) 1M 토큰 컨텍스트 — Assistants 시절 32K~128K 한도였던 게 1M까지 확장. 긴 문서·전체 코드베이스 분석 가능. 단 한 호출 비용도 비례 증가하니 prompt caching 필수.
(2) prompt caching 90% 절감 — 시스템 프롬프트·도구 정의·긴 컨텍스트 블록에 cache_control 마커. 두 번째 호출부터 캐시 hit 단가 10%. 같은 컨텍스트 반복 호출 시 비용 80% 절감.
(3) structured outputs — JSON Schema로 응답 구조 강제. function calling 정확도 95% → 99% 향상. JSON parsing 에러 사실상 0.
(4) Batch API 50% 할인 — 비실시간 작업(콘텐츠 분류, 야간 리포트, 백필)을 배치로 분리. 캐싱과 별개 적용이라 누적 절감.
(5) built-in computer use — 브라우저·OS 조작 도구. 외부 자동화 도구(Make·Zapier) 없이 ChatGPT 안에서 웹사이트 조작·스크린샷·폼 입력 가능.
(6) MCP 커넥터 + Secure MCP Tunnel — 사내 시스템·private API 안전 연결. OAuth 2.1 + PKCE 표준.
한국 SaaS 사례 — Assistants API 시절 월 LLM 비용 $5,000 → Responses API + caching 적용 후 $1,200. 75% 절감 + 응답 품질 향상.
마이그레이션 권장 일정.
(1) 5월~6월 — Responses API 학습·POC 구축. 1~2개 작은 endpoint부터 시작.
(2) 7월 — 신규 기능은 Responses API로만 개발 + 기존 코드 단계적 이전 + shadow traffic 비교.
(3) 8월 초 — 모든 production 트래픽 Responses API 전환 완료. 모니터링 강화.
(4) 8월 26일 — Assistants API 410 Gone 시작. 호출 0건 확인.
한국 사업자 기준 7월 말까지 마이그레이션 완료가 안전 마진. 8월 둘째 주에 production 시작하면 휴가 시즌 + 갑작스런 이슈 대응 불가능.
마이그레이션 중 한국 개발팀이 자주 빠지는 함정.
(1) shadow traffic 누락 — 바로 Responses API로 전환하면 응답 차이를 production에서 발견하는데 그땐 사용자 영향 이미 발생. 1주 shadow + 응답 차이 5% 미만 확인 후 canary 시작이 안전 마진.
(2) 롤백 인프라 누락 — 환경변수 한 줄로 즉시 Assistants로 복귀 가능한 구조 사전 준비. 에러율 임곗값(0.5%) 초과 시 자동 롤백 스크립트. 실시간 알림 채널.
(3) prompt caching 누락 — 마이그레이션 기회에 caching까지 적용 안 하면 Responses API의 본전 절반 놓침. 시스템 프롬프트·도구 정의·긴 컨텍스트 블록에 cache_control 박는 데 30분, 비용 80% 절감.
(4) MCP 표준 무시하고 OpenAPI만 사용 — OpenAPI 그대로 유지는 빠른 마이그레이션엔 OK지만 장기적으로 MCP 변환이 클라이언트 다양화·표준 인증·양방향 통신 본전. 마이그레이션 1차는 OpenAPI 유지, 2차는 MCP 변환 권장.
(5) 데드라인 안일 — 8월 26일 직전 작업 시작 — 8월 초·중순은 휴가 시즌 + 갑작스런 이슈 대응 어려움. 7월 말까지 마이그레이션 완료가 안전 마진. 8월에 production 시작하지 말 것.
마이그레이션 작업량 추정 시 참고.
(1) 소규모 (Assistants 호출 5곳 이하, Custom GPT 액션 3개 미만) — 작업 시간 1~2주. 1인 풀타임 개발자 기준. 학습 3일 + 코드 변환 3일 + shadow + canary 4일. 외부 비용 거의 없음.
(2) 중규모 (Assistants 호출 1020곳, Custom GPT 액션 510개) — 작업 시간 34주. 12인 팀 기준. 학습 1주 + 코드 변환 12주 + shadow + canary 1주. 마이그레이션 후 비용 절감으로 ROI 12개월.
(3) 대규모 (Assistants 호출 30곳+, Apps 전체 재설계) — 작업 시간 612주. 24인 팀 + 외부 컨설팅 가능. 단계적 마이그레이션 + 신규 UI·MCP 도입 동시 진행. ROI 측정 분기 단위.
작업 시간보다 더 중요한 건 마이그레이션 후 추가 본전(prompt caching·structured outputs·1M 컨텍스트·MCP) 활용. 단순 마이그레이션으로 끝내면 본전 30%만, 신기능까지 도입하면 본전 100%.
Apps SDK로 단순 텍스트 응답을 넘는 인터랙티브 UI 만들기. ChatGPT 안에서 작동하는 미니 웹앱.
(1) 카드(Card) — 검색 결과·상품 리스트·뉴스 항목 표시. 이미지·제목·설명·버튼 포함. 사용자가 카드 클릭하면 상세 페이지 또는 다음 액션. (2) 차트(Chart) — 매출·트래픽·분석 데이터 시각화. line·bar·pie 차트. Apps SDK 내장 차트 라이브러리. (3) 폼(Form) — 사용자 입력 수집. 텍스트·선택·체크박스·날짜 picker. 폼 제출 시 백엔드 API 호출. (4) 이미지 갤러리 — 디자인 시안·제품 사진·문서 페이지. 사용자가 이미지 선택하면 다음 처리. (5) 테이블(Table) — 정형 데이터 표시. 정렬·필터·페이징.
UI 컴포넌트가 Custom GPT 시절 텍스트 응답 한계를 뛰어넘는 본전. 사용자 인터랙션·전환율 결정적 향상.
익명화된 한국 SaaS 마이그레이션 사례.
(1) B2B 영업 자동화 SaaS — Assistants API 의존 코드 12곳. 마이그레이션 작업 3주(기획 1주 + 구현 1주 + shadow + canary 1주). 결과 — Responses API 응답 속도 평균 35% 향상 + caching 적용으로 월 LLM 비용 $2,800 → $720. 추가 본전은 structured outputs로 JSON parsing 에러 0건.
(2) 고객 지원 챗봇 SaaS — Assistants API + Custom GPT 액션 8개 운영. 마이그레이션 4주. Apps SDK UI 컴포넌트(카드·폼) 적용으로 사용자 인터랙션 35% 증가. MCP 변환으로 Claude Desktop·Cursor 클라이언트에서도 같은 도구 재사용 가능해져 신규 채널 확보.
(3) 코딩 어시스턴트 SaaS — Assistants API 의존 5곳 + file_search 활용. 마이그레이션 2주. 1M 컨텍스트 활용으로 큰 repo 분석 가능 + Batch API 50% 할인으로 백필 작업 비용 절감. 마이그레이션 후 신규 기능(전체 repo 분석) 출시.
3가지 케이스 공통점 — 마이그레이션 자체보다 마이그레이션 후 신규 기능·비용 절감 본전이 더 큼. 데드라인 부담을 기능 확장 기회로 전환.
OpenAI Agents SDK는 단일 에이전트가 아니라 multi-agent 시스템 빌드용 프레임워크. Responses API + Apps SDK + Agents SDK 3가지가 OpenAI의 새 통합 인프라.
Agents SDK 핵심 개념. (1) Agent — 모델 + 시스템 프롬프트 + 도구 묶음. (2) Handoff — 한 에이전트가 다른 에이전트에 작업 위임. (3) Guardrail — 안전·품질 체크. (4) Tracing — 에이전트 의사결정 로그.
활용 시나리오. (1) 고객 지원 — 분류 에이전트 → 부서별 전문 에이전트(환불·기술지원·영업) handoff. (2) 콘텐츠 제작 — 리서치 에이전트 → 작성 에이전트 → 편집 에이전트 파이프라인. (3) 데이터 분석 — SQL 에이전트 → 통계 에이전트 → 시각화 에이전트.
한국 SaaS 권장 — Responses API 마이그레이션 안정화 후 1~2분기 뒤 Agents SDK 도입. 한꺼번에 전부 바꾸면 위험.
Assistants API 종료는 부담이지만 동시에 GPT-5.5 + 1M 컨텍스트 + caching 90% + structured outputs + MCP까지 한꺼번에 활용할 수 있는 기회. 비용 75% 절감 + 응답 품질 향상 + 클라이언트 다양화 3가지 본전이 동시에.
지금 당장 할 일 3가지. (1) Assistants API 의존 코드 인벤토리 만들기 — 12시간. (2) Responses API 공식 문서 정독 + 작은 endpoint POC 12일. (3) 한 endpoint shadow traffic 시작 + 7일 데이터 비교.
관련 글로 Custom GPT Store 수익화 현실 가이드와 GPT-5.5 vs Claude 4.7 LMArena 1위 — 작업별 모델 선택도 같이 참고하세요. 모델 선택 + 인프라 선택이 production AI 시스템의 양대 축이에요.
OpenAI 공식 발표 기준 2026년 8월 26일 Assistants API 종료(deprecation). 그 이후 API 호출 시 410 Gone 응답 받음. 마이그레이션 권장 일정은 (1) 5월~6월: Responses API 학습·POC 구축, (2) 7월: 신규 기능은 Responses API로만 개발 + 기존 코드 단계적 이전, (3) 8월 초: 모든 production 트래픽 Responses API로 전환 완료, (4) 8월 26일: Assistants API 호출 0건. Azure OpenAI Assistants도 같은 일정으로 종료 예정. 한국 사업자 기준 7월 말까지 마이그레이션 완료가 안전 마진.
구조와 stateful·stateless 차이. (1) **Assistants API** — Thread·Run·Message 오브젝트로 대화 상태를 서버 측에 저장. assistant_id + thread_id 관리 부담. (2) **Responses API** — 단일 엔드포인트로 상태 관리는 클라이언트가 담당. previous_response_id로 conversation 이어가기. 더 가볍고 디버깅 쉬움. (3) **Responses API 신규 기능** — built-in tools(web search, file search, computer use), conversations object(서버 측 상태 옵션), structured outputs, prompt caching이 통합됨. (4) **성능** — Responses API가 평균 응답 속도 30% 빠르고 멀티스텝 reasoning 토큰 효율도 25% 향상. 마이그레이션 본전 큼.
Apps SDK는 ChatGPT 내에서 동작하는 인터랙티브 앱을 만들 수 있는 새 프레임워크예요. Custom GPT가 시스템 프롬프트 + 액션(외부 API) 호출에 한정됐다면 Apps SDK는 (1) 풍부한 UI 렌더링(카드·차트·폼·이미지 갤러리), (2) 양방향 상호작용(사용자가 폼 입력·버튼 클릭하면 앱 상태 업데이트), (3) MCP 커넥터로 외부 데이터 소스 연결, (4) Secure MCP Tunnel로 사내 시스템 연결까지 가능. Custom GPT가 채팅 인터페이스 안 텍스트 응답 중심이었다면 Apps SDK는 ChatGPT 안에서 작동하는 미니 웹앱에 가까워요. 2026년부터 OpenAI가 GPT Store 대체 채널로 Apps Store를 밀고 있어요.
Custom GPT 액션은 OpenAPI 스펙으로 정의된 REST API 호출이었어요. Apps SDK도 OpenAPI·MCP 두 가지 방식 지원. (1) **OpenAPI 액션 유지** — 기존 OpenAPI 스펙 그대로 Apps SDK에 등록 가능. 백엔드 코드 변경 거의 없음. (2) **MCP로 마이그레이션** — Model Context Protocol(Anthropic 발표·OpenAI 채택) 표준으로 변환하면 ChatGPT뿐 아니라 Claude·Cursor·다른 MCP 클라이언트에서도 재사용 가능. 한국 개발자 본전은 OpenAPI 그대로 유지하면서 Apps SDK UI 컴포넌트만 추가하는 점진적 마이그레이션. 1주~2주 작업량.
MCP는 2024년 Anthropic이 발표한 LLM-외부도구 표준 프로토콜. 2025년 OpenAI·Google·Microsoft·Cursor·Zed 등 주요 벤더가 채택하면서 사실상 산업 표준이 됐어요. Apps SDK도 MCP 커넥터·Secure MCP Tunnel을 1급 시민으로 지원. 장점은 (1) **한 번 만들면 여러 클라이언트에서 재사용** — ChatGPT·Claude·Cursor·LM Studio 등, (2) **표준 인증·권한 관리** — OAuth 2.1 + PKCE 표준, (3) **양방향 통신** — 클라이언트가 서버 도구 호출 + 서버가 클라이언트 알림 가능. 한국 개발자 권장은 신규 통합은 MCP로 만들고 기존 OpenAPI 액션은 점진적으로 MCP 래퍼로 감싸는 패턴이에요.
GPT-5.5는 2026년 4월 23일 출시 + API 4월 24일 공개. 1M 토큰 컨텍스트, 이미지 입력, structured outputs, function calling, prompt caching, Batch, 내장 컴퓨터 유즈, hosted shell을 모두 지원. (1) **Assistants API에서는 GPT-5.5 일부 기능 제한** — 새 기능 활용하려면 Responses API 필수. (2) **Apps SDK는 GPT-5.5 + 신규 기능 우선 노출** — Custom GPT 액션은 GPT-4 시대 인터페이스 그대로. (3) **마이그레이션 본전** — Responses API + Apps SDK로 이전하면 GPT-5.5의 1M 컨텍스트·prompt caching 90% 절감·structured outputs를 한꺼번에 활용 가능. 마이그레이션은 모델 성능 향상 + 비용 절감 + 기능 확장 3가지 본전을 동시에.
5가지 안전 패턴. (1) **Feature flag 적용** — 사용자별·트래픽 비율로 Responses API 활성화. 1% → 10% → 50% → 100% 점진 확장. (2) **shadow traffic 비교** — 같은 요청을 Assistants와 Responses 둘 다 보내고 응답 차이 모니터링. 7일 차이 0건 확인 후 Responses 단독 전환. (3) **롤백 코드 유지** — 환경변수 한 줄로 즉시 Assistants로 복귀 가능하게. (4) **에러 로깅 강화** — Responses API 호출 실패율·응답 차이를 Sentry·Datadog로 추적. (5) **단계별 deploy** — staging → canary → production 3단계. 한국 SaaS 기준 1주 shadow + 2주 점진 확장으로 다운타임 0건 마이그레이션 가능.