ElevenLabs 음성 복제 실전 사용법 — 내 목소리로 AI 내레이션 만들기
ElevenLabs로 내 목소리를 AI에 복제해 유튜브 내레이션과 오디오북을 만드는 실전 가이드예요. 무료 플랜으로 어디까지 가능한지 정리했어요.
AI 기술을 누구나 쉽게 활용할 수 있도록 실전 가이드를 작성합니다. ChatGPT, Claude, AI 자동화, SEO 분야를 전문으로 다룹니다.
이미지 AI 좀 진지하게 다뤄보고 싶은데, 어디서 시작해야 할지 막막하셨죠?
저도 처음엔 Midjourney만 쓰다가 한계를 느끼고 ComfyUI로 넘어왔어요. 막상 설치하려고 보니까 README가 영어인 데다 용어가 어려워서 며칠을 헤맸거든요.
오늘은 그때 제가 알았으면 좋았을 정보들을 30분 가이드로 정리했어요. 따라 하면 오늘 안에 첫 이미지 생성까지 끝나요.
ComfyUI는 Stable Diffusion 계열 모델을 돌리는 노드 기반 인터페이스예요.
Midjourney 사용법 완벽 가이드와 비교하면 차이가 뚜렷해요:
저는 둘 다 써봤는데, 결국 ComfyUI로 정착했어요. 이유는 비용도 비용이지만 워크플로우를 내가 100% 제어할 수 있다는 점이 컸어요.
특히 LoRA, ControlNet, 인페인팅 같은 고급 기능을 자유롭게 조합할 수 있어요.
설치 전에 확인할 항목 3가지예요.
저는 RTX 5060 Ti 8GB로 SDXL을 1장당 5초에 생성하고 있어요. 4K 업스케일까지 포함해도 20초면 끝나요.
SSD 100GB 정도는 비워두는 게 좋아요. 모델은 한 번 받으면 계속 늘어나거든요.
ComfyUI 포터블 버전을 받으면 Python이 내장돼 있어서 별도 설치가 필요 없어요. 초보자는 무조건 포터블 버전을 추천해요.
GitHub의 ComfyUI 공식 릴리스 페이지에서 Windows 포터블 버전(약 1.5GB)을 다운로드하세요.
압축을 풀면 ComfyUI_windows_portable 폴더가 생겨요. 이 폴더 안에서 모든 작업이 끝나요.
처음에는 SDXL 베이스 모델 1개만 받아도 충분해요.
sd_xl_base_1.0.safetensors (Hugging Face에서 검색)ComfyUI\models\checkpoints\ 폴더다운로드가 끝나면 폴더에 그대로 넣기만 하면 돼요.
run_nvidia_gpu.bat 파일을 더블클릭하면 끝이에요.
검은 콘솔 창이 뜨고 잠시 후 자동으로 브라우저가 열려서 ComfyUI 인터페이스가 보일 거예요. 주소는 보통 http://127.0.0.1:8188이에요.
처음 실행하면 기본 기능만 있어요. ComfyUI Manager를 설치하면 모델/노드/워크플로우를 GUI로 관리할 수 있거든요.
설치 방법: custom_nodes 폴더에 ComfyUI-Manager를 git clone 하면 끝이에요.
저는 이거 설치 안 하고 며칠 고생했어요. 무조건 처음에 같이 설치하세요.
기본 워크플로우가 이미 로드되어 있어요. 프롬프트만 바꿔서 "Queue Prompt" 버튼을 누르면 첫 이미지가 생성돼요.
추천 프롬프트:
5~10초 후에 오른쪽에 이미지가 나타나면 성공이에요.
VRAM이 부족하다는 뜻이에요. 해결책 3가지:
--lowvram 플래그 추가 (run 배치 파일 수정)models/checkpoints 폴더에 넣고 ComfyUI를 재시작해야 해요. 또는 Refresh 버튼을 누르세요.
해당 노드의 의존성 모델이 없다는 뜻이에요. ComfyUI Manager의 "Install Missing Custom Nodes"로 한 번에 해결돼요.
기본 텍스트→이미지가 익숙해지면 다음 단계로 넘어가세요.
각 기능은 AI 이미지 생성 프롬프트 예시 모음에서 다룬 프롬프트 작성법과 함께 익히면 효과가 두 배예요.
ComfyUI는 처음엔 복잡해 보이지만 첫 이미지를 뽑고 나면 오히려 쉽다는 게 느껴져요.
오늘 당장 할 일이에요:
30분이면 충분해요. 시작이 반이거든요.
네, 완전 무료 오픈소스예요. GitHub에서 다운로드해서 본인 PC에 설치해서 사용해요.
NVIDIA RTX 3060(8GB) 이상 권장해요. RTX 5060 Ti 8GB에서 SDXL 모델이 1장당 5초 정도 걸려요.
VRAM 6GB 이상 그래픽카드 탑재 노트북이면 가능해요. 다만 발열 관리가 중요해요.
ComfyUI는 노드 기반이라 워크플로우를 시각적으로 설계해요. A1111은 탭 기반이라 초보가 쓰기 쉽지만 자유도가 낮아요.
Hugging Face와 Civitai에서 SDXL, Flux, SD 1.5 모델을 무료로 받을 수 있어요. 라이선스만 확인하세요.
기본은 영어지만 ComfyUI-Manager 확장으로 한글화 가능해요. 메뉴는 영어에 익숙해지면 더 빨라요.