쇼츠/릴스 생성기 로컬 MVP 1단계 완료 기록
요약
Claude Code와 협업해 사진이나 짧은 영상을 9:16 세로 MP4로 변환하는 로컬 앱 MVP를 만들었다. v0.1.0부터 v0.1.4까지 단계적으로 기능을 확장하며 1단계 완료로 판단했다. 공개 서비스가 아닌 로컬 실행 기반의 MVP이며, 이번 기록의 핵심은 기능 그 자체보다 “AI와 협업해 MVP를 만들고 운영자가 방향·검증·완료 기준을 판단하는 과정”이다.
시작 배경
쇼츠와 릴스 제작 과정에서 사진이나 짧은 클립을 9:16 세로 형식으로 빠르게 편집하는 도구가 필요했다. 외부 서비스를 쓰면 데이터 노출 우려가 있었고, 반복 실험에는 로컬에서 직접 돌릴 수 있는 도구가 더 적합했다.
공개 서비스가 아니라 로컬 MVP로 시작한 이유는 두 가지였다. 첫째, 먼저 기능이 실제로 필요한지 직접 써보면서 검증해야 했다. 둘째, 배포까지 가기 전에 어디까지 기능을 넣을 것인지 판단할 기준이 필요했다.
역할 분리
이번 개발에서 역할은 명확하게 나눴다.
- 운영자: 만들 기능의 우선순위, 검증 방법, 완료 기준을 판단하고 결과물이 의도대로 작동하는지 확인
- Claude Code: 기술 구조 설계와 실제 코드 구현 담당
운영자가 코드를 전혀 건드리지 않았다는 뜻이 아니라, 판단과 방향을 잡는 역할은 운영자가, 구현은 Claude Code가 맡았다는 뜻이다.
기술 구조
- 프론트엔드: Next.js (UI 조작 및 입력)
- 백엔드: FastAPI (Python, 비디오 처리 API)
- 영상 처리: FFmpeg (비디오 합성, 크롭, 자막, 전환 효과)
- 이미지 처리: Pillow (인트로/아웃트로 카드 생성)
- 실행 방식: 로컬 개발 서버 (Next.js + FastAPI 병렬 실행)
v0.1.0 ~ v0.1.4 단계별 확장
v0.1.0 — 기본 구조
사진 업로드, 9:16 세로 MP4 생성, 기본 UI 연결. 가장 핵심 기능 하나가 작동하는지 먼저 확인하는 것이 목적이었다.
v0.1.1 — BGM과 Ken Burns
BGM 파일 업로드와 볼륨 조정 추가. Ken Burns 효과(서서히 확대·이동하는 모션)를 넣어 정적인 사진에 움직임을 부여했다.
v0.1.2 — 전환과 다장면 구성
장면 전환 효과(fade, slide, cut 등) 추가. 여러 장면을 하나의 MP4로 합치는 다장면 구성을 구현했다.
v0.1.3 — 인트로/아웃트로와 캡션
Pillow를 이용해 인트로·아웃트로 카드를 생성하고, 장면별 캡션 텍스트의 색상·위치·스타일을 조정할 수 있게 했다.
v0.1.4 — 운동 기록과 마무리 기능
운동 기록 입력(거리, 시간, 페이스 등) 지원을 추가하고, 카드 프리뷰와 다운로드 파일명 지정 기능으로 1단계를 마무리했다.
현재 가능한 기능
- 사진/영상 업로드
- 9:16 세로 MP4 생성
- BGM 업로드·선택·볼륨 조정
- Ken Burns 모션
- 전환 효과
- 인트로/아웃트로 카드
- 장면별 캡션
- 운동 기록 입력
- 텍스트 색상·위치·스타일 조정
- 카드 프리뷰
- 다운로드 파일명 지정
문서화 완료 항목
| 문서 | 내용 |
|---|---|
| README.md | 프로젝트 개요와 실행 방법 |
| CHANGELOG.md | v0.1.0~v0.1.4 변경 이력 |
| docs/LOCAL_RUN.md | 로컬 실행 절차 |
| docs/FEATURES.md | 기능 목록과 사용 방법 |
| docs/KNOWN_ISSUES.md | 알려진 문제와 우선순위 |
| docs/ROADMAP.md | 2단계 후보 기능 목록 |
1단계 완료 판단 기준
다음 세 가지 기준을 충족했을 때 1단계 완료로 판단했다.
- 핵심 목적인 9:16 세로 MP4 생성이 실제로 작동한다.
- 쇼츠 제작에 필요한 최소 편집 기능이 갖춰졌다.
- 문서화가 완료되어 로컬에서 재현 가능한 상태다.
“완성된 제품”이 아니라 “이 단계에서 판단하고 멈출 수 있는 기준”을 정한 것이다. 기능을 더 넣는 것보다 어디서 멈출지 판단하는 것이 MVP 개발에서 더 어렵고 중요하다.
2단계로 넘긴 항목
다음 기능들은 2단계 보류로 분류했다. 1단계 기능을 충분히 써본 뒤 필요성이 확인되면 별도 검토한다.
- 드래그 기반 장면 편집
- AI 자동 장면 분석
- OCR (텍스트 자동 인식)
- 클라우드 배포 및 사용자 저장 기능
- 멀티 사용자 지원
이번 Log의 의미
이번 기록은 “쇼츠 생성 앱을 만들었다”는 보고가 아니다. AI와 협업해 로컬 MVP를 만들고, 운영자가 방향·검증·완료 기준을 판단하는 과정을 남긴 운영 기록이다.
이 기록이 쌓여야 다음 MVP를 만들 때 같은 실수를 반복하지 않고, 어디서 시작해 어디서 멈출지 기준을 세울 수 있다.
관련 Insight: AI와 함께 MVP를 만들 때 운영자가 붙잡아야 할 것은 코드가 아니라 판단이다
관련 Guide: Claude Code와 로컬 서비스앱 MVP를 만들 때의 기본 절차
→ 2026년 6월 운영 Board