본문 바로가기
반직장인

미드저니(Midjourney) V1 비디오 생성 기능 출시 : 상세 가이드

by Banjubu 2025. 6. 19.
728x90
반응형
SMALL

 

 

 

 

 

 

 

개요

2025년 6월 18일, Midjourney는 첫 비디오 모델 V1을 출시하며 AI 생성 콘텐츠의 새로운 장을 열었습니다(Midjourney 공식 발표). 이 기능은 정적 이미지를 5~20초 길이의 동영상으로 변환하는 이미지-투-비디오 기술로, 약 2천만 명의 구독자가 이용할 수 있습니다. 이는 Midjourney의 장기 목표인 실시간 오픈월드 시뮬레이션으로 가는 중요한 첫걸음입니다.

기능 작동 방식

Midjourney의 V1 비디오 기능은 사용이 간편하며, 다음 단계를 통해 이미지를 동영상으로 변환합니다:

  1. 이미지 생성 또는 업로드: Midjourney의 기존 이미지 생성 도구를 사용하거나 외부 이미지를 업로드합니다.
  2. 애니메이션 시작: 생성된 이미지 아래의 "Animate" 버튼을 클릭합니다.
  3. 애니메이션 모드 선택:
    • 자동 모드: Midjourney가 모션 프롬프트를 자동 생성해 빠르고 간단한 애니메이션을 제공합니다.
    • 수동 모드: 사용자가 직접 모션 프롬프트를 작성해 장면 전개, 카메라 움직임 등을 세밀히 제어할 수 있습니다(모바일 미지원).
  4. 모션 레벨 선택:
    • 로우 모션: 카메라가 거의 고정된 상태로, 미세하거나 느린 움직임에 적합합니다. 단, 움직임이 거의 없을 수 있습니다.
    • 하이 모션: 피사체와 카메라가 역동적으로 움직이며, 액션 장면에 적합합니다. 단, 플리커링 등 오류가 발생할 수 있습니다.
  5. 비디오 연장: 초기 5초 클립 4개를 생성하며, "Extend" 버튼으로 최대 4회(각 4초) 연장해 20초까지 확장 가능합니다.

기술 사양

항목 세부 사항

비디오 길이 5~20초 (5초 단위로 연장 가능)
해상도 최대 1080p
오디오 미지원
비용 이미지 생성의 약 8배, 스타터 티어 $10부터
접근성 모든 구독자 (약 2천만 명)
추가 기능 Pro 요금제 이상에서 "Video relax" 모드 테스트 중

비디오 생성 비용은 이미지 생성보다 약 8배 높지만, 기존 시장 가격 대비 25배 저렴합니다(TestingCatalog 기사). Pro 요금제 사용자는 느리지만 품질이 향상된 "Video relax" 모드를 테스트할 수 있습니다.

사용자 피드백 및 경쟁사 비교

사용자들은 V6.1 이미지 모델의 일관성을 계승한 점을 높이 평가하지만, 하이 모션 장면에서 플리커링 문제가 지적되었습니다. Phi Hoang은 “기대를 초월한다”고 평가했으나, Reddit 사용자들은 OpenAI의 Sora와 같은 고급 모델에 비해 사실감이 부족하다고 언급했습니다. Runway Gen-4, Luma Dream Machine, Sora 등 경쟁사에 비해 범위는 제한적이지만, 비용 효율성과 사용 편의성에서 강점을 보입니다.

미래 계획

Midjourney는 V1 비디오 기능을 실시간 3D 환경 구축의 첫 단계로 보고 있습니다. 장기 목표는 다음과 같습니다:

  • 3D 모델 개발: 탐색 가능한 3D 장면 생성.
  • 실시간 상호작용: 오픈월드 시뮬레이션에서 사용자와 환경 간 상호작용 구현.
  • 로드맵: 이미지 → 비디오 → 실시간 → 3D 통합 (1~2년 내 목표).

또한, 비디오 업스케일러와 품질 개선 모델(V7.1, V7.2, V8)이 개발 중이며, 사용자 피드백을 반영해 기능을 최적화할 계획입니다.

비디오 프롬프트 작성 팁

효과적인 비디오 프롬프트를 작성하는 것은 특히 수동 모드에서 중요합니다. 다음은 성공적인 프롬프트 작성 가이드라인입니다:

  1. 움직임 묘사 (능동적 동사 사용):
    • 예: “한 마리 새가 위로 날아오르며 빠르게 날갯짓한다.” (A bird soars upward, flapping its wings rapidly.)
    • 피해야 할 예: “하늘에 있는 새.” (움직임 부족)
  2. 시간적 일관성 강조:
    • 예: “태양이 천천히 산 뒤로 지며 점차 그림자를 드리운다.” (The sun slowly sets behind the mountains, gradually casting shadows.)
    • 자주 쓰이는 시간 연결어: 처음에, 그리고, 다음에, 그 후, 갑자기, 동시에, 결국, ~하면서, ~하는 동안에, 마지막에.
  3. 장면 전개 묘사:
    • 예: “소년이 숲을 걷고, 이어 반딧불이 날아다니는 빛나는 동굴로 들어간다.” (A boy walks through a forest, then enters a glowing cave as fireflies swirl.)
  4. 카메라 움직임 지시:
    • 예: “카메라가 왼쪽으로 이동하며 가로등이 깜빡인다.” (The camera pans left as a streetlamp flickers.)
  5. 형용사 및 부사 활용:
    • 예: “우아하게 도약하여, 이끼 낀 돌 위에 소리 없이 착지한다.” (Leaps gracefully, landing silently on moss-covered stones.)
  6. 스타일, 분위기, 조명 설정:
    • 예: “으스스한 달빛; 영화적이며 고화질의 디테일.” (Eerie moonlight; cinematic, high detail.)

프롬프트 치트시트 예시

프롬프트 유형 예시

주어 + 동작 고양이가 지붕 위를 재빠르게 가로지른다. (A cat darts across a rooftop.)
시간 연결어 그 뒤로 달이 천천히 떠오르는 동안... (...while the moon rises slowly behind it.)
카메라 움직임 카메라가 왼쪽으로 이동하며 가로등이 깜빡인다. (...camera pans left as a streetlamp flickers.)
장면 전환 고양이는 지붕에서 뛰어내려 어두운 안뜰에 착지한다. (...it leaps off the roof and lands in a dark courtyard.)
형용사/부사 우아하게 도약하여, 이끼 낀 돌 위에 소리 없이 착지한다. (...leaps gracefully, landing silently on moss-covered stones.)
스타일/분위기/조명 으스스한 달빛; 영화적이며 고화질의 디테일. (Eerie moonlight; cinematic, high detail.)

기술적 문제 및 대응

  • SNS 업로드 문제: SNS 플랫폼에서 480p로 과도하게 압축될 수 있으므로 업스케일 후 업로드 권장.
  • 비디오 수량: 현재 작업당 4개 비디오 생성, 품질 향상을 위해 2개로 줄이는 방안 검토 중.
  • 서버 안정성: GPU 사용량 모니터링 및 신규 서버 도입으로 수요 대응 중.

결론

Midjourney의 V1 비디오 기능은 AI 생성 콘텐츠의 새로운 가능성을 열어주는 강력한 도구입니다. 사용자 친화적인 인터페이스, 저렴한 비용, 그리고 미래 발전 가능성을 통해 창작자와 AI 애호가 모두에게 매력적인 선택이 될 것입니다. 이 기능을 책임감 있게 활용해 창의적이고 감동적인 결과를 만들어보세요!

 

 

728x90
반응형
LIST