갤러리 보기
Search
Tutorials
갤러리 보기
Search

I2V(Image-to-Video) 기술은 한 장의 이미지를 움직이는 영상으로 만들어 주는 강력한 생성형 AI 기술입니다. 하지만 ‘어떤 이미지를 입력으로 사용하느냐’에 따라 결과물의 스타일과 품질이 크게 달라질 수 있습니다. 따라서 I2V를 활용해 영상을 만들고자 할 때는 먼저 원하는 장면과 캐릭터, 분위기에 최적화된 이미지를 준비하는 과정이 필요합니다. 아래에서는 대표적으로 사용되는 이미지 생성 모델들과 원하는 이미지를 생성하기 위해서 간단히 오픈소스 이미지 모델을 추가 학습 하는 방법들을 소개하도록 하겠습니다.
2-1-1. MidJourney 웹 인터페이스 개요
미드저니 AI 기반 이미지 생성 플랫폼으로, 사용자가 입력한 텍스트 프롬프트를 기반으로 독창적인 아트워크, 일러스트, 사진 스타일의 이미지를 생성하는 서비스입니다. 그동안은 주로 Discord에서 봇에 명령 입력해 이미지를 생성해왔지만, 최근에는 웹 인터페이스를 지원하여 아티스트가 보다 직관적인 환경에서 작업할 수 있게 되었습니다.
사이트는 주소는 https://www.midjourney.com 입다. Discord 계정이나 Google 계정을 연동해야 로그인 할 수 있습니다. 로그인 과정과 플랜을 선택하는 부분은 다른 플랫폼을 설명하는 것과 마찬가지로 생략하도록 하겠습니다.
탐색
다른 사용자가 만든 인기 있는 이미지를 볼 수 있는 갤러리 입니다. 유저들이 생성한 다양한 스타일과 장르의 이미지들을 탐색할 수 있습니다. 처음에 시작할 때 다른사람들의 프롬프트를 참고하면 많은 도움이 됩니다.

2-1. Imag-to-Video(I2V)를 위한 이미지 생성 작업하기

2-2-1. Flux에 대해서
Black Forest Labs에서 개발한 FLUX는 텍스트를 기반으로 이미지를 생성하는 최첨단 모델입니다. 이 모델은 자연어 설명을 입력 받아 해당하는 이미지를 생성하는 능력을 갖추고 있습니다. Flux가 공개된 이후로 Stable Diffusion보다 Flux를 더 많이 사용하고 있습니다. Stable Diffusion은 오픈소스 AI 생성 모델로 강력한 커뮤니티와 확장성을 가지고 있지만, 속도, 품질, 모델 최적화 측면에서 Flux가 더 뛰어난 성능을 제공하고 있기 때문입니다. 하지만 AI 이미지 생성 기술이 급격하게 발전하면서 AI 영상 작업에 대한 요구가 늘어나고 있어서 사용빈도는 생성 AI 비디오 모델을 더 많이 사용하고 있습니다. 하지만 AI 영상을 만들기 위해서는 이미지 프롬프팅이 가장 효과적이고 빠르게 작업하 때는 Midjourney를 사용하고 있지만 디테일한 커스터마이징이 필요하거나 개발이 필요한 작업은 Flux를 여전히 사용하고 있습니다.
FLUX 모델은 다양한 버전으로 제공되며, 각 버전은 다음과 같은 특징을 가지고 있습니다:
•
FLUX.1 [pro]: 최고 수준의 성능을 제공하며, 우수한 프롬프트 추종 능력, 시각적 품질, 이미지 디테일 및 출력 다양성을 갖추고 있습니다. 이 버전은 API를 통해 접근할 수 있으며, Freepik, Together.ai, Fal.ai, Replicate 등의 파트너를 통해서도 이용 가능합니다.
•
FLUX.1 [dev]: FLUX.1 [pro]에서 직접 증류된 오픈 웨이트 모델로, 비상업적 용도로 사용됩니다. 유사한 품질과 프롬프트 추종 능력을 가지며, 동일한 크기의 표준 모델보다 효율적입니다. 이 버전의 웨이트는 Hugging Face에서 제공되며, Replicate, Fal.ai, Mystic, Deepinfra, TensorOpera, Hyperbolic 등을 통해 직접 사용해볼 수 있습니다.
•
FLUX.1 [schnell]: 가장 빠른 모델로, 로컬 개발 및 개인 사용을 위해 최적화되었습니다. Apache 2.0 라이선스 하에 공개되어 있으며, Hugging Face에서 웨이트를 제공하고 GitHub에서 추론 코드를 찾을 수 있습니다. Replicate, Fal.ai, Mystic, Deepinfra, TensorOpera, Together.ai 등을 통해서도 이용 가능합니다.
또한, FLUX.1 Tools라는 도구 모음이 제공되어, 기본 텍스트-이미지 모델인 FLUX.1에 제어 및 조정 기능을 추가합니다. 이 도구에는 다음과 같은 기능이 포함됩니다:
2-2. Flux에서 이미지 생성하기

Fal.ai에서 트레이닝 시킨 LoRA파일을 다운받아 ComfyUI의 LoRA 디렉토리에 위치 시킵니다. 저의 경우 flux폴더를 따로 만들어서 관리하고 있습니다.
ComfyUI_windows_portable\ComfyUI\models\loras\flux

ComfyUI을 실행시키도록 합니다. ComfyUI의 설치는 챕터 "2-2. Flux에서의 이미지 생성"을 참고하거나 공식 문서를 확인해서 설치하면 됩니다.
ComfyUI는 최근에 인스톨러가 제공되고 있습니다. 아래의 링크에서 다운로드 받을 수 있습니다.
https://www.comfy.org/download

2-5. ComfyUI에서 제작한 LoRA를 이용해서 이미지 생성하기
갤러리 보기
Search
Archiving
갤러리 보기
표
Search

테스트 결과
360 이미지를 생성하고 그라운드에 해당하는 부분은 DepthMap을 생성해서 바닥의 지오메트리를 디스플레이스먼트로 살짝 튀어나오게 해서 약간의 3D 효과를 내게 한 것 같다. 360 파노라마를 생성하는 Blockade Lab(https://www.blockadelabs.com/)과의 차별점은 이 부분인 것 같다. 인터랙티브하게 움직이는 것은 카메라와 환경구와 바닥이 충돌하지 않는 범위에서만 움직일 수 있다. 프로모션의 영상은 그것을 3D 작업 환경에 가지고 가서 물리나 시뮬레이션을 돌리는 예시를 보여준 것 같다.
소개
“Hunyuan3D 월드 모델 1.0출시 및 오픈 소스로 공개. 이 모델을 사용하면 단 한 문장이나 이미지만으로도 몰입감 넘치고 탐험 가능하며 인터랙티브한 3D 세계를 제작할 수 있다. 업계 최초의 오픈 소스 3D 월드 생성 모델로, CG 파이프라인과 호환되어 완벽한 편집 및 시뮬레이션이 가능합니다. 게임 개발, VR, 디지털 콘텐츠 제작 등에 혁신을 가져올 것이다.”
Hunyuan3D World Model
List
Table
갤러리 보기
Search
Load more
List
Table
갤러리 보기
Search
리스트 보기
Gallery
Search
List
Table
Gallery view
Search
List
Table
Gallery view
Search
Load more
































