며칠전 Flux 이미지 생성은 물론 LTX-V 와 Hunyuan Video 의 비디오생성 속도를 향상시킬 수 있는 WaveSpeed 라는 노드의 공개가 꽤 큰 관심을 불러일으켰습니다. 이미지/영상의 품질은 뛰어나지만 그만큼 많은 시간이 소요되는 Flux / Hunyuan Video 모델의 사용자들에겐 희소식이였습니다. 저 역시 주로 Flux dev 모델의 GGUF 를 사용하는데 Lora 까지 추가해서 생성하면 1920 x 1080 기준으로 거의 600초, 10분에 가까운 시간이 걸립니다. 이 시간동안은 그저 기다리는 수밖엔 없는데 품질을 어느정도 유지한채 시간을 단축시켜 줄 수 있는 노드라니 Flux 사용자들은 관심을 가질 수 밖에 없을 겁니다.
이 WaveSpeed 노드 이전에 Teacache 라는 비슷한 효과의 노드가 먼저 공개된 것으로 알고 있었는데 WaveSpeed 에 비해 품질을 일정하게 생성하기 위한 사용이 WaveSpeed 에 비해 조금 어려운 부분이 있는 것 같습니다. 해외의 사용자들의 경우 두 노드 중 자신에게 더 맞는 방식을 선택해서 사용하고 있는 듯 해요. 둘다 좋은 성능을 보여주고 있습니다.
제가 집적 생성해보며 비교해본 시간차이입니다. 적용 후 거의 1/3 정도로 생성시간이 줄어든 모습니다. 많은 유튜버분들이 해당 노드를 시험해보면서 보여준 시간차이가 대부분이 절반정도였는데 그보다도 더 낮은 시간이 나온다는데에 놀랐습니다. 이럴거면 언능 나오지 그랬니 TㅅT
하지만 생각보다 이미지의 품질에 있어선 확실히 차이가 있습니다. 전체적인 색과 빛의 표현에서 꽤 차이를 보입니다. 색감이 차가워지고 이미지가 거칠어져 마치 Guidance 수치를 낮춘 것 같은 느낌이 드는데요. WaveSpeed 의 작동방식이 생성시 스텝과 스텝사이의 노이즈제거량의 차이가 적을때 해당 스텝의 처리과정을 건너뛰는 방식이라 인물이나 사물의 묘사가 큰 차이를 보이진 않지만 색과 빛처리같은 세밀한 부분이 다소 차이를 보이는 것 같습니다. 속도의 차이를 생각하면 원하는 방향으로 생성이미지만들어가는데 충분히 도움이 될만한 것 같습니다. Flux dev 와 Schnell 같은 차이는 아니기에 프롬프트의 초기 이미지들을 확인하고 수정하는데엔 무리가 없습니다.
설치는 간편한 편이지만 유튜브를 통해 알려졌을땐 Triton 이라는 추가적으로 설치해야하는 프로그램때문에 다양한 이야기가 나왔었는데요. 윈도우에선 이 Triton 이라는 프로그램의 설치 자체가 애매해서 WaveSpeed 의 작동이 안되는게 아니냐는 말들이 있었는데 결과적으론 위 사진의 Compile Model+ 라는 노드를 사용하지 않으면 별다른 상관은 없는 것 같습니다. 따라서 Apply First Block Cache 라는 노드만 연결하고 수치만 조정해서 사용하시면 됩니다.
residual_diff_threshold 의 수치를 0.12 - 0.15 정도로 설정하시는게 품질을 유지하면서 속도를 올릴 수 있는 최적의 설정치인 것 같습니다. 그 이상의 경우 원하는 인물이나 사물이 정확하게 표현되질 못하는 경우가 많습니다. 직접 사용해보시면서 확인해보시면 될 것 같아요. 아래의 링크에 각 모델별 워크플로우도 제공하고 있으니 다운로드 받아서 살펴보시는 것도 좋을 것 같네요. 이상 WaveSpeed 에 대한 소개였습니다.
https://github.com/chengzeyi/Comfy-WaveSpeed
'AI comfy UI' 카테고리의 다른 글
[node] 인물의 일관성을 유지하기 위한 PuLID (0) | 2025.01.06 |
---|---|
[node] 엄청난 속도를 자랑하는 LTX Video 그리고 STG (0) | 2024.12.29 |
[node] 더 나은 디테일로 생성해보자 Detail-Daemon !! (1) | 2024.11.18 |