스테이블디퓨전의 Flux 모델의 등장 이후 대세로 등극하며 주도하고 있지만 기본적으로 높은 사양의 그래픽카드가 필요하다게 문제였습니다. Flux-Dev 의 용량이나 속도의 문제는 GGUF , NF4 등 튜닝모델이나 스텝수를 죽일 수 있는 로라모델 등으로 일정부분 극복할 수 있었습니다만 Flux용 Control-net 이나 IP-Adapter 등의 응용노드를 동시에 운용하는데는 한계가 있었습니다. 때문에 비슷한 효과를 내줄 수 있는 노드들이 등장했는데 PuLID 은 IP-Adapter 와 비슷한 형태로 인물의 일관성을 유지시켜주는 노드입니다.
사실 PuLID 는 발표된지 두어달정도 됐었는데 최근까지 Comfy UI 정식지원이 아니여서 설치가 복잡했었습니다. 현재는 Comfy UI 상에서 쉽게 적용할 수 있긴 한데 아직 Comfy UI 3.10대 버전에선 실행에 문제가 있는 모양입니다. 업데이트를 통해 해결이 되긴 하겠지만 이래저래 꽤 까다로워요 ^^;;;
글의 첫 사진의 이미지를 PuLID 를 통해 적용시켜 생성한 이미지들입니다. 적용수치가 높을수록 강하게 작동하는데 높은 수치의 경우 인물의 얼굴 방향까지 그대로 유지합니다. 여러장의 이미지를 생성해도 대부분 얼굴방향과 형태는 같게 생성됩니다.
당연하겠지만 적용수치를 낮추면 인물의 일관성이 다소 떨어집니다. 그래도 비교적 프롬프트만으로 생성되는 것에 비한다면 인물의 생성폭이 확실히 좁혀집니다. 특징적인 면을 일정부분 잡아주는 것 같습니다.
머리와 의상 등의 스타일 등을 비슷하게 유지하면 당연히 훨씬 효과적이지만 전혀 다른 분위기를 가진 위의 이미지와 아래의 이미지에서 같은 인물이라고 보기엔 무리가 있겠구나 싶습니다만 비슷한 느낌을 유지시켜주고 있습니다. 좀 더 개성적인 인물이라면 분위기가 다르더라도 충분히 인물의 일관성을 유지하는데 좋을 것 같아요.
PuLID 는 다소 골치아프게 만들었던 설치과정이 아니라면 Flux 용 Controlnet 이나 Flux-fill 등에 비해서 가볍고 생성시간에 영향을 덜 준다는게 최고의 장점입니다. 이미지 한장으로 쉽게 인물의 특징을 가져올 수 있고 프롬프트를 통해 분위기를 더해줄 수 있으니 편리합니다. 다만 생성된 이미지 전체의 영향을 주는 느낌적인 느낌이 있습니다;;; 같은 상황에서 생성해도 PuLID 를 적용한 이미지들은 틀에 갇힌다는 느낌을 줄 때가 있습니다. 아주 약간이지만 그냥 그런 느낌적인 느낌이^^;;;
유용한 노드인만큼 사용해보시면 좋을 것 같습니다.
그럼 다음에 뵐께요 ^^
'AI comfy UI' 카테고리의 다른 글
[node] 엄청난 속도를 자랑하는 LTX Video 그리고 STG (0) | 2024.12.29 |
---|---|
[node] 더 나은 디테일로 생성해보자 Detail-Daemon !! (1) | 2024.11.18 |