본문으로 이동

플럭스 (텍스트-이미지 모델)

위키백과, 우리 모두의 백과사전.
플럭스
원저자Black Forest Labs
개발자Black Forest Labs
발표일2024년 8월
안정화 버전
Flux.1 Kontext (model series)[1] / 2025년 5월 29일
저장소
종류텍스트-이미지 모델
라이선스
웹사이트bfl.ai

플럭스(Flux, FLUX.1으로도 알려짐)는 독일 프라이부르크임브라이스가우에 본사를 둔 Black Forest Labs (BFL)가 개발한 텍스트-이미지 모델이다. Black Forest Labs는 스태빌리티 AI의 전 직원들이 설립했다. 다른 텍스트-이미지 모델과 마찬가지로, 플럭스는 생성형 이미지프롬프트라고 불리는 자연어 설명에서 생성한다.

역사

[편집]

Black Forest Labs (BFL)는 스태빌리티 AI의 전 직원인 로빈 롬바흐, 안드레아스 블라트만, 패트릭 에서가 2024년에 설립했다.[2][3] 세 명의 창립자 모두 이전에 뮌헨 대학교에서 비외른 옴머의 연구 조교로 인공지능 이미지 생성에 대한 연구를 수행했다.[4][5][6] 이들은 2022년에 이미지 생성에 대한 연구 결과를 발표했고, 이 연구는 스테이블 디퓨전을 탄생시켰다.[6][7] BFL의 투자자로는 벤처 캐피탈 회사인 앤드리슨 호로위츠, 브렌던 이리베, 마이클 오비츠, 개리 탄, 그리고 블라드렌 콜툰이 포함되었다.[8] 이 회사는 초기 투자금으로 US$31 만 달러를 받았다.[9][10]

2024년 8월, 플럭스는 xAI가 개발한 그록 챗봇에 통합되었고, X (이전 트위터)의 프리미엄 기능의 일부로 제공되었다.[11][12][13][14] 그록은 나중에 2024년 12월에 자체 텍스트-이미지 모델인 오로라로 전환했다.[15]

2024년 11월 18일, 미스트랄 AI는 Le Chat 챗봇에 플럭스 프로가 이미지 생성 모델로 통합되었다고 발표했다.[16][17]

2024년 11월 21일, BFL은 기존 플럭스 모델 위에 사용하도록 설계된 편집 도구 모음인 플럭스.1 도구를 출시한다고 발표했다. 이 도구는 inpainting 및 outpainting을 위한 플럭스.1 필(Flux.1 Fill), 입력 이미지 및 프롬프트의 추출된 깊이 지도를 기반으로 하는 제어를 위한 플럭스.1 뎁스(Flux.1 Depth), 입력 이미지 및 프롬프트의 추출된 캐니 윤곽선을 기반으로 하는 제어를 위한 플럭스.1 캐니(Flux.1 Canny), 기존 입력 이미지 및 프롬프트 혼합을 위한 플럭스.1 리덕스(Flux.1 Redux)로 구성된다. 각 도구는 프로(Pro) 및 개발(Dev) 모델 모두에서 사용할 수 있다.[18][19]

2025년 1월, BFL은 엔비디아블랙웰 마이크로아키텍처의 파운데이션 모델로 플럭스 모델을 포함하기 위한 엔비디아와의 파트너십을 발표했다.[20] 또한 이 회사는 플럭스 생성 이미지의 맞춤화 및 파인 튜닝을 위해 설계된 Flux Pro Finetuning API의 출시와 콘텐츠 제작의 일부로 플럭스 프로(Flux Pro)를 사용하기 위한 독일 미디어 회사 Hubert Burda Media와의 파트너십을 발표했다.[21]

2025년 5월 29일, BFL은 텍스트와 이미지 모두를 사용하여 프롬프트를 입력할 수 있도록 하여 문맥 내 이미지 생성 및 편집을 가능하게 하는 모델 모음인 플럭스.1 콘텍스트(Flux.1 Kontext)를 발표했다.[22][23] 이와 함께 플럭스 모델을 테스트하기 위한 인터페이스인 BFL 플레이그라운드(BFL Playground)도 출시되었다.[22][23]

2025년 7월 31일, BFL은 Krea AI와 협력하여 개발한 모델인 플럭스.1 크레아 개발(Flux.1 Krea Dev)을 발표했다. 이 모델은 기존 텍스트-이미지 모델에 비해 더 나은 성능, 더 다양한 미학, 더 나은 사실감을 달성하도록 훈련되었다.[24]

모델

[편집]
플럭스.1 콘텍스트 프로(Flux.1 Kontext Pro)의 기존 이미지 수정 능력 시연
  • 왼쪽: AnimagineXL 4.0 (스테이블 디퓨전 XL 기반의 텍스트-이미지 모델)으로 생성되고 크리타로 후처리된 원본 이미지
  • 오른쪽: 플럭스.1 콘텍스트 프로로 수정된 이미지. 변경 사항: 여우 귀(kemonomimi) 추가, 왼팔 위치, 머리, 눈, 헤드폰, 재킷, 셔츠, 바지, 배경 색상

플럭스는 텍스트-이미지 모델 시리즈이다. 이 모델들은 120억 로 확장된 정류 흐름 트랜스포머 블록을 기반으로 한다.[8][25] 플럭스.1 모델은 다른 라이선스로 출시되었는데, Schnell(독일어로 빠르거나 신속하다는 뜻)은 아파치 라이선스 하의 오픈 소스 소프트웨어로, Dev는 비상업적 라이선스 하의 소스 입수 가능 소프트웨어로 (사용자는 BFL에서 Dev에 대한 자체 상업 라이선스를 얻을 수 있음), Pro는 사유 소프트웨어로 출시되었으며, 타사 사용자가 라이선스를 받을 수 있는 API로만 제공된다.[26][27] 사용자는 사용된 모델과 관계없이 생성된 출력물에 대한 소유권을 유지했다.[28][29]

이 모델들은 ComfyUI 및 Stable Diffusion WebUI Forge (Automatic1111 WebUI의 포크)와 같은 생성형 인공지능 사용자 인터페이스를 사용하여 온라인 또는 로컬에서 사용할 수 있다.[8][30]

향상된 주력 모델인 플럭스 1.1 프로(Flux 1.1 Pro)는 2024년 10월 2일에 출시되었다.[31][32] 11월 6일에는 두 가지 추가 모드가 추가되었는데, 제어 속도에 영향을 미치지 않으면서 4배 더 높은 해상도와 최대 4메가픽셀의 이미지를 생성할 수 있는 울트라(Ultra)와 스냅샷 스타일의 초현실적인 이미지를 생성할 수 있는 로(Raw) 모드이다.[33][34][35]

플럭스.1 콘텍스트는 문맥 내 이미지 생성 및 편집 기능을 갖춘 시리즈이다. 프로(Pro), 맥스(Max), 개발(Dev) 모델로 제공된다. 프로는 최고 품질 모델로, 프롬프트를 사용하여 기존 이미지를 반복적으로 수정할 수 있으며, 맥스는 생성 속도에 최적화되어 있다.[22] 개발은 플럭스.1 개발과 동일하게 비상업적 라이선스 하에 공개된 개방형 가중치 모델이다.[36]

플럭스와 관련된 텍스트-비디오 모델 SOTA는 2025년 June월 기준 개발 중이다.[8]

평가

[편집]

아르스 테크니카가 수행한 테스트에 따르면, 플럭스.1 개발과 플럭스.1 프로에서 생성된 출력물은 프롬프트 충실도 측면에서 DALL-E 3와 비교할 만하며, 사진 현실성은 미드저니 6과 거의 일치했고, 스테이블 디퓨전 XL과 같은 이전 모델보다 사람 손을 더 일관성 있게 생성했다.[37]

플럭스는 매우 사실적인 이미지 생성으로 비판을 받았다. 언론 보도에 따르면, 도널드 트럼프가 총을 들고 포즈를 취한 이미지부터 충격적인 장면까지 묘사되었으며, 이는 플럭스 모델의 윤리적 함의에 대한 논의를 촉발했다.[4][13]

모델 출시 후, 소셜 미디어 플랫폼 X는 플럭스 생성 이미지로 넘쳐났다.[38][39] Black Forest Labs는 모델 훈련에 사용된 데이터에 대한 정확한 세부 정보를 제공하지 않았다.[33] 아르스 테크니카는 플럭스가 웹 스크래핑을 통해 무단으로 수집된 대량의 이미지 컬렉션을 기반으로 하며, 이는 잠재적인 법적 결과를 초래할 수 있는 논란의 여지가 있는 관행이라고 의심했다.[37][40]

일본 기술 뉴스 웹사이트 Gigazine이 플럭스.1 콘텍스트에 대해 수행한 테스트에 따르면, 이 모델 시리즈는 영어에 대한 이해도가 높고 사용자가 제공한 프롬프트에 따라 이미지를 사실적인 스타일에서 애니메이션 스타일로 쉽게 변환할 수 있지만, 일본어 이해 능력은 상당히 떨어진다.[41]

가용성

[편집]

자사 웹사이트의 공식 BFL 플레이그라운드 외에도,[42] 플럭스 모델은 창의적 및 전문적 용도를 위해 다양한 타사 플랫폼을 통해서도 널리 사용할 수 있다. 여기에는 허깅 페이스[43] 및 Replicate와 같은 플랫폼의 저장소가 포함된다.[44]

각주

[편집]
  1. “Introducing FLUX.1 Kontext and the BFL Playground”. 《Black Forest Labs》. 2025년 5월 29일. 2025년 6월 10일에 확인함. 
  2. Killian, Nicolas (2024년 8월 27일). “Black Forest Labs: Sie sind ein Teil von jener Kraft” (독일어). 《디 차이트》. ISSN 0044-2070. 2024년 10월 4일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  3. Growcoot, Matt (2024년 8월 5일). “AI Image Generator Made by Stable Diffusion Inventors on Par With Midjourney and DALL-E” (영어). 《PetaPixel. 2024년 11월 17일에 확인함. 
  4. “Black Forest Labs unter Beschuss: Schockierende KI-Bilder sorgen für…” (독일어). 《AlleAktien》. 2024년 8월 22일. 2024년 11월 17일에 확인함. 
  5. Hermes, Ann Kathrin (2024년 8월 8일). “Black Forest Labs: KI-Tools aus dem Schwarzwald” (독일어). 《trend.at》. 2024년 11월 17일에 확인함. 
  6. Schwär, Hannah (2024년 8월 15일). “Black Forest Labs: Die Schwarzwald-KI, auf die Elon Musk setzt” (독일어). 《Capital.de. 2024년 11월 17일에 확인함. 
  7. “High-Resolution Image Synthesis with Latent Diffusion Models” (미국 영어). 《Computer Vision & Learning Group》. 2024년 11월 16일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  8. “Announcing Black Forest Labs” (미국 영어). 《Black Forest Labs》. 2024년 8월 1일. 2024년 11월 17일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  9. Steinschaden, Jakob (2024년 8월 12일). “Black Forest Labs: 31 Mio. Dollar für Herausforderer von OpenAI und Midjourney” (독일어). 《Trending Topics》. 2024년 8월 28일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  10. Nuñez, Michael (2024년 8월 1일). “Stable Diffusion creators launch Black Forest Labs, secure $31M for FLUX.1 AI image generator” (미국 영어). 《벤추어비트》. 2024년 10월 8일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  11. Puscher, Frank. “Generative AI. Black Forest Labs und Flux.1: Vom Superstar zum Buhmann in fünf Tagen” (독일어). 《MEEDIA》. 2024년 9월 27일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  12. Bomke, Luisa. “Flux.1 – ein deutscher KI-Bildgenerator dreht mit Grok frei” (독일어). 《Handelsblatt》. 2024년 8월 30일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  13. Weatherbed, Jess (2024년 8월 14일). “xAI's new Grok-2 chatbots bring AI image generation to X” (영어). 《더 버지》. 2024년 11월 17일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  14. Metz, Rachel (2024년 8월 21일). “This Tiny Startup Is Helping Musk's Grok With Image Generation” (영어). 《블룸버그 뉴스. 2024년 11월 19일에 확인함. 
  15. Davis, Wes (2024년 12월 7일). “X gives Grok a new photorealistic AI image generator” (영어). 《The Verge》. 2024년 12월 12일에 원본 문서에서 보존된 문서. 2024년 12월 10일에 확인함. 
  16. “Mistral has entered the chat” (미국 영어). 《미스트랄 AI》. 2024년 11월 18일. 2024년 12월 11일에 확인함. 
  17. Franzen, Carl (2024년 11월 18일). “Mistral unleashes Pixtral Large and upgrades Le Chat into full-on ChatGPT competitor” (미국 영어). 《VentureBeat》. 2024년 12월 11일에 확인함. 
  18. “Introducing FLUX.1 Tools” (미국 영어). 《Black Forest Labs》. 2024년 11월 21일. 2024년 11월 26일에 원본 문서에서 보존된 문서. 2024년 12월 13일에 확인함. 
  19. Bastian, Matthias (2024년 11월 22일). “Black Forest Labs expands FLUX.1 with four new AI tools for image editing” (미국 영어). 《The Decoder》. 2024년 11월 22일에 원본 문서에서 보존된 문서. 2024년 12월 15일에 확인함. 
  20. Takahashi, Dean (2025년 1월 7일). “Nvidia unveils AI foundation models running on RTX AI PCs” (미국 영어). 《VentureBeat》. 2025년 1월 9일에 원본 문서에서 보존된 문서. 2025년 1월 19일에 확인함. 
  21. Franzen, Carl (2025년 1월 16일). “You can now fine-tune your own version of AI image maker Flux with just 5 images” (미국 영어). 《VentureBeat》. 2025년 1월 24일에 원본 문서에서 보존된 문서. 2025년 1월 19일에 확인함. 
  22. “Introducing FLUX.1 Kontext and the BFL Playground”. 《Black Forest Labs》. 2025년 5월 29일. 2025년 6월 29일에 원본 문서에서 보존된 문서. 2025년 6월 10일에 확인함. 
  23. David, Emilia (2025년 5월 29일). “FLUX.1 Kontext enables in-context image generation for enterprise AI pipelines” (미국 영어). 《VentureBeat》. 2025년 6월 2일에 원본 문서에서 보존된 문서. 2025년 6월 10일에 확인함. 
  24. “FLUX.1 Krea [dev]: An ‘Opinionated’ Text-to-Image Model” (영어). 《Black Forest Labs》. 2025년 7월 31일. 2025년 8월 2일에 원본 문서에서 보존된 문서. 2025년 8월 2일에 확인함. 
  25. “black-forest-labs/FLUX.1-dev · Hugging Face” (미국 영어). 《Hugging Face》. 2025년 4월 19일. 2025년 4월 19일에 확인함. 
  26. “Get Flux” (미국 영어). 《Black Forest Labs》. 2024년 11월 16일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  27. Wiggers, Kyle (2024년 10월 3일). “Black Forest Labs, the startup behind Grok's image generator, releases an API” (미국 영어). 《테크크런치》. 2024년 10월 4일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  28. “flux/model_licenses/LICENSE-FLUX1-dev at main · black-forest-labs/flux” (영어). 《GitHub》. 2025년 6월 27일에 원본 문서에서 보존된 문서. 2025년 6월 27일에 확인함. 1a. “Derivative” means any (i) modified version of the FLUX.1 [dev] Model (including but not limited to any customized or fine-tuned version thereof), (ii) work based on the FLUX.1 [dev] Model, or (iii) any other derivative work thereof. For the avoidance of doubt, Outputs are not considered Derivatives under this License." "2d. Outputs. We claim no ownership rights in and to the Outputs. You are solely responsible for the Outputs you generate and their subsequent uses in accordance with this License. You may use Output for any purpose (including for commercial purposes), except as expressly prohibited herein. You may not use the Output to train, fine-tune or distill a model that is competitive with the FLUX.1 [dev] Model or the FLUX.1 Kontext [dev] Model. 
  29. “API Agreement - BFL Docs (Pro)”. 《Black Forest Labs》. 2024년 8월 1일. 2024년 10월 3일에 원본 문서에서 보존된 문서. 2024년 11월 18일에 확인함. Output. Company claims no ownership rights in and to the Outputs, and Developer and Users may use the Output for their own personal or commercial purposes, subject to any restrictions set forth herein or in the Flux Service Terms. For the avoidance of doubt, Outputs do not include any components of the Flux API or the Flux AI model, such as its weights or parameters. 
  30. 田口和裕 (2024년 8월 18일). “話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6)” (일본어). 《ASCII.jp》. 아스키 미디어 웍스. 2024년 11월 21일에 확인함. 
  31. “Announcing FLUX1.1 [pro] and the BFL API”. 《Black Forest Labs》. 2024년 10월 2일. 2024년 11월 17일에 확인함. 
  32. Franzen, Carl (2024년 10월 3일). “Black Forest Labs releases Flux 1.1 Pro and an API” (미국 영어). 《VentureBeat》. 2024년 11월 17일에 확인함. 
  33. Growcoot, Matt (2024년 11월 7일). “Flux AI Introduces Raw Mode That 'Captures the Genuine Feel of Candid Photography' (영어). 《PetaPixel》. 2024년 11월 19일에 확인함. 
  34. Bastian, Matthias (2024년 11월 6일). “Flux 1.1 Pro AI image model adds "amateur" RAW photo mode and 4K image generation” (미국 영어). 《The Decoder》. 2024년 11월 17일에 확인함. 
  35. “Introducing FLUX1.1 [pro] Ultra and Raw Modes” (미국 영어). 《Black Forest Labs》. 2024년 11월 6일. 2024년 11월 12일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  36. “FLUX.1 Kontext [dev] - Open Weights for Image Editing” (영어). 《Black Forest Labs》. 2025년 6월 26일. 2025년 6월 28일에 원본 문서에서 보존된 문서. 2025년 6월 27일에 확인함. 
  37. Edwards, Benj (2024년 8월 2일). “FLUX: This new AI image generator is eerily good at creating human hands” (미국 영어). 《아르스 테크니카. 2024년 11월 17일에 확인함. 
  38. Zeff, Maxwell (2024년 8월 14일). “Meet Black Forest Labs, the startup powering Elon Musk's unhinged AI image generator” (미국 영어). 《TechCrunch》. 2024년 11월 17일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  39. Schwarzer, Matthias (2024년 8월 16일). “Drogen, Bomben und Gewalt: KI-Bildgenerator von Elon Musk zeigt alles – mit deutscher Technik” (독일어). 《RND.de》. 2024년 11월 17일에 확인함. 
  40. Künne, Christoph (2024년 8월 7일). “FLUX.1: Neuer KI-Bildgenerator” (독일어). 《DOCMA》. 2024년 8월 31일에 원본 문서에서 보존된 문서. 2024년 11월 17일에 확인함. 
  41. “I tried using the high-quality and high-speed image generation AI 'FLUX.1 Kontext', which supports text and image input and can generate both anime-style and live-action-style images.” (영어). 《GIGAZINE》. 2025년 5월 30일. 2025년 6월 13일에 확인함. 
  42. “FLUX Playground - Black Forest Labs” (영어). 《playground.bfl.ai》. 2025년 6월 10일에 확인함. 
  43. “Black Forest Labs on Hugging Face”. 《Hugging Face》. 2025년 2월 2일에 원본 문서에서 보존된 문서. 2025년 1월 5일에 확인함. 
  44. “Flux Collection on Replicate”. 《Replicate》. 2025년 1월 25일에 원본 문서에서 보존된 문서. 2025년 1월 5일에 확인함. 

외부 링크

[편집]