스테이블 디퓨전

이 문서는 실용 문서입니다.

이 문서는 실제 내용을 다루고 있는 실용 문서입니다. 사실에 기반하지 않은 수정이나 왜곡은 불가합니다.

그림 인공지능 소프트웨어
Artbreeder	DALL·E	Dream by WOMBO	Firefly
Gaugan2	Midjourney	NovelAI Image generator	Stable Diffusion

스테이블 디퓨전 Stable Diffusion
분류	그림 인공지능, 오픈 소스
개발사	Stability AI
출시일	2022년 8월 22일
버전	2.1
링크

개요

2022년 8월 Stability AI라는 오픈소스 라이선스로 배포한 text-to-image 인공지능 모델이다. 2022년 8월 22일 출시했다.

상세

Stable Diffusion은 독일 뮌헨 대학교 Machine Vision & Learning Group (CompVis) 연구실의 "잠재 확산 모델을 이용한 고해상도 이미지 합성 연구"를 기반으로 Stability AI와 Runway ML 등의 지원을 받아 개발되었다.

Stability AI는 방글라데시계 영국인 에마드 모스타크가 만든 회사로, SD에 방대한 LAION-5B 데이터베이스를 학습시킬 수 있도록 컴퓨팅 자원을 제공하였다. OpenAI의 DALL-E 2나 구글의 Imagen과 같은 기존 text-to-image 모델들과는 다르게 컴퓨터 사용 리소스를 대폭 줄여 4GB 이하의 VRAM을 가진 컴퓨터에서도 돌릴 수 있다.

또한 개발 비용이 클 것임에도 불구하고^[1] 오픈 소스로 공개해서 일반인들도 사용을 할 수 있다.

그림 인공지능의 시대를 연 인공지능이며, 오픈소스로 공개된 덕분에 해당 인공지능을 기반으로 하는 AI 이미지 서비스 기능이 우후죽순으로 늘어나고 있다.

NovelAI와의 차이점

유사하지만 더 디테일하게 설정을 건드릴 수 있다는 점에서 차이가 있고, 가동방법은 NAI보다는 어려운 편이다.

주소

[1]

조언

POSITIVE에는 보통 simple background, best quality, upper body face through torso, for male, black hair 등의 코드를 넣는 것이 좋다. (물론 색깔, 성별 이런 건 예시)
NEGATIVE에는 (worst quality, normal quality, low quality:1.4), lowres, blurry를 권장한다.

↑ SD AI 개발을 위해 학습에 들인 비용은 약 $600,000 정도로 추정된다.

[1] SD AI 개발을 위해 학습에 들인 비용은 약 $600,000 정도로 추정된다.

[1]