道路選擇:Stable Diffusion、Midjourney、DALL-E 2、NovelAI

道路選擇:Stable Diffusion、Midjourney、DALL-E 2、NovelAI

AI 生圖服務很多。 應該選擇哪一個入手?我自己在過去一個月,有機會各自花費約 1,000~2,000 元的預算,每一個服務都認真用過。可以選擇的範圍包含:

線上服務

Stable Diffusion(DreamStudio):

  • 最完整的服務之一
  • 成長最快:依照其開源架構以及成長速度,我確信會是三個月後最強大的服務。
  • UI/UX 介面設計、不能儲存相片稍微令人火大
  • 運作不佳的色情阻擋,會讓正常內容有時無法顯示。
DreamStudio
DreamStudio by Stability AI is a new AI system powered by Stable Diffusion that can create realistic images, art and animation from a description in natural language.

DALL-E 2:

  • 最老牌,最成熟,最容易上手,假如想要入門,我今天會最推薦的服務
  • 最完整的服務之二
  • 最有道德感的服務(管最多,不可用人名)
  • 有呼叫電影場景的酷功能
  • 我在使用上還沒有遇過色情阻擋,我猜測從資料來源就嚴苛過濾了。
DALL·E 2
DALL·E 2 is a new AI system that can create realistic images and art from a description in natural language.

Midjourney

  • 最漂亮的服務
  • 有獨樹一格的社群聊天操作介面
  • 超慢,等待時間超長
  • 因為社群性質,是最上癮、最不缺乏靈感的服務
  • 運作不佳的色情阻擋,會讓正常內容造成有時無法顯示。
Midjourney
An independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species.

Novel AI

  • 漫畫、插畫、卡通人物、人像、人臉、線條藝術最好
  • 有數量折扣,因此最便宜
  • 相較起來,最沒有道德感服務(直接輸入仍在世漫畫、插畫、卡通人物創作者)
  • 沒有色情阻擋
  • 因為資料來源包含色情內容,所以輸出的東西都偏向色情。從輕微的性暗示,到口味重鹹的色情,使用上到有一點困擾的地步。
NovelAI - The GPT-powered AI Storyteller
GPT-powered AI Storyteller. Driven by AI, construct unique stories, thrilling tales, seductive romances, or just fool around. Anything goes!

Stable Diffusion 技術,個人可自行架設的服務

DiffusionBee

  • Mac 一鍵安裝。有包含 Out-painting、In-painting 的功能。
DiffusionBee - Stable Diffusion GUI App
DiffusionBee is the easiest way to run Stable Diffusion locally on your M1 Mac. Comes with a one-click installer.

Stable Diffusion(InvokeAI、AUTOMATIC1111):

  • 我自已花了五小時後,仍然沒有架設成功
  • 個人可自行架設的 Stable Diffusion 服務
  • 因為機器規格的關係,通常比較慢
  • 最自由的服務:使用者可把色情阻擋關掉、或著使用各種其他非法資料模型來源
  • 超多進階功能
GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI
Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub.
GitHub - invoke-ai/InvokeAI: This version of Stable Diffusion features a slick WebGUI, an interactive command-line script that combines text2img and img2img functionality in a “dream bot” style interface, and multiple features and other enhancements. For more info, see the website link below.
This version of Stable Diffusion features a slick WebGUI, an interactive command-line script that combines text2img and img2img functionality in a "dream bot" style interface, and multipl...