模型选型

图像生成模型

图像生成模型介绍和使用指南

图像生成模型

图像生成模型能够根据文本描述创建图像。

主流模型

DALL-E 3

OpenAI 的图像生成模型，特点：

高质量图像输出
理解复杂描述
内置安全过滤

Stable Diffusion

开源图像生成模型：

可本地部署
高度可定制
活跃的社区

Midjourney

艺术风格强的生成模型：

独特的艺术风格
Discord 接口
高质量输出

使用场景

场景	推荐模型
产品设计	DALL-E 3
艺术创作	Midjourney
批量生成	Stable Diffusion

API 示例

const response = await openai.images.generate({
  model: 'dall-e-3',
  prompt: 'A cute cat wearing a space suit',
  size: '1024x1024',
  quality: 'hd',
});

console.log(response.data[0].url);

Prompt 技巧

好的图像 Prompt 应该包含：

主体描述
风格说明
光线/颜色
构图指导

LLM 大语言模型

大语言模型介绍和使用指南

On this page

图像生成模型

Stable Diffusion