Xiaolin AI Lab LogoXiaolin AI Lab
模型选型

图像生成模型

图像生成模型介绍和使用指南

图像生成模型

图像生成模型能够根据文本描述创建图像。

主流模型

DALL-E 3

OpenAI 的图像生成模型,特点:

  • 高质量图像输出
  • 理解复杂描述
  • 内置安全过滤

Stable Diffusion

开源图像生成模型:

  • 可本地部署
  • 高度可定制
  • 活跃的社区

Midjourney

艺术风格强的生成模型:

  • 独特的艺术风格
  • Discord 接口
  • 高质量输出

使用场景

场景推荐模型
产品设计DALL-E 3
艺术创作Midjourney
批量生成Stable Diffusion

API 示例

const response = await openai.images.generate({
  model: 'dall-e-3',
  prompt: 'A cute cat wearing a space suit',
  size: '1024x1024',
  quality: 'hd',
});

console.log(response.data[0].url);

Prompt 技巧

好的图像 Prompt 应该包含:

  • 主体描述
  • 风格说明
  • 光线/颜色
  • 构图指导