模型选型
图像生成模型
图像生成模型介绍和使用指南
图像生成模型
图像生成模型能够根据文本描述创建图像。
主流模型
DALL-E 3
OpenAI 的图像生成模型,特点:
- 高质量图像输出
- 理解复杂描述
- 内置安全过滤
Stable Diffusion
开源图像生成模型:
- 可本地部署
- 高度可定制
- 活跃的社区
Midjourney
艺术风格强的生成模型:
- 独特的艺术风格
- Discord 接口
- 高质量输出
使用场景
| 场景 | 推荐模型 |
|---|---|
| 产品设计 | DALL-E 3 |
| 艺术创作 | Midjourney |
| 批量生成 | Stable Diffusion |
API 示例
const response = await openai.images.generate({
model: 'dall-e-3',
prompt: 'A cute cat wearing a space suit',
size: '1024x1024',
quality: 'hd',
});
console.log(response.data[0].url);Prompt 技巧
好的图像 Prompt 应该包含:
- 主体描述
- 风格说明
- 光线/颜色
- 构图指导