探索我们的AI模型集合,用于图像和视频生成。
小红书 FireRed 团队开源的指令驱动AI图像编辑模型 — 覆盖添加、移除、替换、背景、风格化、文字、修复、人像妆容、多图融合、虚拟试穿10大编辑能力。基于 Diffusion Transformer 架构,原生支持中英双语指令。在 FireRed Image Edit AI图像生成器 中免费体验!
Google 最新AI图像模型(Gemini 3.1 Flash Image)— Pro级画质,Flash级速度。比 GPT Image 快40-50%、便宜50%,支持4K输出、Google搜索增强和增强文字渲染。在 GPT Image 中免费生成无水印AI图像!
支持 4K 超高清输出和完美提示词理解的专业级 AI 图像生成器
字节跳动革命性多模态AI图像模型 — 全球首款支持联网实时搜索和深度推理。原生4K输出、94%+文字准确率、精准编辑。在 GPT Image 中生成AI图像!
专业级照片级真实图像生成,细腻的光影纹理与自然的人体表情
支持最多16张参考图与3000字符长提示词,适合高一致性图像生成、品牌物料和复杂场景创作
旗舰级视觉生成模型,拥有极致的自然语言理解力与光影表现力
具有卓越细节和创意灵活性的高级AI图像生成
快速多功能的 AI 图像生成,满足日常创意需求
xAI 最新AI图片生成器,支持实时网页搜索获取精准视觉参考、多轮对话式编辑。用文字创建图片,用自然语言精修,通过对话迭代优化。
The compact 9B parameter variant of Flux 2 — optimized for speed and efficiency without compromising quality. Create stunning AI images free with no watermark in Nano Banana Pro free AI image generator !
Google's accessible AI image model — lightweight, fast, and free. Create beautiful images from text descriptions with no watermark. Start generating in Nano Banana Pro free AI image generator !
Zhipu AI's GLM image generation model — bilingual Chinese-English prompt understanding with high-fidelity output. Create beautiful AI images free with no watermark in Nano Banana Pro free AI image generator !
具备原生音频生成和真实物理渲染能力的专业级 AI 视频生成器
OpenAI最先进的通用视频生成模型——从文本提示词和图像创建高质量视频,具备逼真的物理效果、富有表现力的角色和电影级视觉叙事。在 FireRed修图 体验。
阿里巴巴下一代多模态视频模型,原生支持音视频协同生成。一个统一模型,四种生产力场景——文本、图像、多图参考与视频原位编辑。在 FireRed 修图 免费体验。
阿里巴巴先进的视频生成模型,具备卓越的质量和多样化风格支持。在 FireRed修图 体验。
快手前沿的AI视频生成模型——从文字和图像提供卓越的运动质量、电影级镜头语言和惊艳的视觉输出。在 FireRed修图 免费创建专业级视频!
快手前沿的AI视频生成模型——从文字和图像提供卓越的运动质量、电影级镜头语言和惊艳的视觉输出。在 FireRed修图 免费创建专业级视频!
具备电影级画质和创意控制的专业 AI 视频生成
字节跳动新一代AI视频模型,搭载革命性的 @-reference 系统。将文字、图片、视频片段和音频融合在单一提示词中。原生音视频同步、V2V编辑、最高2K分辨率30fps输出——全部在统一的生成流程中完成。
ByteDance's fast AI video generation model optimized for speed. Generate high-quality videos in less time with the efficiency-focused variant of Seedance 2.
xAI前沿的图像生成模型,具备创意性的照片级真实AI图像生成能力。在 FireRed修图 免费体验。
xAI 推出的快速文本转视频和图像转视频生成模型,由 Aurora 引擎驱动。通过自然语言提示词创建带同步音频的短视频片段——只需数秒,而非数分钟。集成实时网络数据,确保内容及时且相关。
Google 的多模态创作模型 — Gemini 的推理能力与生成式媒体系统的结合。通过自然语言从文本、图片、视频或音频生成和编辑视频,每次编辑都基于上一次的结果。使用 FireRed Image Edit 免费体验。