FigCraft
TECHNOLOGY
引擎拆解

支撑「图像 coding agent」的引擎

首页说它会自己干活。这一页,告诉你它怎么做到的。底层是一个 coding agent 式的推理引擎两层上下文压缩、模型自动降级链、结构化视频线、三层一致性锚 —— 让任何模型,哪怕 Qwen,都能在你本地稳定交付整套视觉。

77
Tools
工具
13
Categories
类别
10
Engineering
工程纵深
200
Rounds
单任务推理上限
100k
Context
tokens 预算
§ CAPABILITIES
01Image Orchestration

图片编排能力

一句话,排出一整套风格统一、可继续编辑的视觉

智能体把需求拆成多张子图,在同一块分层画布上并行生成、统一构图与色调,再逐张落到可回退的图层工程里 —— 不是一次性出图,而是把整套电商 / 品牌物料编排好交付。

实时演示 · 智能体在分层画布上编排一整套电商视觉
  • ·分层画布:每张图都是非破坏性图层工程,蒙版 / 调整 / 局部随时回退
  • ·成套一致:一款货 → 主图 / 详情 / 多色变体,主体与风格跨图统一
  • ·多模型择优:按子任务在 16 个模型间自动选型,不用记参数
  • ·本地直读直写:读项目素材、成片写回硬盘,不强制上云
02Video Generation

视频生成能力

静帧长成短片 —— 逐镜可控的图生视频时间线

把编排好的画面直接拉进视频线:每个镜头的首帧、尾帧、参考片、配音都由智能体填好并可视编辑,沿时间线串成一支完整的品牌短片 —— 全程非黑盒,逐镜可改。

实时演示 · 视频线逐镜填充首尾帧与参考片,串成品牌短片
  • ·图生视频:从成套静帧直接生成镜头,主体与风格延续
  • ·逐镜可控:首帧 / 尾帧 / 参考片 / 配音逐个镜头独立设定
  • ·时间线编排:多镜头拼接成片,节奏与转场可调
  • ·模型调度:Veo / Seedance 等视频模型按镜头需求自动选用
03Local Operation

本地操作能力

不止生成 —— 还能直接在你本机读写文件、改代码、跑命令

智能体不是只会出图的聊天框:它能列目录、读文件、grep 定位、改代码、新建目录、删旧脚本、跑构建并做类型检查 —— 全部在你本机完成,破坏性操作前先列清单等你确认,素材与代码不离开本地。

实时演示 · 智能体在你本机读取 / 改写 / 删除文件并跑构建,全程不上云
  • ·文件系统:列目录 / 读写 / 编辑 / 新建目录 / 删除,直达你的工作区
  • ·代码与检索:glob / grep 定位,改完跑 LSP 类型检查兜底
  • ·Shell:执行构建、批处理等命令,产物写回本地目录
  • ·权限分级:删除 / 改写等破坏性操作先确认,不擅自动手
§ UNDER THE HOOD

想看底层?都在技术文档里

77 个工具按 13 类划分、权限按风险三级分级,加上循环推理、电商主体一致性、崩溃零损失任务系统等 10 项工程纵深——完整的实现细节都整理在技术文档里。

查看技术文档
§ IMAGE AGENT

这就是图像智能体。

不是 prompt 级,是任务级。用户描述需求,Agent 自己拆解、调度、执行、交付。从 1 张产品图到一整套品牌视觉系统,从单个 SKU 到 30 个颜色的多变体一致性,从静图到视频——全程不需要你切工具、记参数、调模型。

不是聊天框,是工作站。77 个工具、16 个顶级模型、本地素材直读、成片写回硬盘、敏感品牌图零云端留存。这是为电商图像生产场景从零打磨的图像智能体。