TECHNOLOGY
引擎拆解支撑「图像 coding agent」的引擎
首页说它会自己干活。这一页,告诉你它怎么做到的。底层是一个 coding agent 式的推理引擎:两层上下文压缩、模型自动降级链、结构化视频线、三层一致性锚 —— 让任何模型,哪怕 Qwen,都能在你本地稳定交付整套视觉。
77
Tools
工具
13
Categories
类别
10
Engineering
工程纵深
200
Rounds
单任务推理上限
100k
Context
tokens 预算
§ CAPABILITIES
01Image Orchestration
图片编排能力
一句话,排出一整套风格统一、可继续编辑的视觉
智能体把需求拆成多张子图,在同一块分层画布上并行生成、统一构图与色调,再逐张落到可回退的图层工程里 —— 不是一次性出图,而是把整套电商 / 品牌物料编排好交付。
实时演示 · 智能体在分层画布上编排一整套电商视觉
- ·分层画布:每张图都是非破坏性图层工程,蒙版 / 调整 / 局部随时回退
- ·成套一致:一款货 → 主图 / 详情 / 多色变体,主体与风格跨图统一
- ·多模型择优:按子任务在 16 个模型间自动选型,不用记参数
- ·本地直读直写:读项目素材、成片写回硬盘,不强制上云
02Video Generation
视频生成能力
静帧长成短片 —— 逐镜可控的图生视频时间线
把编排好的画面直接拉进视频线:每个镜头的首帧、尾帧、参考片、配音都由智能体填好并可视编辑,沿时间线串成一支完整的品牌短片 —— 全程非黑盒,逐镜可改。
实时演示 · 视频线逐镜填充首尾帧与参考片,串成品牌短片
- ·图生视频:从成套静帧直接生成镜头,主体与风格延续
- ·逐镜可控:首帧 / 尾帧 / 参考片 / 配音逐个镜头独立设定
- ·时间线编排:多镜头拼接成片,节奏与转场可调
- ·模型调度:Veo / Seedance 等视频模型按镜头需求自动选用
03Local Operation
本地操作能力
不止生成 —— 还能直接在你本机读写文件、改代码、跑命令
智能体不是只会出图的聊天框:它能列目录、读文件、grep 定位、改代码、新建目录、删旧脚本、跑构建并做类型检查 —— 全部在你本机完成,破坏性操作前先列清单等你确认,素材与代码不离开本地。
实时演示 · 智能体在你本机读取 / 改写 / 删除文件并跑构建,全程不上云
- ·文件系统:列目录 / 读写 / 编辑 / 新建目录 / 删除,直达你的工作区
- ·代码与检索:glob / grep 定位,改完跑 LSP 类型检查兜底
- ·Shell:执行构建、批处理等命令,产物写回本地目录
- ·权限分级:删除 / 改写等破坏性操作先确认,不擅自动手
§ UNDER THE HOOD
想看底层?都在技术文档里
77 个工具按 13 类划分、权限按风险三级分级,加上循环推理、电商主体一致性、崩溃零损失任务系统等 10 项工程纵深——完整的实现细节都整理在技术文档里。
查看技术文档