一个普通人0代码基础4天Vibe coding了一个小即梦【一】
一切的源头来自于我们的一个品牌的客户,希望尝试通过AI来做批量做一些原生感的素材作为新品上市前的社媒预热动作。
这部分一直都是我们想尝试的方向,批量生成素材(图/视频)进行投放/批量UGC发布来快速测试市场
于是我们就开始了第一批的测试
自动化+批量P图,评估下来觉得有这么几个选择
- Coze
- N8N/Make
- 飞书多维表格
- SD/comfy UI(这个直接pass了,首先是不会,再有就是有点杀鸡用牛刀的感觉)
解决问题的最快路径一定是飞书多维表格:
- 无需翻墙
- 公司内部的办公平台(权限/上手成本)
- 表格形态
- 没有学习成本,搭建好了之后就能自动运行,搭配一个运营同学来审核&重生
我大概花了20mins左右就把第一版本搭建出来了,又在上边加了一点花头
逻辑非常简单,就是B是新品,需要替换到A场景里,得到一张B的“原生感”UGC素材。
同时由于我们可能没有那么多原生感的背景,那么AI生背景也很重要,所以加了一个多个元素X乘出来的随机背景,效果也不错。整体使用的是即梦的seedream4.5的模型,也是第一次通过飞书的平台接入API token(体验非常丝滑)
但是有一些问题:
1. seedream4.5 对于复杂的文字,图案以及漫画风的人脸识别/迁移的精度比较低,有些图片的AI感比较重,客户通过率还是比较低
2. 解决第一个问题就需要用到nano banana pro,但是我其实是不知道怎么接API的,于是我就开始做调研,首先是如何将nano banana pro接入到飞书多维表格:
找到了一份现成模版,只需要自己更改API,就可以快速的上手使用了。
通过这个过程,我快速的了解到了各个API的平台,API接口的文档以及价格。
不过很快就意识到了问题,由于整个流程是通过工作流的方式触发的,所以比之前的方案还要费人,需要一张一张的点。
而且既然都是B改到A场景,B是不变的,那么我是不是可以做一个批量上传A的方案,实现批量的自动化,也不需要表格的形态。
这不就是一个perfect Vibe coding契机吗?
第一次VC,从下载Cursor,到翻
@yihui_indie老师的课程进行基础知识的学习(其实就看了基础课程,项目课程还没有开始跟练)
大概用了一个下午的时间我就完成了以下的成果。
这个时候,事情已经不一样了,已经不再是这个测试了。
而是我第一次感受到代码创造的快感,从一个想法,到落地的时间周期被压缩到了1天。
很快我就完成了:
- 网站的域名购买
- Vercel部署上线
- supabase的链接
既然我们之前在做AIGC广告片的时候,有很多流程/使用体验都不尽人意,那是不是我们可以基于我们自己的使用习惯来窜一个AIGC的工作台,让公司内部都可以用最便宜的价格,获得最好的模型,搭配上最舒服的工作流呢?
主要是不能贴更多的图了,不然我就一篇post说完了
下一期:基于Nano banana pro搭建了一个类即梦+tap now+可灵的内部AIGC工具库。