注册并分享邀请链接,可获得视频播放与邀请奖励。

Jimmy Jiang 的个人资料封面
Jimmy Jiang 的头像

Jimmy Jiang (@jimmyjiangYEZ)

@jimmyjiangYEZ
To grow and to help others grow. To live and to help others live. 🖼️ AIGC Start up | 🌍 Ex-Big Tech (EU & US) 📈 Marketing & Growth | 💻 Vibe Coding
125 正在关注    755 粉丝
一个普通人0代码基础4天Vibe coding了一个小即梦【一】 一切的源头来自于我们的一个品牌的客户,希望尝试通过AI来做批量做一些原生感的素材作为新品上市前的社媒预热动作。 这部分一直都是我们想尝试的方向,批量生成素材(图/视频)进行投放/批量UGC发布来快速测试市场 于是我们就开始了第一批的测试 自动化+批量P图,评估下来觉得有这么几个选择 - Coze - N8N/Make - 飞书多维表格 - SD/comfy UI(这个直接pass了,首先是不会,再有就是有点杀鸡用牛刀的感觉) 解决问题的最快路径一定是飞书多维表格: - 无需翻墙 - 公司内部的办公平台(权限/上手成本) - 表格形态 - 没有学习成本,搭建好了之后就能自动运行,搭配一个运营同学来审核&重生 我大概花了20mins左右就把第一版本搭建出来了,又在上边加了一点花头 逻辑非常简单,就是B是新品,需要替换到A场景里,得到一张B的“原生感”UGC素材。 同时由于我们可能没有那么多原生感的背景,那么AI生背景也很重要,所以加了一个多个元素X乘出来的随机背景,效果也不错。整体使用的是即梦的seedream4.5的模型,也是第一次通过飞书的平台接入API token(体验非常丝滑) 但是有一些问题: 1. seedream4.5 对于复杂的文字,图案以及漫画风的人脸识别/迁移的精度比较低,有些图片的AI感比较重,客户通过率还是比较低 2. 解决第一个问题就需要用到nano banana pro,但是我其实是不知道怎么接API的,于是我就开始做调研,首先是如何将nano banana pro接入到飞书多维表格: 找到了一份现成模版,只需要自己更改API,就可以快速的上手使用了。 通过这个过程,我快速的了解到了各个API的平台,API接口的文档以及价格。 不过很快就意识到了问题,由于整个流程是通过工作流的方式触发的,所以比之前的方案还要费人,需要一张一张的点。 而且既然都是B改到A场景,B是不变的,那么我是不是可以做一个批量上传A的方案,实现批量的自动化,也不需要表格的形态。 这不就是一个perfect Vibe coding契机吗? 第一次VC,从下载Cursor,到翻@yihui_indie老师的课程进行基础知识的学习(其实就看了基础课程,项目课程还没有开始跟练) 大概用了一个下午的时间我就完成了以下的成果。 这个时候,事情已经不一样了,已经不再是这个测试了。 而是我第一次感受到代码创造的快感,从一个想法,到落地的时间周期被压缩到了1天。 很快我就完成了: - 网站的域名购买 - Vercel部署上线 - supabase的链接 既然我们之前在做AIGC广告片的时候,有很多流程/使用体验都不尽人意,那是不是我们可以基于我们自己的使用习惯来窜一个AIGC的工作台,让公司内部都可以用最便宜的价格,获得最好的模型,搭配上最舒服的工作流呢? 主要是不能贴更多的图了,不然我就一篇post说完了 下一期:基于Nano banana pro搭建了一个类即梦+tap now+可灵的内部AIGC工具库。
显示更多