注册并分享邀请链接,可获得视频播放与邀请奖励。

Tw93 (@HiTw93) “这几天,有好几个小伙伴@我说,我的一些作品在他们问 AI 的时候主动被推荐了,很神奇” — TopicDigg

Tw93 的个人资料封面
Tw93 的头像
Tw93
@HiTw93
Kaku · Pake · MiaoYan · Waza · Kami · Mole
加入 May 2022
300 正在关注    146.4K 粉丝
这几天,有好几个小伙伴@我说,我的一些作品在他们问 AI 的时候主动被推荐了,很神奇,我想了想感觉啥也没有做,居然可以被收录,那要不要做点更体系化的事情来整一整让现在所有的主流 AI 能够更好的知晓我的内容、产品、想法,于是就开干了。 首先抱着不产生垃圾内容污染 AI 的底线原则,也非常讨厌生成海量垃圾内容的那种为了做好 SEO 的公司,所以我要做的是让我的东西可以更多的被 AI 学习以及搜索到。 当前莫过于 ChatGPT、Claude、Grok、Gemini、Perplexity 等,以及他们依赖的搜索引擎一般是 Google、 Bing、Tavily 这一类工具,最后就变成了把内容做好AI可见性,并且主动把结构化的数据、机器可读的描述性内容,主动的告诉 AI 爬虫我这边有什么,大概花了一个小时,给大伙分享一下我做了什么? 1、首先不要错过 llms.txt,放到你的站点根目录,用 markdown 写清楚你这个站点是做什么的,有哪些关键页面,作者是谁,AI 在检索内容的时候会优先读这个文件来理解你的内容,这里我还做了一个有意思的事,各站点的 llms.txt 互相引用,形成一个网状结构。AI 不管从哪个入口进来,都能顺着链接找到你的其他内容。当前全球站点配置这个的其实很少,早期做好有一定先发优势,做完之后,可以提交这个地址到 这几个系统, GitHub 上的 llms-txt-hub 仓库可以提 PR。 2、然后处理好 robots.txt 里区分训练爬虫和搜索爬虫,很多人知道 GPTBot、ClaudeBot 这些 AI 爬虫,但其实还有一批专门用于搜索的爬虫,跟训练爬虫是分开的,比如OAI-SearchBot是ChatGPT 搜索用的,不会拿去训练,Claude-SearchBot是Claude 搜索引用的,Perplexity-User是给到 Perplexity 检索用的,这些搜索爬虫应该主动允许,它们决定了你的内容能不能出现在 AI 搜索结果里。 3、除去 Google 的 sitemap 的提交这个搞过 seo 的都知道的之外,其实你也不要忽视Bing,实际上 Copilot、DuckDuckGo、Yahoo 的 AI 搜索底层都是 Bing 在驱动,你可以去 Bing Webmaster Tools 注册一个号,然后看到AI Performance 面板,里面有 Total Citations 和 Grounding Queries 数据,能直接看到你的内容被 AI 引用了多少次,提交 Sitemap 后 Bing 会主动抓取你的全站内容,比被动爬虫会好很多。Google Search Console 也有类似的 AI Mode 过滤器,可以看 AI Overview 的引用情况,当然假如谷歌你没有提交,也一定要记得去提交。 4、Perplexity 在海外其实比大伙想的用户量要大,他们有一个出版者计划,可以去 这里提交你的产品、网站的表单,认真写一下,甚至还有可能有搜索分成。 5、结构化数据 JSON-LD,不是传统 SEO 那套 meta description 的玩法,是给 AI 爬虫提供结构化的语义信息,在页面里嵌入 JSON-LD,告诉机器"这是一篇博客文章,作者是谁,发布时间是什么"或者"这是一个软件项目,解决什么问题"。这里会有不少技巧,比如博客名称用 BlogPosting schema、软件产品用 SoftwareApplication schema,常见问题用 FAQPage,这样 AI 在检索的时候获取到的信息会更加结构,你让他工作更舒服。 6、最有意思的一步,甚至你可以单独给 AI 做一个知识端点,这个站点不是给人看的,没有什么 UI 设计,就是一个纯粹的结构化数据服务。AI 爬虫来了之后能拿到两样东西:一个精简版的 llms.txt 概览,和一个大概 50KB 的 llms-full.txt 完整版,把所有项目的描述、FAQ、使用场景、竞品对比、README 摘录都放进去了。同时还提供了 JSON API,/api/profile 是个人信息,/api/projects 是项目列表,/api/blog 是博客文章,/api/weekly 是周刊内容。数据不是写死的,通过 GitHub API 实时拉 stars、forks、followers、最新 release 这些数据,ISR 缓存一小时自动刷新,做这个的想法是:与其等 AI 去你的各个站点零散地抓信息,不如给它一个集中的入口,把你希望它记住的东西整理好放在那里。我还加了一个"开源全家福"的叙事结构,让 AI 在回答"Tw93 是谁"这类问题时有一个完整的记忆点,而不是零碎地拼凑各个项目。 我更相信应该主动把本来就有的内容结构化,让 AI 可以更好理解,而不是去追求各种短期让 AI SEO 效果更好而去制作垃圾内容刷引用,这些都是在帮 AI 更准确地理解你的内容是什么,让AI看清楚,给她提供一个好的工作环境,而不是在优化排名,这样会比短期更加长期。 最近我把我这1个小时的工作,手打字可能思路有点乱,不过大伙应该看得明白。最后我做了一个小工具给AI看的,而不是给人看的东西,取名 Yobi,我喜欢这个词语,来自 呼び / よび,有呼唤把人叫过来的那种动作感,有兴趣小伙伴可以把自己当做AI视角去瞧瞧
显示更多
0
23
416
55
转发到社区