自动起草的 Reddit 回复之所以失败,是因为相关性打分是简单的那一半,语气才是难的那一半。本周一位 r/buildinpublic 评论者说得很准:悄悄要掉大多数自家搓的 Reddit 获客流水线性命的那一步,是自动起草回复那段;如果草稿读起来很通用,你不出一周就不再信任它们,整条流水线随之馊掉。数据层已经解决了;写作层才是这些工具死掉的地方。下面讲为什么,以及怎样搭一条能活过第七天的流水线。
相关性那一半如今确实很简单
找到对的帖子是个已解决的问题。你按关键词搜 Reddit,给每个帖子的购买意图打分,浮现出最靠前的几个。一个结构化 Reddit API 把帖子连同你打分所需的字段一并交给你——title、subreddit、score、评论数、全文——你跑一遍便宜的相关性筛选。本次实测验证:Scavio 的 /api/v1/reddit/search 在 data.posts 里返回了帖子,带 totalResults 和 nextCursor,2 积分,无 OAuth,无需维护爬虫。
那部分你一个下午就能搭好。它不是流水线崩掉的地方。
语气那一半才是它死的地方
失败模式是信任。最初几条自动起草的回复读起来像模板,你看出了拼接的缝,到第五天你就在从头重写每一条草稿——这意味着工具什么也没替你省下。更糟的是,如果一条通用草稿溜到了 Reddit 上,它会被踩或被删,你的账号要替名声背锅。Reddit 的文化对路过式推广的惩罚,比几乎任何平台都狠。
通用草稿失败有具体原因:
- 它们以产品开头,而不是从对方的实际问题开头。
- 它们把帖子原话复述回去,而不是补充 OP 本来不知道的东西。
- 它们每次都用同样的句式,读者会把这模式识别成机器人。
- 它们在一个只是问通用问题的帖子里提到某个工具,这读起来像广告。
怎样修好语气
修法是把草稿往具体处约束、往推销之外拉开。三条真正能拨动指针的规则:
引用帖子,而不是你的产品。 从帖子串里抽一个具体细节——他们点名的工具、撞上的报错、提到的公司数量——让回复显然就是冲着那个去的。一条引用了 OP 确切处境的回复不可能读起来像路过,因为它本来就不是。
以洞见开头,把提及设成门槛。 让前两句在零产品提及下就有用。只有当 OP 问「你们用什么做 X」时才点名一个工具,而且即便如此,也只在结尾、只提一次。你应该有一半的草稿完全不提任何产品;正是这些建立起账号的可信度,好让另一半落地。
变换结构。 如果每条草稿都以同样的方式开头,那不管内容多好都读起来像生成的。把帖子串的语气喂给模型,让回复去匹配它——在直白的帖子上就短而干脆,在技术帖上就详尽。
能活下来的流水线
耐久的形态是:用结构化 Reddit API 拿数据,用一个相关性分给帖子排序,用一个被约束成「引用帖子并把推销设门槛」的起草步骤,再让一个人去审批头几批,直到语气校准好。API 层是便宜、稳定的那部分——一把密钥,每积分 $0.005,注册先送 50 积分,帖子以类型化 JSON 返回。语气层才是你该投注意力的地方,因为它是决定这条流水线一个月后还跑不跑的那一半。
别去自动化那需要判断力的部分,又去手搓那本就是个 API 的部分。大多数自家搓的 Reddit 机器人恰好把这搞反了:他们把精力倾倒进一个脆弱的爬虫,却让模型即兴发挥回复。买下数据层,把你的精力花在语气上。