先看效果
地铁上刷到一篇公众号文章,觉得有点意思。
复制链接,轻敲 iPhone 背面三下。手机震动一下,完事了。继续刷别的。
晚上打开微信小程序,这篇文章已经躺在那儿了——100 字摘要、3 个关键词、3 条核心洞察、2 句金句,一目了然。
扫一眼,决定这篇值得周末细读,点一下"转待办"。
全过程不需要打开电脑,不需要切换 APP,不需要想着"回去再处理"。
看到就处理,处理完就忘掉。需要的时候打开小程序,一切都在。
为什么要做这个
你的有价值内容散落在五六个 APP 里——微信收藏夹、小红书点赞、Twitter 书签、TikTok 喜欢——互不相通,各自吃灰。
这不是你的问题,是平台的设计。聚合,从来不是它们的 KPI。
"稍后阅读"四个字,是互联网上最大的谎言。它的真实含义是"永不阅读"。
我想要的不是更好的收藏夹,是一个信息聚合层:内容从四面八方汇聚到一个地方,AI 已经嚼过一遍——摘要提好了,关键词打好了,核心洞察列出来了。我只需要做一件事:决策。
不是"稍后阅读",是"稍后决策"。这两个词的差别,就是效率的全部。
怎么搓出来的
最近 Manus 很火,但我个人还是更喜欢 OpenHands——开源、可控、Session 隔离做得好,适合搭建多用户的 Agent 服务。
之前看到「饼干哥哥AGI」分享的云端 Skills 系统,给了我灵感——Skills 可以放在云上,本地随时触发,把散落各处的信息汇总到一个入口。
过年在家 vibe coding,顺手用 OpenHands 把这个小工具搓出来了。
技术上没什么黑科技,就是把几个现成的东西串起来:iOS 快捷指令做触发,FastAPI + Celery 跑后端,OpenHands 当 Agent 执行抓取分析,微信小程序做展示。
一句话概括整个流程:
复制链接 → 敲三下 → 后端接收 → Agent 抓取分析 → 数据入库 → 小程序查看
下面说说几个有意思的设计点。
触发:敲三下的魔法
iPhone 有个隐藏功能:背面轻点。藏在「设置 → 辅助功能 → 触控」里。
我把"轻点三下"绑定到一个快捷指令:读取剪贴板内容,POST 到服务器,然后震动一下表示"收到了"。
从此,复制链接 + 敲三下 = 触发分析任务。
整个动作 1 秒内完成,几乎无感。这个交互设计是整套系统的灵魂——如果每次都要打开 APP、粘贴链接、点按钮,那我肯定坚持不下去。
好工具的第一要义:别让我多动一下。
后端:让 Agent 去干活
服务器收到链接后,先看 URL 长什么样——mp.weixin.qq.com 是微信,x.com 是 Twitter,xiaohongshu.com 是小红书——自动识别,不用手动选。
然后把任务丢给 Celery 异步处理。为什么异步?因为抓取和分析要十几秒甚至几十秒,总不能让用户在地铁上干等着。请求进来立即返回"已接收",后台慢慢跑。
真正干活的是 OpenHands Agent。它收到指令后,自动跑一套工作流:
抓取:用 Playwright 模拟浏览器,处理懒加载、绕过反爬 清洗:去掉 HTML 标签和乱七八糟的脚本,提取纯文本 分析:调 LLM 生成摘要、关键词、洞察、金句 入库:把结构化数据存进数据库
这里有个坑:Agent 有时候会"自作聪明"——分析完觉得任务完成了,就停了。但对我来说,结果没入库 = 白干。
所以我在 Skill 定义里写死了:只有收到数据库返回的记录 ID,才算成功。
这是用 Agent 做工程最重要的一课:你要定义的不是"做什么",而是"什么算做完了"。
为什么是 OpenHands
选型这事,不是选最强的,是选最合适的。
Claude Agent SDK 能做吗?能。但 OpenHands 有几个设计我很看重。
第一,Session 隔离。
每个用户可以有独立的 Agent 会话,互不干扰。现在是我一个人用,但架构要考虑将来十个人、一百个人用的时候还能不能撑住。单点验证可以糙,但架构设计要留余量。
第二,Skills 机制真的优雅。
OpenHands 里,一个 Skill 就是一个目录。目录里放两样东西:一个 prompt.md 定义这个 Skill 是干嘛的、怎么触发、成功标准是什么;一个或多个脚本文件负责具体执行。
Agent 启动时会自动扫描 .openhands/skills/ 目录,把所有 Skill 加载进来。用户发一条消息,Agent 自己判断该调哪个 Skill,然后执行。
比如我定义了一个 wechat-article 的 Skill,prompt 里写清楚:
当用户发送微信公众号链接时,执行以下步骤:1. 调用 fetch 脚本抓取文章;2. 调用 clean 脚本清洗内容;3. 调用 analyze 脚本生成摘要;4. 调用 store 脚本入库;5. 只有收到数据库返回的记录 ID,才算任务成功。
Agent 读完这个 prompt,就知道该怎么干活了。我不用写一行调度代码,不用操心"先调哪个后调哪个"——Agent 自己编排,我只管定义目标和边界。
第三,Skill 可以组合。
单个 Skill 是原子能力,但你可以用一个"编排 Skill"把多个原子 Skill 串起来。比如我有 wechat-fetch、content-clean、ai-analysis、api-store 四个原子 Skill,然后用一个 wechat-article-workflow 把它们组合成完整流程。
想支持新平台?写一个新的 fetch Skill,复用后面的 clean、analyze、store,半天就能搞定。
好的架构是"加功能不改代码"。 如果每加一个平台都要动核心逻辑,那这个架构就是失败的。
目前已经支持:微信公众号、Twitter/X、小红书、TikTok。后面想加什么平台,照着现有的 Skill 抄一个就行。
小程序:最轻的前端
为什么选微信小程序?因为够轻。
不用装 APP,不用注册新账号,微信扫一下就能用。打开就看,看完就走。
小程序里有四个核心页面:
简报页:今日新增、关键词云、待办提醒
素材库:所有内容,支持按平台、关键词、时间筛选
详情页:单篇内容的摘要、洞察、金句
待办页:从内容一键转任务,设优先级和截止时间
到这里,整个闭环跑通了。
用了一段时间的感受
这套系统上线之后,我最大的体验是:几乎感觉不到它的存在。
敲三下,震动一下,然后就没了。不用等转圈,不用看日志,不用担心出错。
晚上想起来,打开小程序看一眼,东西都在那儿。
最好的工具,是你感觉不到它存在的那种。它不是一个需要你伺候的助手,是一个不需要你操心的员工。
让信息回归聚合,让人回归决策。
这才是 AI 应该干的事。
小程序已上线,欢迎体验
这套系统的小程序端已经上线,目前个人体验阶段,免费开放,由于我自己使用也限制了token使用;
怎么用:
长按识别下方小程序码,进入小程序 按引导完成注册 在 iPhone 上配置快捷指令(点这里看配置教程[1]) 复制任意文章链接,敲三下手机背面,开始体验

目前支持: 微信公众号、Twitter/X、小红书
温馨提示: 目前后台用的是 Qwen3 模型,纯属个人玩票性质,为了控制成本设了每日使用次数限制。如果用得顺手想要更多额度,或者有其他想法,欢迎评论区聊聊。
如果你也被信息碎片化困扰,或者对 Agent 工程化实践感兴趣,欢迎扫码玩玩。
有问题或建议,评论区见。觉得有用的话,点赞、在看、转发走一波,让更多有同样痛点的朋友看到。
后续会继续分享 AI Agent 工程化落地的实战经验,感兴趣的可以先关注。
引用链接
[1]点这里看配置教程: https://dev.yourxiaozhushou.cloud/home/main/shortcuts-guide.html
<原文链接:https://mp.weixin.qq.com/s/NuaRqeoWBzA48u2sEMjqiw












暂无评论内容