敲三下手机背面，AI 自动帮你抓取、分析、入库-AI Express News

先看效果

地铁上刷到一篇公众号文章，觉得有点意思。

复制链接，轻敲 iPhone 背面三下。手机震动一下，完事了。继续刷别的。

晚上打开微信小程序，这篇文章已经躺在那儿了——100 字摘要、3 个关键词、3 条核心洞察、2 句金句，一目了然。

扫一眼，决定这篇值得周末细读，点一下"转待办"。

全过程不需要打开电脑，不需要切换 APP，不需要想着"回去再处理"。

看到就处理，处理完就忘掉。需要的时候打开小程序，一切都在。

为什么要做这个

你的有价值内容散落在五六个 APP 里——微信收藏夹、小红书点赞、Twitter 书签、TikTok 喜欢——互不相通，各自吃灰。

这不是你的问题，是平台的设计。聚合，从来不是它们的 KPI。

"稍后阅读"四个字，是互联网上最大的谎言。它的真实含义是"永不阅读"。

我想要的不是更好的收藏夹，是一个信息聚合层：内容从四面八方汇聚到一个地方，AI 已经嚼过一遍——摘要提好了，关键词打好了，核心洞察列出来了。我只需要做一件事：决策。

不是"稍后阅读"，是"稍后决策"。这两个词的差别，就是效率的全部。

怎么搓出来的

最近 Manus 很火，但我个人还是更喜欢 OpenHands——开源、可控、Session 隔离做得好，适合搭建多用户的 Agent 服务。

之前看到「饼干哥哥AGI」分享的云端 Skills 系统，给了我灵感——Skills 可以放在云上，本地随时触发，把散落各处的信息汇总到一个入口。

过年在家 vibe coding，顺手用 OpenHands 把这个小工具搓出来了。

技术上没什么黑科技，就是把几个现成的东西串起来：iOS 快捷指令做触发，FastAPI + Celery 跑后端，OpenHands 当 Agent 执行抓取分析，微信小程序做展示。

一句话概括整个流程：

复制链接 → 敲三下 → 后端接收 → Agent 抓取分析 → 数据入库 → 小程序查看

下面说说几个有意思的设计点。

触发：敲三下的魔法

iPhone 有个隐藏功能：背面轻点。藏在「设置 → 辅助功能 → 触控」里。

我把"轻点三下"绑定到一个快捷指令：读取剪贴板内容，POST 到服务器，然后震动一下表示"收到了"。

从此，复制链接 + 敲三下 = 触发分析任务。

整个动作 1 秒内完成，几乎无感。这个交互设计是整套系统的灵魂——如果每次都要打开 APP、粘贴链接、点按钮，那我肯定坚持不下去。

好工具的第一要义：别让我多动一下。

后端：让 Agent 去干活

服务器收到链接后，先看 URL 长什么样——mp.weixin.qq.com 是微信，x.com 是 Twitter，xiaohongshu.com 是小红书——自动识别，不用手动选。

然后把任务丢给 Celery 异步处理。为什么异步？因为抓取和分析要十几秒甚至几十秒，总不能让用户在地铁上干等着。请求进来立即返回"已接收"，后台慢慢跑。

真正干活的是 OpenHands Agent。它收到指令后，自动跑一套工作流：

抓取：用 Playwright 模拟浏览器，处理懒加载、绕过反爬
清洗：去掉 HTML 标签和乱七八糟的脚本，提取纯文本
分析：调 LLM 生成摘要、关键词、洞察、金句
入库：把结构化数据存进数据库

这里有个坑：Agent 有时候会"自作聪明"——分析完觉得任务完成了，就停了。但对我来说，结果没入库 = 白干。

所以我在 Skill 定义里写死了：只有收到数据库返回的记录 ID，才算成功。

这是用 Agent 做工程最重要的一课：你要定义的不是"做什么"，而是"什么算做完了"。

为什么是 OpenHands

选型这事，不是选最强的，是选最合适的。

Claude Agent SDK 能做吗？能。但 OpenHands 有几个设计我很看重。

第一，Session 隔离。

每个用户可以有独立的 Agent 会话，互不干扰。现在是我一个人用，但架构要考虑将来十个人、一百个人用的时候还能不能撑住。单点验证可以糙，但架构设计要留余量。

第二，Skills 机制真的优雅。

OpenHands 里，一个 Skill 就是一个目录。目录里放两样东西：一个 prompt.md 定义这个 Skill 是干嘛的、怎么触发、成功标准是什么；一个或多个脚本文件负责具体执行。

Agent 启动时会自动扫描 .openhands/skills/ 目录，把所有 Skill 加载进来。用户发一条消息，Agent 自己判断该调哪个 Skill，然后执行。

比如我定义了一个 wechat-article 的 Skill，prompt 里写清楚：

当用户发送微信公众号链接时，执行以下步骤：1. 调用 fetch 脚本抓取文章；2. 调用 clean 脚本清洗内容；3. 调用 analyze 脚本生成摘要；4. 调用 store 脚本入库；5. 只有收到数据库返回的记录 ID，才算任务成功。

Agent 读完这个 prompt，就知道该怎么干活了。我不用写一行调度代码，不用操心"先调哪个后调哪个"——Agent 自己编排，我只管定义目标和边界。

第三，Skill 可以组合。

单个 Skill 是原子能力，但你可以用一个"编排 Skill"把多个原子 Skill 串起来。比如我有 wechat-fetch、content-clean、ai-analysis、api-store 四个原子 Skill，然后用一个 wechat-article-workflow 把它们组合成完整流程。

想支持新平台？写一个新的 fetch Skill，复用后面的 clean、analyze、store，半天就能搞定。

好的架构是"加功能不改代码"。 如果每加一个平台都要动核心逻辑，那这个架构就是失败的。

目前已经支持：微信公众号、Twitter/X、小红书、TikTok。后面想加什么平台，照着现有的 Skill 抄一个就行。

小程序：最轻的前端

为什么选微信小程序？因为够轻。

不用装 APP，不用注册新账号，微信扫一下就能用。打开就看，看完就走。

小程序里有四个核心页面：