盘点 6 个本周 yyds 的 GitHub 开源项目。

01

谷歌开源的文档信息抽取神器

最近逛 GitHub 发现谷歌开源了一个挺有意思的项目 LangExtract,目前已经有将近 3 万的 Star 了。
这是一个 Python 库,专门用 LLM 从乱七八糟的非结构化文本里提取结构化信息。
比如说你有一堆临床病历、报告文档啥的,它能帮你自动识别和整理关键信息,而且提取出来的每一条数据都能精准定位到原文位置。
图片[1]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News
它有几个核心特点,精确源定位对长文档做了优化、支持交互式可视化,能生成一个独立的 HTML 文件,让你在原始上下文中查看和审核成千上万个提取结果。
图片[2]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News
而且灵活的模型支持,从云端的 Gemini 到本地的 Ollama 都能用,完全看你喜欢哪种。
安装很简单,pip install langextract 就行。
开源地址:https://github.com/google/langextract

02

GitHub 官方的 AI 工作流框架

GitHub 自己搞了个叫 Agentic Workflows 的项目,让你用自然语言写 Markdown 就能跑 AI 工作流。

说白了就是你在 Markdown 文件里描述想干啥,然后丢到 GitHub Actions 里自动执行。

图片[3]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News

安全方面做得挺到位的,默认只读权限,写操作只能通过所谓的 safe-outputs 来完成。

它还有沙箱执行、输入净化、网络隔离、SHA 固定依赖、工具白名单等多层保护机制。

如果你想让 AI 帮你自动化仓库任务又担心安全问题,这个可以看看。

图片[4]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News
开源地址:https://github.com/github/gh-aw

03

AI Agent 工具包

pi-mono 是一个 AI Agent 工具包,最吸引我的是它的 coding agent CLI 可以在树莓派或本地服务器上跑。

图片[5]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News

这个项目包含挺多东西:统一的 LLM API、TUI 和 Web UI 库、Slack 机器人、vLLM pods 等。

它支持多种模型提供商,Claude、ChatGPT、GitHub Copilot、Google Gemini CLI 都能用。

上下文管理这块做得不错,支持自动压缩和恢复,还能主动在接近限制时处理,避免上下文溢出的问题。

图片[6]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News
开源地址:https://github.com/badlogic/pi-mono

04

100 多个 LLM 应用案例合集

awesome-llm-apps 是一个收集了 100 多个 LLM 应用的仓库,涵盖 RAG、AI Agent、多智能体团队、MCP、语音 Agent 等各种玩法。

图片[7]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News

支持的模型也很全面,OpenAI、Anthropic、Gemini、xAI,还有 Qwen、Llama 这些开源模型都有。

里面的项目分类挺细致的,从入门级的 AI Agent 到高级的自主游戏 Agent,从 RAG 应用到带记忆的 LLM 应用,啥都有。

特别适合想学习 LLM 应用开发的开发者,每个项目都有详细文档,可以直接 clone 下来跑。

图片[8]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News
开源地址:https://github.com/Shubhamsaboo/awesome-llm-apps

05

让 AI 控制 Chrome 浏览器

chrome-devtools-mcp 是一个 MCP,让你的 AI 编程助手能直接控制和检查 Chrome 浏览器。

图片[9]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News

支持的工具很多:点击、拖拽、填充表单、处理对话框、按键、上传文件这些输入自动化都有。

还能分析网络请求、截图、检查控制台消息、录制性能追踪、获取性能洞察等。

基本上就是让你的 AI 助手拥有完整的 Chrome DevTools 能力,用来做自动化测试、性能分析、网页调试都很方便。

支持各种主流 AI 编程工具:Claude Code、Cursor、Copilot、Gemini CLI 等。

开源地址:https://github.com/ChromeDevTools/chrome-devtools-mcp

06

本地知识库搜索引擎

qmd 是 Shopify CEO Tobi Lutke 开源的一个本地 Markdown 搜索引擎

这个工具结合了 BM25 全文检索、向量语义搜索和 LLM 重排序,全程通过 Ollama 本地运行,不需要联网。

图片[10]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News

技术上有几个亮点:查询扩展,用 LLM 生成查询变体,原始查询权重加倍。混合检索,同时用 FTS5 和向量搜索。

RRF 融合加位置感知混合,根据排名位置调整检索和重排的权重比例。

支持 MCP 模式,可以跟 Claude Code 等 AI 工具无缝集成,非常适合用在 Agent 工作流里。

图片[11]-盘点 6 个本周 yyds 的 GitHub 开源项目。-AI Express News
开源地址:https://github.com/tobi/qmd

07

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

<原文链接:https://mp.weixin.qq.com/s/ApymaWtmIJ5WV6m94MEajA

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容