学会了PPTSkills，豆包Kimi都感觉不香了。但90%的人卡在第一步：Gemini NanoBananaPro API国内用不了。这篇帮你全解决（8个坑+国内可用）-AI Express News

Skills火了。

火到什么程度？

3万人收藏的Skills仓库，各种保姆级教程，全网都在聊。

可能全天下就你还没用上。

你有没有过这种感觉？

看完那些教程，确实觉得牛逼。

收藏了一大堆。

然后呢？

然后就没有然后了。

大部分人的真实状态是：

知道Skills牛逼，但牛逼在哪我感受不到。

我也想自己做一个，但从头学太难了。

想想就放弃了。

这就是"虚假的强大"。

你以为收藏了就等于学会了。

但你心里清楚，这不是你的能力。

我之前也是这样。

直到我发现了一个捷径——

不是从0开始造轮子，而是基于别人已经做好的Skills进行二次开发。

这就像装修房子。

你想住一套梦想中的房子。

方案A：从打地基开始，自己盖。

方案B：买一套户型差不多的，按自己喜好改装修。

大部分人选方案A。

然后发现要学建筑、水电、装修、消防...

算了，不搞了。

聪明人选方案B。

Skills也一样。

开源社区已经有很多人做好了各种Skills。

你要做的不是从头造轮子。

而是：找到 → 理解 → 改造 → 使用

找一个和你需求相近的，看懂它怎么工作的，改成你要的样子。

这才叫站在巨人肩膀上。

这篇文章，我用一个PPT生成的Skills做例子，手把手演示完整的改造过程。

从谷歌官方API版本，到国内也能用的第三方API版本。

中间踩的坑，全记下来了。

你可以直接抄。

先演示一下，用起来有多简单：

第一步：在Claude Code中输入Skills名称

回车。

第二步：告诉它你要做什么PPT

你可以：

指定一个文件路径（比如你写好的文档）
直接复制粘贴内容
用自然语言描述主题

我直接说：

我想生成一个 3 页的 PPT，主题是"766学徒法则：AI时代年轻人的职业突围指南"，对应的文本内容在XXX
使用矢量插画风格，2K 分辨率。

就这么简单，一句话。

第三步：Claude会问你几个问题

它会依次确认：

什么风格？（目前有2种：渐变毛玻璃、矢量插画，后续可以自己加）

生成几页？（可以自定义数字，或者说"5页左右"这种模糊描述，AI能理解）

什么分辨率？（2K或4K）

你还可以进行自定义补充

第四步：等待生成

确认后，它就开始跑了：

============================================================
PPT生成器启动
============================================================
风格: styles/vector-illustration.md
分辨率: 2K
页数: 3
============================================================

正在生成第 1 页...
✓ 第 1 页已保存: outputs/20260118_113820/images/slide-01.png

正在生成第 2 页...
✓ 第 2 页已保存: outputs/20260118_113820/images/slide-02.png

正在生成第 3 页...
✓ 第 3 页已保存: outputs/20260118_113820/images/slide-03.png

============================================================
生成完成！
============================================================
📁 输出目录: outputs/20260118_113820/
🎬 打开播放网页: outputs/20260118_113820/index.html

第五步：想要视频？继续说一句话

图片生成完后，直接说：

继续生成转场视频

Claude会自动：

1.分析每两页之间的视觉差异
2.生成转场提示词
3.调用可灵AI生成视频
4.用FFmpeg合成完整视频

✅ PPT 视频生成成功！

📊 生成统计：
- PPT 页数：3 页
- 视频素材：3 个（1 个预览 + 2 个转场）
- 总耗时：约 4.7 分钟

📁 输出文件：
- 完整视频: full_ppt_video.mp4 (5.95 MB)
- 首页预览: videos/preview.mp4 (4.32 MB)
- 转场 1→2: videos/transition_01_to_02.mp4 (8.88 MB)
- 转场 2→3: videos/transition_02_to_03.mp4 (8.26 MB)

看到没？

全程就是对话。

输入一个命令，回答几个问题，剩下的全自动。

这不是用工具，这是在指挥AI干活。

这不是模板，是AI根据你的内容现场生成的。

每一页都是独一无二的。

📍 本文导航

👉 只想知道思路？看「为什么二次开发是最佳路径」

👉 只想看实操？看「PPT Skills改造全过程」

👉 只关心国内怎么用？看「第三方API解决方案」

👉 只想要项目文件？直接拉到文末，回复「AIPPT」获取完整压缩包

全文约3500字，完整阅读约10分钟。

01 你为什么"用不起来"？

先问你几个问题：

第一，你有没有这种感觉？

知道Skills很牛，但不知道哪个适合自己。

网上那么多开源仓库，眼花缭乱。

看完介绍觉得都很厉害，但具体能帮我干嘛？

不知道。

第二，下载了几个试了试，发现...

要配置这个，要安装那个。

Python版本不对，依赖装不上，API调不通...

搞了半天，算了，不折腾了。

第三，最关键的问题——

大部分好用的Skills都用谷歌的Gemini API。

国内直接用不了。

科学上网？不稳定。生成到一半断了更崩溃。

总结一下就是：

大家都说Skills牛逼，但牛逼在哪我感受不到。

我也想自己做一个，但从头学太难了，想想就放弃了。

你发现了吗？

问题不是Skills不好用，而是你走错了路。

你一直想从0开始造轮子，却忽略了一条更聪明的路——二次开发。

02 为什么"二次开发"是小白的最佳路径

我不仅分享如何二次开发Skills，更要帮你理解为什么这是小白的最佳路径——站在巨人肩膀上，而不是从头造轮子。

先讲个比喻。

你想住一套梦想中的房子。

方案A：从打地基开始，自己盖。

要学建筑、水电、装修、消防...

光想想就累了，对吧？

方案B：买一套户型差不多的，按自己喜好改装修。

换个墙漆，改个厨房，添几件家具。

几周就能入住。

Skills也一样。

开源社区已经有很多人做好了各种Skills。

3.2万人收藏的仓库里，什么类型都有。

你要做的不是从头造轮子。

而是：

找到 → 理解 → 改造 → 使用

找一个和你需求相近的，看懂它怎么工作的，改成你要的样子。

这就是"二次开发"。

它的好处是：

核心功能别人已经写好了
你只需要改需要改的部分
遇到问题可以参考原项目
省掉80%的学习成本

这才是开源社区最大的价值——让每个人都能站在前人的积累上继续前进。

03 实战案例：PPT Skills改造全过程

说理论太虚。

接下来我用一个真实案例，手把手演示怎么做二次开发。

为什么选这个案例？

功能实用：AI生成PPT是刚需，谁还没做过几个PPT？
效果惊艳：支持多种风格，渐变毛玻璃、矢量插画，出来就是能用的
有典型痛点：原版用谷歌API，国内用不了
二次开发空间大：正好演示完整改造过程

我不仅提供踩坑记录，更帮你构建一套找到→理解→改造→使用的二次开发思维框架——以后任何开源项目都能这样改。

第一个Skills：NanoBanana PPT（谷歌官方API版）

这是什么？

开源项目NanoBanana做的一个Skills。

用Gemini生成PPT的每一页图片，还能用可灵AI生成转场视频。

两种视觉风格（可根据自己需要扩张）：

1.渐变毛玻璃卡片 - 科技感、商务演示
2.矢量插画风格 - 教育培训、创意提案

下面是傻瓜式环境搭建步骤。

每一步我都写清楚了，照着做就行。

步骤1：获取项目文件

在公众号后台回复「AIPPT」，获取完整压缩包。

下载后解压到你想要的文件夹（比如桌面）。

怎么确认成功？解压后能看到一堆文件，包括.py结尾的Python文件、requirements.txt、还有styles文件夹。

步骤2：创建虚拟环境

打开终端，进入项目文件夹，输入命令：

cd /你的项目路径/NanoBanana_image_ppt_skills
python3 -m venv venv

返回结果：

（无输出，表示成功）

怎么确认成功？项目文件夹里多了一个叫「venv」的文件夹。

步骤3：激活虚拟环境

source venv/bin/activate

返回结果：

(venv) gongzifei@MacBook-Pro NanoBanana_image_ppt_skills %

怎么确认成功？命令行最前面出现了(venv)字样。

步骤4：安装依赖

pip install google-genai pillow python-dotenv -i https://pypi.org/simple

返回结果：

Looking in indexes: https://pypi.org/simple
Collecting google-genai
  Downloading google_genai-1.47.0-py3-none-any.whl
...
Successfully installed google-genai-1.47.0 pillow-11.3.0 python-dotenv-1.2.1 ...

注意：这里一定要加 -i https://pypi.org/simple，指定官方源。否则可能装不上。

步骤5：配置.env文件

cp .env.example .env

用编辑器打开.env文件，填入你的配置：

GEMINI_API_KEY=你的API密钥
GEMINI_BASE_URL=https://你的API地址
GEMINI_MODEL=gemini-3-pro-image-preview

怎么确认成功？文件保存后，里面有你填的配置信息。

步骤6：测试API连接

这一步很关键！在改代码之前，一定要先测试API是否能通。

source venv/bin/activate && python3 << 'EOF'
import httpx
import json

base_url = "https://你的API地址"
api_key = "你的API密钥"

url = f"{base_url}/v1beta/models/gemini-3-pro-image-preview:generateContent"
headers = {
    "Content-Type": "application/json",
    "x-goog-api-key": api_key
}
data = {
    "contents": [{"parts": [{"text": "Hello, test connection"}]}]
}

response = httpx.post(url, headers=headers, json=data, timeout=30)
print(f"状态码: {response.status_code}")
if response.status_code == 200:
    print("✓ API连接成功！")
else:
    print(f"✗ 连接失败: {response.text[:200]}")
EOF

成功的返回结果：

状态码: 200
✓ API连接成功！

到这里，环境就搭好了。

但是——

我踩了不少坑。

一开始我也是一头雾水，API调不通搞了半天。

后来一个一个排查，终于全部解决了。

这些坑我都踩过了。

比如踩坑2，我第一次配置时，base_url写成了http://xxx.com/v1，结果库自己又加了一层路径，变成了/v1/v1beta/...，直接404。

还有踩坑5，Skill执行时用的是系统Python，不是虚拟环境里的，所以找不到装好的依赖...

💡 解决方案整理成了完整的踩坑指南。

回复「AIPPT」获取完整踩坑指南+解决方案，照着改就能跑通。

问题来了：国内用不了谷歌API

好不容易把环境配好了。

运行一下，发现：

连不上。

谷歌Gemini是外网，国内直接访问不了。

科学上网？

不稳定。生成到一半断了，更崩溃。

有没有更稳定的方案？

有。

这就是我要讲的第二个Skills——基于第一个二次开发的版本。

第二个Skills：国内可用版（第三方API）

这个版本是我基于第一个Skills二次开发得来的。

核心改动就一个：把谷歌官方API换成第三方转接API。

好处是：

不需要科学上网
国内直连，稳定
接口兼容，代码改动很小

我不仅解决国内API问题，更助你搭建一个可持续迭代的AI工作流——今天是PPT，明天可能是你自己的专属Skills。

傻瓜式二次开发步骤：

步骤1：复制原项目

cp -r NanoBanana_image_ppt_skills NanoBanana_image_ppt_skills_国内版

为什么要复制？保留原版，方便对比和回滚。万一改坏了还能参考。

步骤2：获取第三方API

你需要一个支持Gemini的第三方转接服务。

我使用的这家，亲测稳定可用：

👉 https://once-cf.novai.su/register?aff=5WJc

新用户有免费额度可以体验，够你跑通整个流程了。

注册后在后台可以看到：

API密钥（类似 sk-xxxx 的字符串）
API地址（类似 https://xxx.xxx.com）

步骤3：修改.env配置

打开新项目的.env文件，把原来的配置改成第三方的：

GEMINI_API_KEY=你的第三方API密钥
GEMINI_BASE_URL=https://你的第三方API地址
GEMINI_MODEL=gemini-3-pro-image-preview

重点注意：

GEMINI_BASE_URL 只填域名，不要带 /v1！
比如填 https://xxx.com，不要填 https://xxx.com/v1
这是我踩过的最大的坑

步骤4：选择调用方式（如果官方库不兼容）

有些第三方API和google-genai官方库有兼容性问题。

这时候有两种方案：

建议：先试官方库方式。如果报错调不通，再换HTTP请求方式。

压缩包里两种方式的代码都有，直接用就行。

步骤5：测试运行

./venv/bin/python generate_ppt.py --help

成功的返回结果：

✅ 已加载环境变量: /你的路径/.env
usage: generate_ppt.py [-h] --plan PLAN --style STYLE [--resolution {2K,4K}]
                       [--output OUTPUT] [--template TEMPLATE]

PPT生成器 - 使用Nano Banana Pro生成PPT图片

步骤6：生成PPT测试

用自然语言描述需求：

生成一个 3 页的 PPT，主题是"766学徒法则"，使用矢量插画风格，2K 分辨率。

成功的返回结果：

============================================================
PPT生成器启动
============================================================
风格: styles/vector-illustration.md
分辨率: 2K
页数: 3
============================================================

正在生成第 1 页...
✓ 第 1 页已保存: outputs/20260118_113820/images/slide-01.jpg

正在生成第 2 页...
✓ 第 2 页已保存: outputs/20260118_113820/images/slide-02.jpg

正在生成第 3 页...
✓ 第 3 页已保存: outputs/20260118_113820/images/slide-03.jpg

============================================================
生成完成！
============================================================
输出目录: outputs/20260118_113820/
播放网页: outputs/20260118_113820/index.html

看到这个输出，恭喜你，成功了！

我在二次开发时踩过的坑：

这些二次开发的坑更隐蔽。

比如踩坑6，官方库内部做了很多封装，报错信息很模糊，根本不知道哪里出问题。后来我改成HTTP请求方式，能直接看到请求和响应的原始数据，问题一下就定位到了。

我花了不少时间才搞定。

💡 回复「AIPPT」获取完整踩坑指南，包括官方库和HTTP请求两种方式的解决方案。

8个坑，每个坑的详细解决方案都写清楚了。照着改，保证能跑通。

04 下一步：不会编程怎么办？

看到这里，你可能会说：

"阿飞你写得很清楚，但这些代码修改我还是看不懂怎么办？"

"我不会编程，这条路是不是走不通？"

别急。

这正是我下一篇文章要讲的——

《Claude Code小白编程指南》

用一句话概括就是：Vibe Coding。

完全不需要你写代码。

你只需要用自然语言描述需求，Claude帮你改。

"把这里的谷歌API换成这个第三方的"

"报错了，帮我看看什么问题"

"改好了帮我测试一下"

就这么简单。

这不是在用工具，这是在带着一支施工队装修房子。

你只需要当那个发号施令的人。

想第一时间看到这篇教程，记得关注「AI元机所」。

05 写在最后

工具越简单，我们就越要警惕。

豆包、Kimi这些工具好用吗？好用。

但你有没有发现？

用它们生成的东西，你自己根本复制不出来。

这种感觉，叫"虚假的强大"。

你以为自己很厉害，但其实你只是许愿池边的许愿者。

今天许到了，明天不一定。

Skills的价值，不在于它本身有多牛。

而在于它让"站在巨人肩膀上"变得更容易了。

以前想用AI做点什么，得从头学。

现在有了开源Skills，找一个差不多的，改改就能用。

这才是开源社区最大的价值——让每个人都能站在前人的积累上继续前进。

别让自己变成被AI喂养的"工具人"。

去当那个运筹帷幄、排兵布阵的将军吧。

Skills的世界很大，不需要一步到位。

从改几行配置开始，你会发现没那么难。

今天是PPT，明天可能是你自己的专属工具。

📦 这份资源包，凭什么值得你要？

不是让你拿去直接用的。

是让你拿去"改"的。

你想想看——

整套代码框架已经搭好了，API调用、图片生成、文件输出，全部都能跑通。

你需要做的，只是在这个基础上加你自己要的功能。

举个例子：

你是老师，每周要做课件。

现在的Skills能生成PPT了，但你想加一个功能——自动在每页底部加上学校Logo。

从0开始写？

你得学Python、学图像处理、学API调用...

光想想就头大。

但现在不一样。

框架已经有了，图片生成的代码已经写好了。

你只需要告诉Claude：

"帮我在生成图片后，右下角加上这个Logo"

几行代码的事。

再比如：

你是自媒体人，想生成竖版封面图而不是横版PPT。

原来的代码是16:9的，你想改成9:16。

从头写？

还是改一个参数？

哪个更快，哪个更靠谱，你心里有数。

这就是二次开发的核心价值——

不是给你一个现成的工具，而是给你一个可以无限扩展的"底座"。

今天是PPT，明天可能是海报、封面、课件、产品图...

想象力有多大，这个底座就能撑多远。

🎁 资源包里有什么：

✅ NanoBanana PPT Skills 官方版 - 完整源码，解压即用

✅ 国内可用版（我二次开发的） - 第三方API版本，国内直连

✅ 8个踩坑的完整解决方案 - 文章里只列了问题，答案全在这里

✅ 配置文件模板 - 改几个参数就能跑

✅ 两种调用方式的代码对比 - 官方库 vs HTTP请求，选适合你的

🔥 获取方式：

在公众号后台回复「AIPPT」

现在就拿到手，马上就能跑通。

别让"改天再说"变成"永远不做"。

我是阿飞，我们在「元机所」等你。

在这里，我们：

不仅分享AI应用，更探究底层逻辑；不仅提供Prompt模板，更构建可进化的提问框架；不仅拆解AI Agent玩法，更搭建能解决问题的自动化工作流。

让我们一起，将AI内化为你的思维模式与核心能力。

关注我，获取更多AI实战技巧

如果觉得有用，点个「赞👍」+「在看」，让更多人看到。

有问题可以在评论区留言，我会一一回复。

<原文链接：https://mp.weixin.qq.com/s/gEcKenbZef-amiSBYGyLtA

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

学会了PPTSkills，豆包Kimi都感觉不香了。但90%的人卡在第一步：Gemini NanoBananaPro API国内用不了。这篇帮你全解决（8个坑+国内可用）

01 你为什么"用不起来"？

02 为什么"二次开发"是小白的最佳路径

03 实战案例：PPT Skills改造全过程

第一个Skills：NanoBanana PPT（谷歌官方API版）

问题来了：国内用不了谷歌API

第二个Skills：国内可用版（第三方API）

04 下一步：不会编程怎么办？

05 写在最后

📦 这份资源包，凭什么值得你要？

请登录后发表评论