支持图文混排的Gemini Next Chat
简介
什么是 Gemini Next Chat ?
Gemini Next Chat是一个可以让你一键部署私人Gemini应用的工具,支持Gemini 1.5、Gemini 2.0多模态模型。它提供了一个简单的界面,支持图像识别和语音对话,并且拥有内置的实用插件,如网络搜索、网页阅读器、Arxiv搜索、天气等。此外,它还支持多模态实时API,提供流畅的语音和视频体验。
主要特点
- 一键部署:用户可以通过简单的步骤在
Vercel上免费部署应用,通常在一分钟内完成。 - 跨平台支持:提供一个小型的跨平台客户端(
Windows/MacOS/Linux),可在菜单栏中运行,提高工作效率。 - 多模态模型支持:能够理解图像、视频、音频及某些文本文件,支持多种交互模式。
- 插件支持:内置
Web搜索、Web阅读器、Arxiv搜索、天气等实用插件,增强功能。 - 快速加载:极快的首次屏幕加载速度,支持流式响应。
- 隐私和安全:所有数据保存在用户本地浏览器中,确保隐私。
- 多语言支持:支持多种语言,包括英语、中文、法语等。
- 良好的用户界面:响应式设计,支持暗黑模式。
应用场景
- 个人助理:作为智能助手与用户进行语音或文本对话,提供信息和建议。
- 知识管理:用户可以使用该应用管理和检索与特定主题相关的信息。
- 教育工具:用于学习和教学,可以通过多模态交互帮助学生理解复杂概念。
- 研究辅助:支持科研人员在
Arxiv等数据库中搜索相关文献,方便获取研究资料。 - 跨平台应用:适用于需要在不同操作系统上运行的用户,提升工作效率。
Gemini Next Chat 非常适合希望快速搭建 AI 驱动应用的开发者和企业。
准备工作
获取 Gemini API 密钥
在浏览器中打开 https://aistudio.google.com/app/apikey,创建一个 API 密钥
这一步需要网络和区域都满足才行,后面使用就不需要满足网络条件了;

Gemini API 的代理转发
登录 https://dash.cloudflare.com ,进入 Cloudflare 仪表板,选择 AI –> AI Gateway

点 创建网关 ,名称可以用 gemini

点名称进入网关

点右上角 API

平台下拉,选择 Google-AI-Studio

复制并保存 API 端点,该链接即 Gemini api 的代理转发链接

Cherry Studio 应用
之前有网友反馈 国内免代理使用Gemini API 中的代理方法延时比较大,可以试试👇这种
- 提供商类型: 选择
Gemini

API 秘钥:填入自己的Gemini API 密钥;API 地址:填入上一步生成的API 端点

客户端
如果不想折腾,可以试试官方的客户端应用

虽然后续使用可以不需要科学上网,但是申请 Gemini API Key 还是需要的,实在怕麻烦,也可以试试国产的大模型。目前硅基流动(SiliconFlow),注册就送 2000 万 Tokens,虽然不是免费,但也够用一阵子的
注册地址
https://cloud.siliconflow.cn/i/NkUiXVhQ

安装
Gemini Next Chat 支持 vercel 上一键部署,但那不是我们要介绍的内容,老苏只是自己使用,没必要挂在公网上,因此还是在群晖上以 Docker 方式安装。
在注册表中搜索 xiangfa ,下拉找到 xiangfa/talk-with-gemini,版本选择 latest。
本文写作时,
latest版本对应为v1.10.2;

端口
本地端口不冲突就行,不确定的话可以用命令查一下
1 | # 查看端口占用 |
| 本地端口 | 容器端口 |
|---|---|
5481 |
3000 |

环境
| 可变 | 值 |
|---|---|
GEMINI_API_KEY |
(可选)您的 Gemini API 密钥,用于启用服务器 API |
GEMINI_API_BASE_URL |
(可选)覆盖 Gemini API 请求基本 URL,默认为 https://generativelanguage.googleapis.com |
NEXT_PUBLIC_GEMINI_MODEL_LIST |
(可选)自定义模型列表,默认为所有模型 |
NEXT_PUBLIC_UPLOAD_LIMIT |
(可选)文件上传大小限制,默认没有大小限制 |
ACCESS_PASSWORD |
(可选)访问密码,提供有限的访问控制 |
HEAD_SCRIPTS |
(可选)注入的脚本代码,用于统计或错误跟踪 |
EXPORT_BASE_PATH |
(可选)在静态部署模式中设置页面基本路径 |
老苏没有设置环境变量,因为在软件中设置 GEMINI_API_KEY 和 GEMINI_API_BASE_URL 更方便
命令行安装
如果你熟悉命令行,可能用 docker cli 更快捷
1 | # 运行容器 |
也可以用 docker-compose 安装,将下面的内容保存为 docker-compose.yml 文件
1 | version: '3' |
然后执行下面的命令
1 | # 新建文件夹 gemini-next-chat |

运行
在浏览器中输入 http://群晖IP:5481 就能看到主界面

如果没有自适应为中文,可以进入右上角 Setting –> General Settings –> Language,下拉找到 简体中文

切换到 语言模型
Gemini 密钥:填入自己的Gemini API 密钥;API 代理链接:填入上一步生成的API 端点- 其他根据需要进行设置
所有的设置保存在浏览器中,所以换了浏览器需要重新设置,哪怕在同一台主机上;

接下来就可以开始聊天了

支持 gemini-2.0-flash-exp-image-generation 模型,可生成包含图文混排的内容

系统内置一些插件,可完成网络搜索、网页解读等,很像 Cherry Studio 现在通过 MCP 完成的功能

助理市场则收藏了近 500 个助手,很多提示词的写法是值得我们学习和研究的

参考文档
u14app/gemini-next-chat: Deploy your private Gemini application for free with one click, supporting Gemini 1.5, Gemini 2.0 models.
地址:https://github.com/u14app/gemini-next-chatGemini Next Chat 升级 v1.10.0,已支持最新的图文模型,可以生成图文混排的内容,对话修图等,欢迎来到新的 AGI 时代 - 开发调优 - LINUX DO
地址:https://linux.do/t/topic/497837?page=7