支持图文混排的Gemini Next Chat

发表于 2025-05-05 更新于 2026-05-25 分类于各种折腾 Waline：阅读次数：本文字数： 3k 阅读时长 ≈ 3 分钟

Gemini Next Chat 支持最新的图文模型，可以生成图文混排的内容，对话修图等。

简介

什么是 Gemini Next Chat ？

Gemini Next Chat 是一个可以让你一键部署私人 Gemini 应用的工具，支持 Gemini 1.5 、 Gemini 2.0 多模态模型。它提供了一个简单的界面，支持图像识别和语音对话，并且拥有内置的实用插件，如网络搜索、网页阅读器、Arxiv 搜索、天气等。此外，它还支持多模态实时 API，提供流畅的语音和视频体验。

主要特点

一键部署：用户可以通过简单的步骤在 Vercel 上免费部署应用，通常在一分钟内完成。
跨平台支持：提供一个小型的跨平台客户端（Windows/MacOS/Linux），可在菜单栏中运行，提高工作效率。
多模态模型支持：能够理解图像、视频、音频及某些文本文件，支持多种交互模式。
插件支持：内置 Web 搜索、Web 阅读器、Arxiv 搜索、天气等实用插件，增强功能。
快速加载：极快的首次屏幕加载速度，支持流式响应。
隐私和安全：所有数据保存在用户本地浏览器中，确保隐私。
多语言支持：支持多种语言，包括英语、中文、法语等。
良好的用户界面：响应式设计，支持暗黑模式。

应用场景

个人助理：作为智能助手与用户进行语音或文本对话，提供信息和建议。
知识管理：用户可以使用该应用管理和检索与特定主题相关的信息。
教育工具：用于学习和教学，可以通过多模态交互帮助学生理解复杂概念。
研究辅助：支持科研人员在 Arxiv 等数据库中搜索相关文献，方便获取研究资料。
跨平台应用：适用于需要在不同操作系统上运行的用户，提升工作效率。

Gemini Next Chat 非常适合希望快速搭建 AI 驱动应用的开发者和企业。

准备工作

获取 Gemini API 密钥

在浏览器中打开 https://aistudio.google.com/app/apikey，创建一个 API 密钥

这一步需要网络和区域都满足才行，后面使用就不需要满足网络条件了；

Gemini API 的代理转发

点 创建网关 ，名称可以用 gemini

点名称进入网关

点右上角 API

平台下拉，选择 Google-AI-Studio

复制并保存 API 端点，该链接即 Gemini api 的代理转发链接

Cherry Studio 应用

之前有网友反馈国内免代理使用Gemini API 中的代理方法延时比较大，可以试试👇这种

提供商类型：选择 Gemini

API 秘钥：填入自己的 Gemini API 密钥；
API 地址：填入上一步生成的 API 端点

客户端

如果不想折腾，可以试试官方的客户端应用

虽然后续使用可以不需要科学上网，但是申请 Gemini API Key 还是需要的，实在怕麻烦，也可以试试国产的大模型。目前硅基流动（SiliconFlow），注册就送 2000 万 Tokens，虽然不是免费，但也够用一阵子的

注册地址

https://cloud.siliconflow.cn/i/NkUiXVhQ

安装

Gemini Next Chat 支持 vercel 上一键部署，但那不是我们要介绍的内容，老苏只是自己使用，没必要挂在公网上，因此还是在群晖上以 Docker 方式安装。

在注册表中搜索 xiangfa ，下拉找到 xiangfa/talk-with-gemini，版本选择 latest。

本文写作时， latest 版本对应为 v1.10.2；

端口

本地端口不冲突就行，不确定的话可以用命令查一下

1 2	# 查看端口占用 netstat -tunlp \| grep 端口号

本地端口	容器端口
`5481`	`3000`

环境

可变	值
`GEMINI_API_KEY`	（可选）您的 `Gemini API` 密钥，用于启用服务器 `API`
`GEMINI_API_BASE_URL`	（可选）覆盖 `Gemini API` 请求基本 `URL`，默认为 `https://generativelanguage.googleapis.com`
`NEXT_PUBLIC_GEMINI_MODEL_LIST`	（可选）自定义模型列表，默认为所有模型
`NEXT_PUBLIC_UPLOAD_LIMIT`	（可选）文件上传大小限制，默认没有大小限制
`ACCESS_PASSWORD`	（可选）访问密码，提供有限的访问控制
`HEAD_SCRIPTS`	（可选）注入的脚本代码，用于统计或错误跟踪
`EXPORT_BASE_PATH`	（可选）在静态部署模式中设置页面基本路径

老苏没有设置环境变量，因为在软件中设置 GEMINI_API_KEY 和 GEMINI_API_BASE_URL 更方便

命令行安装

如果你熟悉命令行，可能用 docker cli 更快捷

# 运行容器
docker run -d \
   --restart unless-stopped \
   --name talk-with-gemini \
   -p 5481:3000 \
   xiangfa/talk-with-gemini

也可以用 docker-compose 安装，将下面的内容保存为 docker-compose.yml 文件

version: '3'

services:
  talk-with-gemini:
    image: xiangfa/talk-with-gemini
    container_name: talk-with-gemini
    restart: unless-stopped
    ports:
      - 5481:3000

然后执行下面的命令

# 新建文件夹 gemini-next-chat 
mkdir -p /volume1/docker/gemini-next-chat

# 进入 gemini-next-chat 目录
cd /volume1/docker/gemini-next-chat

# 将 docker-compose.yml 放入当前目录

# 一键启动
docker-compose up -d

运行

在浏览器中输入 http://群晖IP:5481 就能看到主界面

如果没有自适应为中文，可以进入右上角 Setting –> General Settings –> Language，下拉找到 简体中文

切换到 语言模型

Gemini 密钥：填入自己的 Gemini API 密钥；
API 代理链接：填入上一步生成的 API 端点
其他根据需要进行设置

所有的设置保存在浏览器中，所以换了浏览器需要重新设置，哪怕在同一台主机上；

接下来就可以开始聊天了

支持 gemini-2.0-flash-exp-image-generation 模型，可生成包含图文混排的内容

系统内置一些插件，可完成网络搜索、网页解读等，很像 Cherry Studio 现在通过 MCP 完成的功能

助理市场则收藏了近 500 个助手，很多提示词的写法是值得我们学习和研究的

参考文档

u14app/gemini-next-chat: Deploy your private Gemini application for free with one click, supporting Gemini 1.5, Gemini 2.0 models.
地址：https://github.com/u14app/gemini-next-chat

Gemini Next Chat 升级 v1.10.0，已支持最新的图文模型，可以生成图文混排的内容，对话修图等，欢迎来到新的 AGI 时代 - 开发调优 - LINUX DO
地址：https://linux.do/t/topic/497837?page=7