支持图文混排的Gemini Next Chat

简介

什么是 Gemini Next Chat ?

Gemini Next Chat 是一个可以让你一键部署私人 Gemini 应用的工具,支持 Gemini 1.5Gemini 2.0 多模态模型。它提供了一个简单的界面,支持图像识别和语音对话,并且拥有内置的实用插件,如网络搜索、网页阅读器、Arxiv 搜索、天气等。此外,它还支持多模态实时 API,提供流畅的语音和视频体验。

主要特点

  • 一键部署:用户可以通过简单的步骤在 Vercel 上免费部署应用,通常在一分钟内完成。
  • 跨平台支持:提供一个小型的跨平台客户端(Windows/MacOS/Linux),可在菜单栏中运行,提高工作效率。
  • 多模态模型支持:能够理解图像、视频、音频及某些文本文件,支持多种交互模式。
  • 插件支持:内置 Web 搜索、Web 阅读器、Arxiv 搜索、天气等实用插件,增强功能。
  • 快速加载:极快的首次屏幕加载速度,支持流式响应。
  • 隐私和安全:所有数据保存在用户本地浏览器中,确保隐私。
  • 多语言支持:支持多种语言,包括英语、中文、法语等。
  • 良好的用户界面:响应式设计,支持暗黑模式。

应用场景

  • 个人助理:作为智能助手与用户进行语音或文本对话,提供信息和建议。
  • 知识管理:用户可以使用该应用管理和检索与特定主题相关的信息。
  • 教育工具:用于学习和教学,可以通过多模态交互帮助学生理解复杂概念。
  • 研究辅助:支持科研人员在 Arxiv 等数据库中搜索相关文献,方便获取研究资料。
  • 跨平台应用:适用于需要在不同操作系统上运行的用户,提升工作效率。

Gemini Next Chat 非常适合希望快速搭建 AI 驱动应用的开发者和企业。

准备工作

获取 Gemini API 密钥

在浏览器中打开 https://aistudio.google.com/app/apikey,创建一个 API 密钥

这一步需要网络和区域都满足才行,后面使用就不需要满足网络条件了;

Gemini API 的代理转发

登录 https://dash.cloudflare.com ,进入 Cloudflare 仪表板,选择 AI –> AI Gateway

创建网关 ,名称可以用 gemini

点名称进入网关

点右上角 API

平台下拉,选择 Google-AI-Studio

复制并保存 API 端点,该链接即 Gemini api 的代理转发链接

Cherry Studio 应用

之前有网友反馈 国内免代理使用Gemini API 中的代理方法延时比较大,可以试试👇这种

  • 提供商类型: 选择 Gemini

  • API 秘钥:填入自己的 Gemini API 密钥
  • API 地址:填入上一步生成的 API 端点

客户端

如果不想折腾,可以试试官方的客户端应用

虽然后续使用可以不需要科学上网,但是申请 Gemini API Key 还是需要的,实在怕麻烦,也可以试试国产的大模型。目前硅基流动(SiliconFlow),注册就送 2000Tokens,虽然不是免费,但也够用一阵子的

注册地址

https://cloud.siliconflow.cn/i/NkUiXVhQ

安装

Gemini Next Chat 支持 vercel 上一键部署,但那不是我们要介绍的内容,老苏只是自己使用,没必要挂在公网上,因此还是在群晖上以 Docker 方式安装。

在注册表中搜索 xiangfa ,下拉找到 xiangfa/talk-with-gemini,版本选择 latest

本文写作时, latest 版本对应为 v1.10.2

端口

本地端口不冲突就行,不确定的话可以用命令查一下

1
2
# 查看端口占用
netstat -tunlp | grep 端口号
本地端口 容器端口
5481 3000

环境

可变
GEMINI_API_KEY (可选)您的 Gemini API 密钥,用于启用服务器 API
GEMINI_API_BASE_URL (可选)覆盖 Gemini API 请求基本 URL,默认为 https://generativelanguage.googleapis.com
NEXT_PUBLIC_GEMINI_MODEL_LIST (可选)自定义模型列表,默认为所有模型
NEXT_PUBLIC_UPLOAD_LIMIT (可选)文件上传大小限制,默认没有大小限制
ACCESS_PASSWORD (可选)访问密码,提供有限的访问控制
HEAD_SCRIPTS (可选)注入的脚本代码,用于统计或错误跟踪
EXPORT_BASE_PATH (可选)在静态部署模式中设置页面基本路径

老苏没有设置环境变量,因为在软件中设置 GEMINI_API_KEYGEMINI_API_BASE_URL 更方便

命令行安装

如果你熟悉命令行,可能用 docker cli 更快捷

1
2
3
4
5
6
# 运行容器
docker run -d \
--restart unless-stopped \
--name talk-with-gemini \
-p 5481:3000 \
xiangfa/talk-with-gemini

也可以用 docker-compose 安装,将下面的内容保存为 docker-compose.yml 文件

1
2
3
4
5
6
7
8
9
version: '3'

services:
talk-with-gemini:
image: xiangfa/talk-with-gemini
container_name: talk-with-gemini
restart: unless-stopped
ports:
- 5481:3000

然后执行下面的命令

1
2
3
4
5
6
7
8
9
10
# 新建文件夹 gemini-next-chat 
mkdir -p /volume1/docker/gemini-next-chat

# 进入 gemini-next-chat 目录
cd /volume1/docker/gemini-next-chat

# 将 docker-compose.yml 放入当前目录

# 一键启动
docker-compose up -d

运行

在浏览器中输入 http://群晖IP:5481 就能看到主界面

如果没有自适应为中文,可以进入右上角 Setting –> General Settings –> Language,下拉找到 简体中文

切换到 语言模型

  • Gemini 密钥:填入自己的 Gemini API 密钥
  • API 代理链接:填入上一步生成的 API 端点
  • 其他根据需要进行设置

所有的设置保存在浏览器中,所以换了浏览器需要重新设置,哪怕在同一台主机上;

接下来就可以开始聊天了

支持 gemini-2.0-flash-exp-image-generation 模型,可生成包含图文混排的内容

系统内置一些插件,可完成网络搜索、网页解读等,很像 Cherry Studio 现在通过 MCP 完成的功能

助理市场则收藏了近 500 个助手,很多提示词的写法是值得我们学习和研究的

参考文档

u14app/gemini-next-chat: Deploy your private Gemini application for free with one click, supporting Gemini 1.5, Gemini 2.0 models.
地址:https://github.com/u14app/gemini-next-chat

Gemini Next Chat 升级 v1.10.0,已支持最新的图文模型,可以生成图文混排的内容,对话修图等,欢迎来到新的 AGI 时代 - 开发调优 - LINUX DO
地址:https://linux.do/t/topic/497837?page=7