# API 连接

SillyTavern 可以连接多种大语言模型(LLM)API。 下面介绍它们各自的优缺点和使用案例。

# 本地 APIs

  • 这些 LLM API 可在个人电脑上运行。
  • 它们可以免费使用,没有内容过滤器。
  • 安装过程可能比较复杂(SillyTavern 开发团队不提供相关支持)。
  • 需要从 HuggingFace 单独下载 LLM 模型,每个模型可能有 10-50GB 大小。
  • 大多数模型不如云 LLM API 功能强大。

# KoboldAI

  • 可在个人电脑上运行,100% 私有,提供多种模型
  • 可最直接地控制AI的生成设置
  • 需要大量 GPU VRAM(6-24GB,取决于 LLM 模型)
  • 模型限制 2k 上下文
  • 无流式传输模式
  • 常用的 KoboldAI 版本:

# KoboldCPP

  • GitHub
  • 功能与 KoboldAI 相同,但使用的是 CPU 和 RAM 而非 GPU
  • 在 Windows 上安装非常简单(在 MacOS 和 Linux 上必须从源代码编译)
  • 比 GPU API 慢

# Kobold Horde

  • 此API可以让 SillyTavern 开箱即用,无需额外设置。
  • it uses the GPU of individual volunteers (Horde Workers) to process responses for your chat inputs
  • at the mercy of the Worker in terms of generation wait times, AI settings, and available models
  • 网站

# Oobabooga TextGeneration WebUI

  • 功能与 KoboldAI 相似,但同时有流式传输和 Gradio 接口
  • 支持比 KoboldAI 更广泛的模型类型(4-bit和 8-bit 量化模型)
  • 提供一键安装程序
  • 经常更新,有时会破坏与 SillyTavern 的兼容性
  • GitHub

# 云 LLM APIs

  • 这些 LLM API 以云服务的形式运行,无需电脑资源
  • 它们比大多数本地 LLM 更强大/更智能
  • 不过,它们都有不同程度的内容过滤,而且大多数需要付费

# NovelAI

# ChatGPT (by OpenAI)

  • 易于设置和获取 API 密钥,提供 4k、8k、32k 上下文模型。
  • 免费试用需要一个有效的电话号码
  • 免费试用后,所有使用按月付费。
  • 角色扮演的写作风格容易重复、可预测。(译者注:写作套路比较固定,经常复读机。)
  • 设置指南

# Claude (by Anthropic)

  • 推荐希望自己的AI对话具有创造性和独特写作风格的用户使用
  • 提供 4k、8k、100k 上下文模型
  • 所有 API 中最强的内容过滤器(截至 2023 年 6 月)
  • 对大多数模型的访问受限
  • 目前不接受创建新账户;在等待名单上(2023 年 6 月)
  • 网站

# WindowAI/OpenRouter

  • 该浏览器扩展允许你连接到上述云 LLM
  • 在 WindowAI 中使用自己的 ChatGPT/Claude API 密钥
  • 使用 OpenRouter 他们提供的的 API 密钥需要付费
  • 如果你不想在每个服务上创建单独的账户,这很有用
  • 网站网站

# Mancer AI

  • 托管无限制模型的服务,无需越狱。
  • 使用“点数”支付各种模型的 Token。每天可以获得免费的点数。
  • 默认情况下不记录提示词,但你可以启用它来获得点数折扣。
  • 使用类似于"Oobabooga TextGeneration WebUI "的 API,详见 Mancer文档
  • 网站, SillyTavern 设置指南