酒馆配置流程:
1、注意:API选: 聊天补全
2、聊天补全来源选: 自定义兼容Openai
2、端点URL(任选一个复制粘贴,不通就切换其他的):
端点1:https://api.lukuai.com/v1
端点2:https://api.lukuai.com
3、APIkey:sk-xxxxxx 注意删除文字和冒号
4、模型名称输入:gemini-2.5-pro
5、点左下角“连接”展示Valid就成功了
推荐配置细节和常见问题:
Q:酒馆 SillyTavern 怎么下载安装:
酒馆配置网上有很多教程,B站或者抖音多看两个视频找个讲解详细的来,还有免费分享的懒人包直接下载解压运行的,还有网页端的云酒馆,很多种,自行安排即可,基本都支持接入。
Q:报错/连接失败的问题:
1、切换端点URL,重新点连接试试。
2、切换别的模型试下回复。
3、重启应用,或者开启新的对话试一下。
4、设置选择流式传输,别选输出最大token选项(高峰期延迟高易报错)。
5、对话楼层上百层达到上下文上限了,就总结一下,开新对话继续聊。
Q:Gemini模型配置/报错等 检查这几个设置:
上下文长度设置 两百万字符
回复长度设置 43000
每次生成回复 1
选流式传输
温度设置1
top设置1
Q:克劳德模型配置/报错等 检查这几个设置:
最大回复长度200条(或者两百万字符)
单次回复长度43000
选流式传输
温度设置1
top设置1
Q:处理超长文本一次性发送出来模型会卡死,要分步来:
方法:对话流式投喂(最通用,适合临时分析)
如果你只是想让 AI 读一遍这个长故事或文档,然后基于此进行对话,请严格按照 “预告 – 分段 – 总结” 三步走策略。
第1步:输入【预告提示词】
先告诉 AI 你要发长文了,并要求它不要立即回复/分析,而是仅仅回复“收到”。
请直接发送这段话给 AI:
“我有一段非常长的文本(约几万字)需要发给你阅读。由于长度限制,我将分多次发送。在我发送完所有内容并说‘发送完毕’之前,请不要进行任何总结或回复。每次收到片段后,你只需要回复:‘已收到第 X 部分,请继续’。如果你明白了,请确认。”
第2步:分段发送
等 AI 回复“明白了”之后,将你的长文本手动切分。
切分大小:建议每段 3000-5000 字符(太长容易断连)。
格式:在每一段的开头手动加上 【第 1 部分】、【第 2 部分】 的标记,防止 AI 搞乱顺序。
操作:发一段 -> 等 AI 回复“已收到” -> 再发下一段。
第3步:发送完毕与执行
发完最后一段后,发送指令:
“【发送完毕】。以上就是全部内容。现在请你根据这些内容,执行以下任务:(例如:总结剧情 / 扮演其中的角色 A / 分析逻辑漏洞等)”




