跳转到内容

支持的模型

Twinny 是一个可配置的扩展/接口,这意味着许多模型在技术上都可以被支持。然而,并非所有模型在某些场景下都能与 Twinny 良好配合。以下是已测试并与 Twinny 配合良好的模型列表。如果您发现某个模型有效但未列出,请告知我们,我们会将其添加到列表中,或者您也可以提交 pull request 来添加它。

聊天模型

理论上,任何经过训练用于指令的聊天模型都能与 Twinny 配合使用。以下是一些推荐用于聊天的模型示例。

填充中间部分模型

由于训练数据的原因,只有某些模型支持填充中间部分。以下是一些推荐用于填充中间部分的模型示例。如果您发现某个模型有效但未列出,请告知我们,我们会将其添加到列表中,或者您也可以提交 pull request 来添加它。

Qwen2.5-coder 模型

Codellama 模型

code 版本的 Codellama 模型。

注意:codellama:34b 版本在填充中间部分时效果不佳。

Deepseek Coder 模型

base 版本的 Deepseek-Coder 模型。

注意:非 base 版本的模型在填充中间部分时效果不佳。

Starcoder 模型

base 版本的 Starcoder 模型。默认和基础模型相同。

注意:Starcoder2 在完成时并不总是会停止。通过降低温度并增加重复惩罚可以缓解这一问题。

使用 Starcoder2 7b 获得最佳效果。

Stablecode 模型

code 版本的 Stablecode 模型。

Codegemma 模型

code 版本的 Codegemma 模型。

注意:Codegemma 在完成时并不总是会停止。通过降低温度并增加重复惩罚可以缓解这一问题。