把本地部署的DeepSeek接入Trae这类AI编程工具

    本地 DeepSeek 接入 AI 编程工具

    将 LM Studio 变为兼容 OpenAI API 的本地服务器,让 Trae / VS Code / IDEA 调用你电脑里的 DeepSeek。

    核心原理

    LM Studio 的 "Local Inference Server" 功能,可以将你加载好的模型变成一个本地的 API 服务器。支持自定义模型的编程工具(如 Trae、Continue 插件等)就能像调用云端服务一样,调用你电脑里的 DeepSeek 模型。

    前提条件: 请确保 LM Studio 已经加载好 DeepSeek 模型,并处于运行状态。本地 API 地址通常为:http://localhost:1234/v1


    操作指南

    1. 启动 LM Studio 的本地服务器

    1. 在 LM Studio 界面中,找到并点击左侧的 (Local Inference Server) 图标。
    2. 在服务器设置中,确认端口号(通常是 1234),然后点击 "Start Server" 按钮。
    3. 启动成功后,你的本地 API 地址为:http://localhost:1234/v1

    2. 在 AI 编程工具中进行配置

    对于 Trae

    1. 进入 Trae 的设置页面,找到 "模型" (Model) 管理面板。
    2. 点击 "添加模型" (Add Model)。
    3. 在添加方式中,选择 "自定义配置" (Custom Configuration)。
    4. 关键配置项如下:
      • API 格式 (API Format):选择 OpenAI Compatible
      • 请求地址 (URL / Base Path):填入 http://localhost:1234/v1/(注意:Trae 要求填入基础路径,地址要以 / 结尾)。
      • 模型 ID (Model ID):填入你在 LM Studio 中使用的具体模型名称,例如 deepseek-r1-distill-qwen-7b
      • API 密钥 (API Key):因为是本地服务,可以随意填写,如 localnot-needed
    5. 保存配置,如果连接成功,该模型就会出现在你的模型列表中。

    提示: Trae 也内置了 DeepSeek 的云端版本,但你配置的是本地地址,因此调用的是你电脑上的模型,完全离线、免费且保护隐私。

    对于 VS Code(Continue 插件)

    1. 在 VS Code 扩展市场安装 "Continue" 插件。
    2. 安装后,按 Cmd+Shift+P (Mac) 或 Ctrl+Shift+P (Win) 打开命令面板,输入并选择 "Continue: Open Config" 打开配置文件 config.json
    3. models 数组中,添加一个本地模型配置:
      {
        "title": "DeepSeek Local",
        "provider": "openai",
        "model": "deepseek-r1-distill-qwen-7b",   // 替换为你的模型名
        "apiBase": "http://localhost:1234/v1",
        "apiKey": "local"
      }
    4. 保存文件后,就可以在 Continue 插件中选择这个本地模型了。

    对于 IntelliJ IDEA

    1. 在插件市场搜索并安装 "DeepSeek Local Integration" 或类似的插件。
    2. Settings > Tools > DeepSeek Local 中配置:
      • Model Path:指向本地模型文件路径。
      • Device:选择 cuda:0 (GPU) 或 cpu
      • 其他参数如 maxTokenstemperature 可按需调整。
    3. 或者,使用支持 OpenAI API 的通用插件,配置方式与 VS Code 的 Continue 类似。

    关键参数建议

    配置时,建议根据你的硬件调整以下参数以获得更好性能:

    参数推荐值说明
    上下文窗口
    (Context Window)
    4096 起步稳定后再逐步调高,硬件允许可增至 8192 或更高
    最大输出 Token
    (Max Tokens)
    2048 或更高代码生成场景建议设高一些,保证长输出完整
    Temperature0.1 – 0.3 (代码补全)
    0.7 (对话场景)
    代码补全用低值提高准确性;对话可适当提高创造性

    注意: 具体数值可根据你的硬件配置(显存、内存)和实际体验微调。如果遇到显存不足,可适当降低上下文窗口或使用量化模型。


    总结

    通过以上步骤,你就成功地将本地部署的 DeepSeek 模型接入到 AI 编程工具中,实现了 完全免费、离线、保护隐私 的 AI 编程辅助。不再依赖云端 API,所有代码理解与生成都在你自己的电脑上完成。

    如果在配置过程中遇到问题,欢迎随时查阅 LM Studio 文档或社区讨论。


    本文档可自由复制 · 基于 LM Studio + DeepSeek 本地部署方案
    更新于 2026 年 6 月