网络技巧
本指南展示如何在受限或慢速网络环境中构建和运行,而无需修改仓库文件。您将使用小型本地覆盖文件和 compose 覆盖,以保持代码库整洁。
本文将解决:
- Hugging Face 模型下载被阻止/缓慢
- Docker 构建期间 Go 模块获取被阻止
- mock-vLLM 测试镜像的 PyPI 访问
TL;DR:选择您的路径
- 最快且最可靠:使用
./models中的本地模型,完全跳过 HF 网络。 - 否则:通过 compose 覆盖挂载 HF 缓存 + 设置镜像环境变量。
- 构建时:使用覆盖 Dockerfile 设置 Go 镜像(提供示例)。
- mock-vllm:使用覆盖 Dockerfile 设置 pip 镜像(提供示例)。
您可以根据情况混合使用这些方法。
1. Hugging Face 模型
除非您在本地提供模型,否则路由将在首次运行时下载嵌入模型。如果可能,优先选择方案 A。