基于 DGX Spark 自建推理集群,提供 OpenAI 兼容 API。
OpenAI 兼容 API,一行 curl 即用。
qwen2.5 32B/14B、llama3.1 8B 等
数据仅在本地运行,不经过第三方云平台。
固定月费,无隐藏计费。
一行代码切换 base_url 即可接入
实时用量面板,随时查看