详解 Kubernetes 中的等待重试机制

Kubernetes 中有很多需要重试的地方,比如重启 Pod、CSI 的 PVC 挂载重试等。出错重试时通常都会等待一个指数增长的时间,本文就来解析这个等待重试的机制。
2025/02/17 20:16 下午 posted in  Kubernetes

告别“服务器繁忙”:JuiceFS 助力打造专属 DeepSeek 牧场

春节期间,DeepSeek 的横空出世引发了广泛关注。作为一款强大的语言模型,DeepSeek 因其强大的功能和广泛的应用而受到用户的热烈追捧。然而,随着使用量的不断增加,我们在使用过程中经常遇到“服务器繁忙”,令人破防。为了解决这一问题,本文将探讨如何通过本地部署 DeepSeek 服务,打造一个高效自主的使用环境。通过结合 JuiceFS 的存储能力和 Ollama 的部署优势,用户可以轻松建立自己的“DeepSeek 牧场”,从而实现更灵活、更高效的模型使用体验。
2025/02/05 17:56 下午 posted in  大模型

揭秘容器内存统计

本文整理了容器内存统计相关内容,揭秘了 PageCache、cgroup 以及 OOM 等容器相关的真相。
2024/09/05 16:17 下午 posted in  Kubernetes

Ollama + JuiceFS:一次拉取,到处运行

Ollma 是一个简化大模型部署和运行的工具,一方面通过提供类 Docker 的使用方式,运行一个大模型实例就和启动一个容器一样简单,另一方面,通过提供 OpenAI 兼容的 API,磨平大模型之间的使用差异。
2024/08/27 18:03 下午 posted in  大模型

浅析 Rook 如何管理 Ceph Cluster

最近做了很多 Rook 的调研工作,边学习边梳理清楚了 Rook 如何管理 Ceph 集群。这篇文章就来讲解 Rook 如何将 Ceph 这么复杂的系统在 Kubernetes 中进行管理和维护。
2024/07/26 22:27 下午 posted in  Kubernetes