oMLX：macOS菜单栏管理13k星的LLM推理服务器，连续批处理+SSD缓存

Mon, 11 May 2026 13:10:00 +0800

“我试过的每个 LLM 服务器都要我在便利性和控制性之间二选一。我想把常用模型常驻内存，把重的模型自动 swap 到 SSD，还能设置上下文限制——全部从菜单栏管理。这就是我造 oMLX 的原因。”

推理服务器 on Text Matrix