Omi：你的第二大脑——9K Stars的全平台AI记忆助手，支持桌面/手机/可穿戴设备

2026-04-18 约 7018 字预计阅读 18 分钟

Omi：你的第二大脑——9K Stars 的全平台 AI 记忆助手，支持桌面/手机/可穿戴设备

目标读者：追求个人知识管理效率的开发者、AI 产品爱好者、寻求"第二大脑"解决方案的知识工作者 预计阅读时间：40-50 分钟 前置知识：了解 RAG（检索增强生成）基本概念，对 AI 助手产品有使用经验 难度定位：⭐⭐⭐⭐ 专家设计

§1 学习目标

理解 Omi 的核心定位：为何被称为"比第一大脑更可信的第二大脑"
掌握 Omi 的技术架构：端侧设备+云端后端+多模态 AI 的协同原理
了解多平台覆盖：macOS 应用、iOS/Android App、可穿戴设备固件
能够部署和二次开发：本地运行后端、构建应用、使用 SDK
理解 AI 记忆系统：上下文捕捉→向量检索→对话生成的完整链路

§2 背景与动机：为何需要"第二大脑"

2.1 人类记忆的局限性

记忆类型	容量	保持时间	检索速度
工作记忆	7±2 个信息块	几秒~几分钟	即时但有限
短期记忆	20~30 秒	几分钟	慢，容易遗忘
长期记忆	无限	数年~一生	最慢，需要线索

问题：人类记忆在信息爆炸时代严重过载，导致"知识焦虑"和"决策疲劳"。

2.2 现有方案的局限

方案一：笔记应用（Notion/Obsidian）

手动记录，依赖用户主动整理
无法捕捉口头交流、屏幕内容
检索是精确匹配，非语义搜索

方案二：AI 助手聊天记录

上下文窗口有限，超出即遗忘
无法搜索历史对话
无法与个人知识库结合

2.3 Omi 的设计理念

Omi 提出了"第二大脑"的概念：让 AI 实时捕捉你的屏幕和对话，主动整理成可检索的知识图谱。

你看到的内容 + 你说的话 → Omi实时捕捉 → 向量化存储 → AI对话检索

关键价值：

被动记录：无需主动操作，Omi 自动记录
上下文完整：屏幕+语音+文字，多模态融合
语义检索：不只是关键词，是理解意图的搜索
跨设备同步：桌面→手机→可穿戴，无缝衔接

§3 技术架构：全栈开源方案

3.1 整体架构

┌─────────────────────────────────────────────────────────┐
│                      Your Devices                        │
│                                                          │
│  ┌──────────┐  ┌──────────────┐  ┌───────────────────┐  │
│  │ Omi      │  │ macOS App    │  │ Mobile App        │  │
│  │ Wearable │  │ (Swift/Rust) │  │ (Flutter)         │  │
│  └────┬─────┘  └──────┬───────┘  └────────┬──────────┘  │
│       │    BLE          │   HTTPS/WS        │             │
└───────┼────────────────┼───────────────────┼─────────────┘
        │                │                   │
        ▼                ▼                   ▼
┌─────────────────────────────────────────────────────────┐
│                    Omi Backend (Python)                  │
│                                                          │
│  ┌─────────┐  ┌──────────┐  ┌─────────┐  ┌──────────┐  │
│  │ Listen  │  │ Pusher   │  │ VAD     │  │ Diarizer │  │
│  │ (REST)  │  │ (WS)     │  │ (GPU)   │  │ (GPU)    │  │
│  └─────────┘  └──────────┘  └─────────┘  └──────────┘  │
│                                                          │
│  ┌─────────┐  ┌──────────┐  ┌─────────┐  ┌──────────┐  │
│  │ Deepgram│  │ Firestore│  │ Redis   │  │ LLMs     │  │
│  │ (STT)   │  │ (DB)     │  │ (Cache) │  │ (AI)     │  │
│  └─────────┘  └──────────┘  └─────────┘  └──────────┘  │
└─────────────────────────────────────────────────────────┘

3.2 各组件详解

组件	技术栈	路径	功能
macOS App	Swift/SwiftUI/Rust	`desktop/`	屏幕捕捉、语音输入
Mobile App	Flutter	`app/`	iOS/Android 双端
Backend API	Python/FastAPI	`backend/`	业务逻辑、LLM 调用
Firmware	C/nRF/Zephyr	`omi/`	可穿戴设备固件
Omi Glass	ESP32-S3/C	`omiGlass/`	眼镜设备固件
SDKs	React Native/Swift/Python	`sdks/`	多语言 SDK

3.3 核心技术栈

前端：

macOS：SwiftUI（声明式 UI）+ Rust（高性能后端）
移动端：Flutter（跨平台）+ 平台原生 SDK

后端：

Python + FastAPI（高性能 API 框架）
Firebase Firestore（NoSQL 数据库）
Redis（缓存层）
Deepgram（语音转文本 STT）
VAD（语音活动检测，GPU 加速）
Diarizer（说话人分离，GPU 加速）

AI：

LLMs 集成：OpenAI/Anthropic 等主流模型
RAG 管道：向量检索+生成

§4 核心功能详解

4.1 屏幕捕捉与实时转录

macOS 应用：

实时屏幕捕捉（隐私保护设计）
本地音频采集
与后端实时同步

技术实现：

屏幕帧 → 本地处理（脱敏）→ 压缩传输 → 后端VAD检测 → Deepgram STT → 向量化

4.2 多设备同步

Omi Wearable：

BLE（低功耗蓝牙）连接
连续音频捕捉
24 小时+续航设计

Omi Glass：

ESP32-S3 芯片
摄像头+音频
开发者套件开放购买

4.3 AI 对话与记忆检索

对话流程：

用户问题 → 意图分析 → 向量检索（Omi自研向量引擎）→ 上下文组装 → LLM生成 → 回复

注：Omi 使用自研的向量检索引擎，具体实现细节未完全开源。

特性：

记得你见过的所有内容
跨对话的长期记忆
主动建议和行动项

4.4 应用开发平台

SDK 支持：

Python SDK：后端集成
Swift SDK：iOS/macOS 集成
React Native SDK：跨平台移动开发
MCP Server：Model Context Protocol 集成

可能的应用场景：

个人知识管理：构建第二大脑
会议记录：自动转录和摘要
项目文档：跨设备同步

§5 快速开始：5 分钟上手

5.1 macOS 桌面应用

方式一：快速开始（推荐）

git clone https://github.com/BasedHardware/omi.git && cd omi/desktop && ./run.sh

这会自动构建 macOS 应用、连接云端后端、启动 App。无需配置 env 文件或本地后端。

依赖：

macOS 14+
Xcode（包含 Swift 和代码签名）

方式二：本地完整开发

xcode-select --install
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh

git clone https://github.com/BasedHardware/omi.git
cd omi/desktop
cp Backend-Rust/.env.example Backend-Rust/.env

./run.sh

5.2 移动端（iOS/Android）

iOS

cd app && bash setup.sh ios

Android

cd app && bash setup.sh android

5.3 可穿戴设备

刷固件

# 参考文档
https://docs.omi.me/doc/get_started/Flash_device

§6 开发扩展：基于 Omi 构建应用

6.1 MCP Server 集成

Omi 提供了 MCP Server，可以与各类 AI 编码助手集成：

{
  "mcpServers": {
    "omi": {
      "command": "npx",
      "args": ["-y", "@based/omi-mcp"]
    }
  }
}

6.2 Python SDK 使用

注意：Omi 的 Python SDK 主要面向后端集成，具体的 import 路径需参考官方文档。核心功能包括：

搜索记忆：client.search(query) 查询历史记忆
对话历史：client.conversations.list() 获取历史会话
行动项管理：client.action_items 创建和管理待办

6.3 移动端 SDK

Omi 提供多平台 SDK 支持：

平台	SDK	路径
iOS/macOS	Swift SDK	`sdks/swift/`
Android	React Native SDK	`sdks/react-native/`
跨平台	Python SDK	`sdks/python/`

6.4 应用开发示例

以下示例展示如何使用 Web API 与 Omi 后端交互：

// Web应用接入Omi
const OMI_API_KEY = 'your-api-key';

// 搜索记忆
async function searchMemories(query: string) {
  const response = await fetch('YOUR_OMI_API_ENDPOINT/memories/search', {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${OMI_API_KEY}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify({ query })
  });
  return response.json();
}

// 监听新记忆（通过WebSocket）
const ws = new WebSocket('YOUR_OMI_WS_ENDPOINT');
ws.onmessage = (event) => {
  const memory = JSON.parse(event.data);
  console.log('新记忆:', memory.content);
};

6.5 练习：构建你的第一个 Omi 应用

练习目标：使用 Omi API 构建一个简单的记忆搜索工具

前置准备：

已安装 Omi App（macOS/iOS/Android）
已注册 Omi 账号
获取了 API Key（参考官方文档）

详细步骤：

Step 1：创建一些记忆

打开 Omi App
进行几次对话或添加笔记
确保有足够的内容可供搜索

Step 2：获取 API Key 参考 https://docs.omi.me/api-reference 获取 API 访问方式

Step 3：编写搜索代码

// 使用官方SDK或直接调用API
const OMI_API_KEY = 'your-api-key';

async function searchMemories(query: string) {
  // 参考官方API文档构建请求
  const response = await fetch('YOUR_API_ENDPOINT/memories/search', {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${OMI_API_KEY}`,
      'Content-Type': 'application/json'
    },
    body: JSON.stringify({ query })
  });
  return response.json();
}

// 测试搜索
const results = await searchMemories('会议');
console.log(results);

验证标准：

成功调用搜索 API
返回结果与记忆内容匹配
实现了错误处理（API Key 无效等情况）

进阶挑战：

尝试实时监听新记忆（WebSocket）
构建一个简单的 Web 界面展示记忆时间线

§7 硬件生态：开源可穿戴设备

7.1 Omi Wearable

设计：紧凑轻便，24 小时+佩戴
BLE 连接：低功耗蓝牙与手机同步
固件：开源（omi/目录，nRF/Zephyr）

7.2 Omi Glass Dev Kit

芯片：ESP32-S3
传感器：摄像头+音频
购买：https://www.omi.me/glass
开源硬件设计：https://docs.omi.me/doc/hardware/consumer/electronics

7.3 开发者资源

资源	链接
购买指南	https://docs.omi.me/doc/assembly/Buying_Guide
构建指南	https://docs.omi.me/doc/assembly/Build_the_device
固件烧录	https://docs.omi.me/doc/get_started/Flash_device
硬件规格	https://docs.omi.me/doc/hardware/DevKit2

§8 FAQ

Q1: Omi 免费吗？

Omi 的核心功能免费使用。云端服务有免费额度，超出后按量付费。本地部署后可完全自托管。

Q2: 隐私如何保护？

屏幕捕捉在本地处理（脱敏）后再传输
音频可选本地处理模式
支持自托管后端

Q3: 支持中文吗？

支持。Omi 对多语言（包括中文）均有优化。

Q4: 如何接入我的 LLM？

Omi 支持自定义 LLM 后端，可在配置中指定 OpenAI/Anthropic 等模型。

§9 相关资源

§10 自测题

问题 1：Omi 的核心价值是什么？

查看参考答案

Omi 的核心价值是作为"第二大脑"，实时捕捉用户的屏幕和对话内容，自动整理成可检索的知识图谱。关键价值包括：

被动记录：无需主动操作，自动记录
上下文完整：屏幕+语音+文字，多模态融合
语义检索：理解意图的搜索，而非简单关键词匹配
跨设备同步：桌面、手机、可穿戴设备无缝衔接

问题 2：Omi 的技术架构包含哪些核心组件？

查看参考答案

Omi 的技术架构包括：

前端：macOS App (Swift/SwiftUI/Rust)、Mobile App (Flutter)、Omi Wearable (C/nRF/Zephyr)
后端：Python + FastAPI，使用 Firebase Firestore、Redis、Deepgram STT、VAD、Diarizer
AI：集成 OpenAI/Anthropic 等 LLM，使用 RAG 管道进行向量检索和生成

问题 3：如何快速开始使用 Omi？

查看参考答案

快速开始方式：

macOS：运行 git clone https://github.com/BasedHardware/omi.git && cd omi/desktop && ./run.sh
iOS：cd app && bash setup.sh ios
Android：cd app && bash setup.sh android
可穿戴设备：参考 https://docs.omi.me/doc/get_started/Flash_device 刷固件

问题 4：Omi 如何保护用户隐私？

查看参考答案

Omi 的隐私保护措施：

屏幕捕捉在本地处理（脱敏）后再传输
音频可选本地处理模式
支持自托管后端，完全控制数据
开源代码，可审计

问题 5：如何基于 Omi 进行二次开发？

查看参考答案

二次开发方式：

使用 Python SDK、Swift SDK 或 React Native SDK
集成 MCP Server：npx -y @based/omi-mcp
调用 Web API 进行记忆搜索、对话历史查询等操作
参考官方文档：https://docs.omi.me/

§11 进阶路径

如果你想深入掌握 Omi 并构建基于它的应用，建议按以下路径学习：

理解核心概念：深入理解 RAG（检索增强生成）原理，了解向量检索和语义搜索的工作机制
本地部署后端：搭建本地开发环境，运行 Omi 后端，理解各组件的交互
开发插件或应用：使用 Omi SDK 开发自己的应用，如会议记录自动整理、知识库构建等
集成 LLM：尝试接入不同的 LLM 模型（OpenAI、Anthropic、本地模型），比较效果
贡献开源：参与 Omi 开源项目，提交 PR，改进文档或功能
探索硬件：如果你有硬件开发经验，可以尝试基于 Omi Wearable 或 Omi Glass 开发新的可穿戴设备应用

§12 资料口径说明

本文档基于以下来源编写，存在相应局限性：

信息来源：主要基于 Omi GitHub 仓库（https://github.com/BasedHardware/omi）和官方文档（https://docs.omi.me/）
版本时效性：Omi 是快速迭代的开源项目，本文档编写时的版本信息可能在阅读时已过时
功能完整性：Omi 的部分功能（如自研向量检索引擎）未完全开源，文档中无法提供完整实现细节
硬件可用性：Omi Glass Dev Kit 等硬件产品的购买和可用性可能因地区和时间而异
隐私声明：Omi 的隐私保护措施在文档中已说明，但实际使用中的隐私保护效果取决于用户的配置和使用方式
成本说明：Omi 的核心功能免费，但云端服务可能按量付费，具体资费请参考官方网站

🦞 撰写于 2026 年 4 月 18 日

更新于 2026-07-21

AI助手, 记忆系统, RAG, 可穿戴设备, 实时转录, Omi

返回 | 主页

下一步

如果这篇内容对你有帮助，继续往更完整的路径里走。

你可以从专题页继续系统阅读，也可以通过联系页反馈想跟进的主题、工具和合作方向。

AI Agent 专题 Coding Agent 专题开源 AI 工具联系

目录

Omi：你的第二大脑——9K Stars的全平台AI记忆助手，支持桌面/手机/可穿戴设备

Omi：你的第二大脑——9K Stars 的全平台 AI 记忆助手，支持桌面/手机/可穿戴设备

§1 学习目标

§2 背景与动机：为何需要"第二大脑"

2.1 人类记忆的局限性

2.2 现有方案的局限

2.3 Omi 的设计理念

§3 技术架构：全栈开源方案

3.1 整体架构

3.2 各组件详解

3.3 核心技术栈

§4 核心功能详解

4.1 屏幕捕捉与实时转录

4.2 多设备同步

4.3 AI 对话与记忆检索

4.4 应用开发平台

§5 快速开始：5 分钟上手

5.1 macOS 桌面应用

5.2 移动端（iOS/Android）

5.3 可穿戴设备

§6 开发扩展：基于 Omi 构建应用

6.1 MCP Server 集成

6.2 Python SDK 使用

6.3 移动端 SDK

6.4 应用开发示例

6.5 练习：构建你的第一个 Omi 应用

§7 硬件生态：开源可穿戴设备

7.1 Omi Wearable

7.2 Omi Glass Dev Kit

7.3 开发者资源

§8 FAQ

Q1: Omi 免费吗？

Q2: 隐私如何保护？

Q3: 支持中文吗？

Q4: 如何接入我的 LLM？

§9 相关资源

§10 自测题

问题 1：Omi 的核心价值是什么？

问题 2：Omi 的技术架构包含哪些核心组件？

问题 3：如何快速开始使用 Omi？

问题 4：Omi 如何保护用户隐私？

问题 5：如何基于 Omi 进行二次开发？

§11 进阶路径

§12 资料口径说明

如果这篇内容对你有帮助，继续往更完整的路径里走。

与这篇内容相关的文章

HKUDS/DeepTutor 拆解：一个 agent-native 的终身个性化辅导工作台是怎么搭起来的

Shubhamsaboo/awesome-llm-apps：可运行的 LLM 应用精选集

Graphify Labs Graphify：把 Claude Code 变成「知识图谱构建器」的本地 RAG 框架

HenryNdubuaku/maths-cs-ai-compendium 拆解：一份把 AI/ML 研究工程师之路切成 18 个可执行阶段的 textbook 仓库