Engram: Bộ Não Số Cho Mọi AI — Sở Hữu Trí Nhớ Của Bạn, Không Trao Cho Bất Kỳ Ai

Bạn có mệt mỏi vì phải lặp lại chính mình trước mỗi AI? Mỗi lần mở Claude, ChatGPT, Cursor hay Gemini, bạn lại bắt đầu từ con số không. Sở thích, phong cách lập trình, bài học đau thương từ dự án cũ, tất cả tan biến khi bạn đóng tab. Ngành công nghiệp AI hứa hẹn những trợ lý thông minh, nhưng họ quên mất một thứ: trí nhớ.

Engram ra đời để thay đổi điều đó. Đây là một hệ điều hành bộ nhớ cá nhân cho AI — local-first, không phụ thuộc nhà cung cấp, và tự động phát triển từ chính hành vi của bạn. Hãy tưởng tượng mỗi AI bạn dùng đều “nhớ” bạn là ai, bạn thích kiến trúc FastAPI, bạn luôn chọn TypeScript cho dự án mới, và bạn ghét những câu trả lời dài dòng. Không cần thiết lập, không cần đồng bộ đám mây. Chỉ cần dữ liệu của bạn, trên máy bạn.

Vì sao các giải pháp hiện tại thất bại?

Các công cụ như ChatGPT Memory hay Mem0 hứa hẹn ghi nhớ, nhưng đều có điểm yếu chí mạng:

Phụ thuộc nhà cung cấp: Dữ liệu nằm trên máy chủ của OpenAI hoặc dịch vụ cloud. Ngày mai công ty đổi chính sách, bạn mất hết.
Không di động: Ký ức bị khóa chặt trong một nền tảng. Bạn không thể mang “bộ não” đó sang AI khác.
Không có khả năng tự tiến hóa ngầm: Bạn phải chủ động nhập thông tin, duy trì, cập nhật — một gánh nặng khiến hầu hết mọi người bỏ cuộc sau vài tuần.

Đó là lý do Engram được xây dựng dựa trên một triết lý hoàn toàn khác. Tên gọi “Engram” xuất phát từ khoa học thần kinh: engram là dấu vết vật lý mà một ký ức để lại trong não. Engram của bạn sẽ là dấu vết số, nằm trong những tệp tin đơn giản, tồn tại mãi mãi.

Triết lý cốt lõi: Ký ức không phải là một dịch vụ đám mây

Engram được thiết kế với 5 nguyên tắc sống còn:

Local-first: Mọi ký ức tồn tại dưới dạng file Markdown và JSON trên máy bạn. Có thể lưu trữ bằng Git, sao lưu bằng bất kỳ công cụ nào bạn đang dùng. Không phụ thuộc Internet, không vendor lock-in.
Không cần bảo trì (Zero-maintenance): Hệ thống tự động rút trích, củng cố và loại bỏ ký ức từ chính hành vi của bạn. Bạn không bao giờ phải mở “bảng điều khiển ký ức” để chỉnh sửa. Nó hoạt động như tiềm thức của bạn — lặng lẽ học hỏi.
Tiết lộ lũy tiến (Progressive Disclosure): Mỗi mẩu ký ức được lưu ở ba cấp độ chi tiết – tín hiệu (vài token), tóm tắt (vài chục token), và đầy đủ. AI sẽ nạp cấp độ phù hợp với ngân sách context window hiện có, tránh lãng phí token.
Tương thích mọi AI: Bộ nhớ xuất được dưới nhiều định dạng: BRAIN.md (dán thẳng vào system prompt), brain-export.json (dùng qua API), và adapters cho Claude MCP, OpenAI GPT Instructions, v.v. Bạn dùng bất kỳ AI nào cũng được.
Lưu trữ vĩnh viễn, không bao giờ xóa: Ký ức không bị hủy – chỉ được nén, lưu trữ, hoặc giảm hạng. Nhờ đó bạn luôn có thể truy vết nguồn gốc của mọi thông tin.

Kiến trúc: Ba tầng tách biệt, một giao diện duy nhất

Engram không phải là một cơ sở dữ liệu khổng lồ. Nó là một hệ thống gồm ba lớp rõ ràng:

┌──────────────────────────────────────────┐
│  GIAO DIỆN: CLI, MCP Server, REST API    │
├──────────────────────────────────────────┤
│  ĐỘNG CƠ: Trình quản lý bộ nhớ,         │
│  Động cơ tiến hóa, Trình dựng ngữ cảnh   │
├──────────────────────────────────────────┤
│  LƯU TRỮ: Markdown/JSON (nguồn gốc),    │
│  SQLite FTS5 (tìm kiếm), Vector DB (tùy) │
└──────────────────────────────────────────┘

Tầng giao diện: Bạn có thể tương tác bằng dòng lệnh, qua MCP (dành cho Claude Desktop), Telegram, hoặc web UI sau này.
Tầng động cơ: Bao gồm Memory Manager (đọc/ghi, giải quyết xung đột, phiên bản hóa) và Evolution Engine (tự động rút trích, củng cố, phân cụm bản năng, làm sạch định kỳ).
Tầng lưu trữ: Sự thật nguồn là các tệp Markdown/JSON nằm trong thư mục .engram. SQLite chỉ là chỉ mục phụ cho tìm kiếm toàn văn, có thể xóa và xây lại bất kỳ lúc nào. Vector DB (LanceDB/ChromaDB) chỉ được kích hoạt khi cần tìm kiếm ngữ nghĩa nâng cao.

Tech stack: Python 3.12+, Typer (CLI), FastMCP, Pydantic, SQLite FTS5, sentence-transformers, APScheduler, scikit-learn.

Bốn lớp ký ức — Không chỉ là những mẩu ghi chú

Engram tổ chức ký ức thành bốn lớp với đặc tính riêng biệt, giải quyết những gì các đối thủ chưa làm được:

Lớp	Mô tả	Mẫu truy cập
1. Danh tính (Identity Core)	Tên, vai trò, múi giờ, phong cách giao tiếp, giá trị. Ít thay đổi, luôn được nạp.	Đọc mọi ngữ cảnh, ghi cực hiếm
2. Kiến thức (Knowledge Base)	Kỹ năng, lĩnh vực chuyên môn, bản năng (instincts) kết tinh từ hành vi.	Đọc theo tác vụ, ghi chậm theo tuần
3. Ký ức tình tiết (Episodic)	Nhật ký các tương tác, quyết định, bài học đã rút ra.	Ghi liên tục (append-only), đọc theo từ khóa/thời gian
4. Ngữ cảnh hoạt động (Active Context)	Những gì đang diễn ra ngay lúc này, dự án đang làm, tóm tắt hội thoại gần đây.	Tạm thời, trượt cửa sổ, không lưu dài hạn

Điểm đặc biệt nằm ở Knowledge Base: nó không chỉ chứa kiến thức tĩnh mà còn bao gồm các Instincts – những mẫu hành vi kết tinh từ chính các quyết định của bạn, được phát hiện tự động qua phân cụm ML.

Năm tính năng đột phá định nghĩa lại bộ nhớ AI

Hãy đi sâu vào những tính năng làm Engram khác biệt hoàn toàn so với tất cả những gì đang có trên thị trường.

1. Kết tinh bản năng (Instinct Crystallization)

Đây là viên ngọc quý của hệ thống. Khi bạn cùng một loại quyết định từ 5–7 lần trở lên (ví dụ: luôn chọn TypeScript thay vì JavaScript), hệ thống sẽ phát hiện qua thuật toán phân cụm DBSCAN trên không gian vector hành vi và đề xuất biến nó thành một Instinct. Sau khi bạn xác nhận, nó trở thành một phần trong “bản năng” số của bạn, được ưu tiên nạp vào mọi tác vụ liên quan. Không ai khác làm điều này — Mem0 trích xuất sự kiện từ lời nói, còn Engram học từ việc bạn làm.

2. Vòng lặp học kín và nhắc nhở định kỳ (Closed Learning Loop & Periodic Nudges)

Một tiến trình nền (APScheduler) chạy sau mỗi phiên, mỗi ngày, mỗi tuần:

Sau phiên: rút trích vài sự kiện quan trọng.
Hằng ngày: phát hiện xung đột, cập nhật độ tin cậy.
Hằng tuần: củng cố, phân cụm bản năng.
Hằng tháng: dọn dẹp ký ức ít dùng. Hệ thống chủ động hỏi bạn (qua Telegram hoặc CLI) để xác nhận những gì nó học được, thay vì động chạm vào dữ liệu của bạn một cách mù quáng.

3. Ba cấp độ phân giải (Signal/Summary/Full)

Mỗi mẩu ký ức đều tồn tại ở ba dạng, được động cơ tự động tạo và duy trì:

Tín hiệu (~10 token): dùng khi ngân sách eo hẹp.
Tóm tắt (~50 token): dùng trong hội thoại thông thường.
Đầy đủ: chỉ nạp khi cần truy xuất sâu.

Nhờ đó, Engram luôn tôn trọng context window của bạn, không bao giờ nhồi nhét quá mức.

4. Chuỗi nguồn gốc (Provenance Chain)

Mọi mẩu ký ức đều mang theo lịch sử đầy đủ: nó đến từ đâu, được củng cố lúc nào, ai/chương trình nào đã thay đổi nó. Bạn có thể dùng lệnh engram trace <memory-id> để xem toàn bộ dòng thời gian. Khi AI hành xử kỳ lạ, bạn biết chính xác ký ức nào đã dẫn đến điều đó — và sửa tận gốc.

5. Chia sẻ qua “Brainshard” (tương thích agentskills.io)

Engram sử dụng định dạng agentskills.io cho các kỹ năng. Đây là một tiêu chuẩn mở đang được hơn 30 công cụ AI hỗ trợ. Mỗi kỹ năng của bạn là một gói có thể xuất ra, chia sẻ cho đồng nghiệp, hoặc import từ cộng đồng (hiện có >200 kỹ năng có sẵn). Bạn thậm chí có thể đóng gói “bản năng API design” của mình thành một file và gửi cho cả nhóm.

Engram so với thế giới: Tại sao không có đối thủ thực sự?

Bảng dưới đây nói lên tất cả:

Tính năng	Mem0	Letta/MemGPT	Hermes Agent	ChatGPT Memory	Engram
Không phụ thuộc nhà cung cấp	✅	⚠️ một phần	❌ gắn với agent	❌ chỉ OpenAI	✅
Local-first	❌	✅	✅	❌	✅
Kết tinh bản năng	❌	❌	❌	❌	✅
Tương thích agentskills.io	❌	✅	✅	❌	✅
Phân rã độ tin cậy	❌	❌	❌	❌	✅
Chuỗi nguồn gốc	❌	❌	❌	❌	✅
Chia sẻ gói (Brainshard)	❌	❌	❌	❌	✅
Tệp con người đọc được	❌	❌	❌	❌	✅
Vòng lặp học kín	❌	⚠️	✅	❌	✅

Rõ ràng, Engram không chỉ là sự kết hợp các ý tưởng cũ; nó lấp đầy khoảng trống mà không ai giải quyết: một hệ thống bộ nhớ cá nhân thực sự mang tính cá nhân, di động và tự tiến hóa.

Lộ trình xây dựng: Từ CLI đến “bộ não số”

Hướng dẫn xây dựng (được thiết kế cho một lập trình viên Python làm buổi tối) chia thành 12 cột mốc rõ ràng, đi từ đơn giản đến phức tạp. Dưới đây là những bước chính:

E1 – Identity Core + CLI: Tệp CORE.md đầu tiên và dòng lệnh engram identity show.
E2 – Nhật ký tình tiết: Ghi các sự kiện dạng JSONL, append-only.
E3 – Tìm kiếm toàn văn với SQLite FTS5: Index và truy vấn nhanh các tập nhật ký.
E4 – Knowledge Base: Tải và quản lý kỹ năng theo chuẩn SKILL.md.
E5 – SDK Python: Gói gọn mọi thứ sau facade Engram để các agent khác gọi.
E6 – Active Context & Context Builder: Tự động đóng gói ngữ cảnh phù hợp cho AI.
E7 – Embeddings & Hybrid Retrieval: Kết hợp tìm kiếm từ khóa và ngữ nghĩa.
E8 – Độ tin cậy & phân rã: Gán điểm confidence, tự giảm với ký ức cũ.
E9 – Chuỗi nguồn gốc: Theo dõi lịch sử từng mẩu ký ức.
E10 – Ba cấp độ phân giải: Tóm tắt tự động cho từng mức.
E11 – Kết tinh bản năng: DBSCAN phát hiện mẫu, Telegram xác nhận.
E12 – Quan sát & Dashboard: Theo dõi sức khỏe bộ não số.

Việc xây dựng được thiết kế để song hành với dự án Synapse (agent AI cá nhân). Ban đầu Synapse dùng một stub tạm, sau đó tích hợp Engram thật khi đã sẵn sàng, đảm bảo bạn không rơi vào bẫy over-engineering.

Rủi ro lớn nhất — và tại sao Engram sẽ vượt qua

Không có hệ thống nào hoàn hảo. Những nguy cơ chính của Engram đã được nhận diện ngay từ thiết kế:

Nghịch lý bảo trì: “Zero-maintenance” sẽ thành thảm họa nếu AI trích xuất sai trên 20%. Giải pháp: mọi trích xuất đều có độ tin cậy khởi điểm thấp (0.6), chỉ tăng khi được xác nhận lại hoặc phê duyệt qua dialective. Không có thay đổi tự động nào được phép lên mức cao nếu không có sự đồng ý của bạn.
Chi phí token: Nạp thêm ký ức tiêu tốn token, tăng chi phí API. Nhưng với cơ chế phân giải lũy tiến, Engram chỉ dùng vài chục token cho hầu hết ngữ cảnh, và có thể nén tối đa khi cần. Đổi lại, bạn tiết kiệm được rất nhiều token nhờ không phải giải thích lại từ đầu.
Ký ức lỗi thời: Cơ chế phân rã temporal decay được thiết kế để những gì không còn được nhắc đến sẽ tự động giảm trọng số, nhưng Identity Core và Instincts đã xác nhận thì miễn nhiễm.
Bản năng sai: DBSCAN có thể nhầm một sự trùng hợp thành khuôn mẫu. Tuy nhiên, mọi đề xuất Instinct đều cần người dùng phê duyệt, và hệ thống tự động kiểm tra các bằng chứng mâu thuẫn trước khi đề xuất.
Định dạng agentskills.io không phải cho dữ liệu cá nhân: Engram giải quyết bằng cách mở rộng định dạng với metadata riêng (provenance, confidence) nhưng vẫn giữ cấu trúc lõi tương thích. Xuất khẩu sạch sang chuẩn agentskills.io luôn khả dụng.

Kết luận: Engram có thực sự mới?

Nếu nhìn bề mặt, bạn có thể nghĩ Engram là sự pha trộn của Mem0, Letta và Hermes Agent. Nhưng đó chỉ là lớp vỏ. Điểm mới cốt lõi nằm ở triết lý và ba trụ cột không thể sao chép:

Ký ức di động, thuộc về bạn: Không ai khác có thể tự nhận mình là “local-first, provider-agnostic” hoàn toàn như Engram.
Học từ hành vi, không chỉ lời nói: Khả năng kết tinh bản năng tự động là bước nhảy vọt từ “trợ lý ghi chép” sang “tiềm thức số”.
Không cần bảo trì, tin cậy minh bạch: Chuỗi nguồn gốc và phân rã độ tin cậy làm cho hệ thống trở nên đáng tin cậy trong dài hạn, không chỉ là một món đồ chơi công nghệ.

Engram không phải là một agent. Nó là lớp nền cho mọi agent — thứ mà các mô hình ngôn ngữ lớn lẽ ra phải có ngay từ đầu. Dự án hiện đang ở giai đoạn thiết kế tiền MVP, nhưng với lộ trình rõ ràng và hiểu biết sâu sắc về những cạm bẫy, nó có tiềm năng trở thành tiêu chuẩn cho bộ nhớ AI cá nhân.

Engram: Bộ Não Số Cho Mọi AI — Sở Hữu Trí Nhớ Của Bạn, Không Trao Cho Bất Kỳ Ai