Chi come me utilizza Agenti AI come Claude Code per il proprio lavoro, sicuramente saprà che ogni volta che si riprende una sessione, il più delle volte ci si ritrova a dedicare una parte del tempo, e dei token, per rispiegargli le scelte o gli errori riscontrati nella sessione precedente, a cui avevate già trovato una soluzione. Il problema è che una volta scaduta la sessione degli LLM, vi sembra di lavorare con un collaboratore affetto da deficit dell'attenzione, a cui ogni giorno dovete ripetere le stesse cose perchè dimentica. Se la soluzione per il vostro collaboratore è assumere un integratore di fosforo, per il vostro Agent AI la soluzione si chiama MemPalace.
Il repository GitHub mempalace creato dall'attrice Milla Jovovich, sì proprio lei, conosciuta per i suoi ruoli da protoganista in Resident Evil o il Quinto Elemento, e dallo sviluppatore Ben Sigman, lui magari lo conoscete meno ma nel mondo dei bitcoin è come Milla per il cinema, si sta facendo notare nella community degli sviluppatori. Si presenta come il sistema di memoria per AI con il punteggio più alto mai registrato nei benchmark, ma la vera notizia è un'altra: è completamente open source, gratuito e gira al 100% in locale sulla tua macchina.
In questo articolo esploreremo cos'è MemPalace, come funziona sotto il cofano, le controversie sui benchmark e come potete integrarlo oggi stesso nel vostro flusso di lavoro quotidiano.
Il Problema della "Memoria a Breve Termine" delle AI
Oggi, gran parte delle decisioni tecniche non avviene più nei documenti di design o su Jira, ma nelle conversazioni con assistenti basati su Intelligenza Artificiale. Il problema intrinseco di questi strumenti è la volatilità del contesto: una volta chiusa la finestra di chat, tutto il ragionamento, i compromessi discussi e i tentativi falliti svaniscono nel nulla [1].
Il dilemma dei sistemi tradizionali: Molti sistemi di memoria per AI (come Mem0 o Zep) cercano di risolvere questo problema lasciando che sia il modello linguistico (LLM) a decidere cosa vale la pena ricordare, estraendo sintesi molto stringate. Questo approccio, tuttavia, perde il contesto prezioso del perché una determinata scelta è stata presa [2].
L'Approccio "Palazzo della Memoria"
MemPalace prende ispirazione dalla tecnica mnemonica utilizzata dagli antichi oratori greci: il "Palazzo della Memoria" (o Tecnica dei Loci). Invece di riassumere, MemPalace salva tutto testualmente e struttura l'informazione per renderla facilmente recuperabile.
Le conversazioni e i file utilizzati nel progetto vengono organizzati in una struttura gerarchica:
- Ali (Wings): Rappresentano persone o progetti specifici.
- Sale (Rooms): Contengono idee o argomenti specifici.
- Armadi e Cassetti (Closets e Drawers): Dove risiede l'informazione effettiva, ovvero i file testuali originali.
Nessuna intelligenza artificiale decide cosa sia importante: MemPalace memorizza ogni singola parola e la struttura gerarchica fornisce una mappa navigabile, nettamente superiore a un semplice indice di ricerca piatto [1].
Le Caratteristiche Tecniche Principali
Sotto il cofano, MemPalace è sorretto da quattro pilastri:
- Archiviazione Verbatim: A differenza di altri sistemi, i dati vengono salvati in forma grezza utilizzando ChromaDB in locale. Il vantaggio è duplice: non viene sprecato alcun token LLM per riassumere i concetti in fase di salvataggio e non si perde nessuna sfumatura del contesto originale.
- AAAK (Sperimentale): Acronimo di un dialetto di abbreviazione lossy, è progettato per comprimere entità ripetute su larga scala. La genialità sta nel fatto che è leggibile nativamente da modelli come Claude, GPT, Llama e Mistral senza alcuna necessità di un decoder intermedio.
- Privacy Assoluta: L'intero stack funziona offline. Non ci sono chiamate ad API esterne e non è richiesto alcun abbonamento cloud. I tuoi dati sensibili e il tuo codice proprietario non lasciano mai il perimetro sicuro della tua macchina.
- Knowledge Graph: Il sistema integra un grafo temporale delle relazioni tra entità basato su SQLite. Questo permette all'intelligenza artificiale non solo di trovare informazioni, ma di tracciare l'evoluzione temporale delle decisioni e delle relazioni tra i vari componenti del progetto.
La Controversia sui Benchmark: È Davvero il 100%?
Al lancio, MemPalace ha dichiarato un punteggio perfetto del 100% nel benchmark LongMemEval [2]. Una simile affermazione ha subito sollevato dubbi nella community di HackerNews e su X (ex Twitter).
Analizzando i dati a mente fredda, emerge un quadro più sfumato ma ugualmente impressionante:
- Il 96.6% è reale e ineguagliato: Nella sua modalità "Raw" (senza l'uso di API esterne), il sistema raggiunge un 96.6% di Recall@5. Questo è il punteggio più alto mai pubblicato per un sistema che non richiede l'accesso a LLM cloud a pagamento [2].
- Il 100% richiede un approccio ibrido: Il punteggio perfetto è stato raggiunto utilizzando un reranking tramite LLM (Claude Haiku), che introduce un passaggio non puramente locale.
- La compressione ha un costo: Se si attiva la compressione AAAK sperimentale, l'accuratezza scende a circa l'84.2%.
In sintesi, la comunicazione dei risultati è stata avventata ma dal punto di vista tenico il risultato della modalità Raw lascia a bocca a aperta e batte alternative commerciali che costano centinaia di dollari al mese [2].
Esempi Pratici di Utilizzo
L'installazione è immediata tramite Python:
pip install mempalace
Una volta installato, il flusso di lavoro si divide in due fasi: l'inizializzazione del tuo "mondo" e l'utilizzo quotidiano.
1. Inizializzare e Minare i Dati
Il primo passo è dire a MemPalace quali sono i vostri progetti e le vostre conversazioni passate:
# Inizializza il tuo spazio di lavoro (crea la configurazione)
mempalace init ~/projects/mio-progetto-fantastico
# "Mina" (analizza e salva) il codice e la documentazione del progetto
mempalace mine ~/projects/mio-progetto-fantastico
# Importa le tue vecchie chat (es. esportazioni da Claude, ChatGPT o Slack)
mempalace mine ~/chats/ --mode convos
# Cerca istantaneamente in tutto lo storico
mempalace search "perché abbiamo scartato MongoDB per questo progetto?"
2. L'Integrazione con il vostro LLM
La vera magia avviene quando viene connesso MemPalace all'assistente AI.
Con Claude Code (Raccomandato)
Se utilizzate l'ambiente CLI di Claude, l'integrazione è nativa e richiede solo due comandi:
claude plugin marketplace add milla-jovovich/mempalace
claude plugin install --scope user mempalace
Da questo momento, Claude avrà accesso a 19 strumenti automatici (tramite protocollo MCP). Non dovrete più cercare manualmente: vi basterà chiedere a Claude "Quali erano i requisiti di sicurezza discussi il mese scorso?" e lui interrogherà autonomamente il database locale per fornire la risposta esatta [1].
Con Modelli Locali (Ollama, Llama, Mistral)
Se invece volete integrarlo in un sistemas self-hosting e usate modelli completamente offline, MemPalace offre un comando di "risveglio" per caricare il contesto essenziale:
# Genera un file di contesto super-concentrato
mempalace wake-up > context.txt
Potete semplicemente incollare il contenuto di context.txt nel prompt di sistema del modello locale. Questo fornirà all'LLM i fatti critici dell'ambiente di lavoro prima ancora che tu faccia la prima domanda.
Gli Agenti Specializzati
Una delle feature più affascinanti è la possibilità di creare "Agenti Specializzati". Invece di avere un'unica memoria caotica, definite agenti con focus specifici (es. un "Revisore di Codice", un "Architetto", un "Esperto Ops").
Ogni agente mantiene un proprio "diario" scritto nel formato compresso AAAK all'interno di un'ala dedicata del palazzo. L'agente revisore ricorderà tutti i pattern di bug che ha incontrato nei progetti, mentre l'architetto terrà traccia delle decisioni di design. È come avere un team di sviluppatori senior che non dimenticano mai nulla del vostro codice.
Approfondimenti
Se volete approfondire i concetti tecnici e filosofici alla base di MemPalace, ecco alcune risorse utili:
- La Tecnica dei Loci (Palazzo della Memoria) - Wikipedia (it): Scoprite come l'antica tecnica mnemonica utilizzata da Cicerone è stata trasposta in architettura software per l'AI.
- Sito ufficiale del progetto (en): L'hub informativo indipendente che analizza i benchmark, la storia della creazione e il confronto dettagliato con i competitor a pagamento come Mem0 e Zep.
- Repository GitHub Ufficiale (en): Il codice sorgente, la documentazione completa e le istruzioni dettagliate per contribuire al progetto.
Conclusioni
MemPalace rappresenta un cambio di paradigma significativo. Invece di delegare la memoria a servizi cloud costosi e opachi, riporta il controllo dei dati nelle mani dello sviluppatore, offrendo prestazioni superiori a costo zero.
Se lavorate quotidianamente con l'intelligenza artificiale per scrivere codice o progettare architetture (dai non prendiamoci in giro lo vedo che mentre leggete questo articolo state premendo "Allow command" in continuazione sul vostro agente), dedicate 10 minuti all'installazione di MemPalace potrebbe farvi risparmiare ancora più tempo (e meno click su "Allow command") e token..
Riferimenti
[1] Milla Jovovich e Ben Sigman. "MemPalace: The highest-scoring AI memory system ever benchmarked. And it's free." GitHub Repository. https://github.com/milla-jovovich/mempalace
[2] MemPalace.tech. "MemPalace — Milla Jovovich's AI Memory System". Independent Resource Site. https://www.mempalace.tech/

Potrebbe interessarti
Il tokenizzatore (Autopsia di un LLM - parte seconda)
Quando una API Key diventa la chiave di accesso diretta per tutti al vostro portafoglio: il caso Gemini
Enigma e il mito dell' indecifrabilità