Si alguna vegada us heu preguntat per què executar un node de Bitcoin requereix maquinari robust, no esteu sols. El repte es redueix a una cosa anomenada conjunt UTXO, essencialment la llibreta d’adreces de Bitcoin de qui pot gastar què. A principis del 2025, aquest conjunt s’ha disparat fins a més d’11 GB que conté 179 milions de sortides. Gestionar-lo de manera eficient és crucial per mantenir la xarxa Bitcoin descentralitzada i accessible.
He estat treballant en una solució d’aprenentatge automàtic que redueix els accessos al disc en gairebé un 19% durant la validació de blocs, cosa que podria reduir els requisits de maquinari per executar un node Bitcoin.
El problema: una base de dades creixent
Penseu en les transaccions de Bitcoin com una cadena de xecs. Cada transacció gasta els resultats de transaccions anteriors i en crea de noves. El conjunt UTXO (Unspent Transaction Output – Sortida de Transacció No Gastada) fa un seguiment de tots aquests resultats no gastats. És l’única font de veritat que Bitcoin Core necessita per validar les noves transaccions.

El repte? La majoria de nodes de Bitcoin emmagatzemen aquest conjunt massiu en disc, utilitzant només una petita memòria cau en memòria (450 MB per defecte) per accelerar les coses. Actualment, aquesta memòria cau només ofereix una millora del 10% en el temps de validació, ja que funciona principalment com a memòria intermèdia d’escriptura per a noves transaccions, no com a predictor intel·ligent del que necessitareu a continuació.

La solució: predir el futur
Ens vam fer una pregunta: què passaria si poguéssim predir quins UTXOs estan a punt de gastar-se i, en canvi, els guardéssim a la memòria?
Hem construït un model d’aprenentatge automàtic utilitzant un regressor d’arbre de decisions que analitza vuit característiques clau de cada UTXO:
- Quant de temps fa que es va crear
- La seva posició en la transacció
- La quantitat emmagatzemada
- El tipus de guió
- Tant si provenia de recompenses mineres
El factor més influent va resultar ser quant de temps ha existit l’UTXO, seguit de la seva posició a l’índex i el seu valor. Això té sentit intuïtiu. Els UTXO més antics que estan inactius tenen menys probabilitats de gastar-se aviat que els creats recentment.
Rendiment de la simulació
El nostre model aconsegueix una precisió impressionant, amb un error absolut mitjà de només 999 blocs (aproximadament 7 dies). Tot i que això pot semblar imprecís, cal recordar que Bitcoin fa més de 15 anys que funciona i ha processat centenars de milers de blocs.
Per provar el nostre plantejament, vam crear un sistema de doble memòria cau:
- Memòria cau de predicció (200 MB) : Conté els UTXO que el model prediu que es gastaran aviat.
- Memòria cau d’escriptura (250 MB) : conserva la funcionalitat tradicional de memòria cau d’escriptura
Vam dividir l’assignació predeterminada de 450 MB entre aquestes dues memòries cau i vam executar simulacions a través de 600.000 blocs d’historial real de Bitcoin.
Escenari per defecte:

Escenari de memòria cau dual:

Els resultats parlen per si sols
El nostre enfocament de doble memòria cau va reduir els accessos al disc en una mitjana del 18,62% en comparació amb la configuració predeterminada. Tot i que el gràfic pot semblar modest, estem parlant de milions d’operacions de disc, cadascuna de les quals afegeix preciosos mil·lisegons al temps de validació.

La bellesa d’aquest enfocament és que s’adapta amb el temps. Cada 10.000 blocs (aproximadament 70 dies), el sistema reentrena el model en funció dels patrons de transaccions recents, garantint que es mantingui actualitzat amb l’ús en evolució de Bitcoin.
Per què això importa
Reduir el temps de validació i els requisits de maquinari no és només una qüestió de comoditat. Es tracta de descentralització. Com més fàcil i barat sigui executar un node Bitcoin complet, més gent podrà participar en la validació de la xarxa. Més nodes significa:
- Major resiliència de la xarxa
- Velocitat de verificació de transaccions millorada
- Barreres d’entrada més baixes per a nous participants
Mirant cap endavant
Reconeixo que això només és el principi. El treball futur inclou la implementació del sistema en implementacions reals de Bitcoin Core i el refinament del model. També hem d’equilibrar la complexitat afegida de la integració de l’aprenentatge automàtic amb els requisits de manteniment de Bitcoin Core.
El que és particularment emocionant és com aquest enfocament podria estendre’s més enllà de Bitcoin. Qualsevol blockchain basada en UTXO podria beneficiar-se de l’emmagatzematge en memòria cau predictiva, millorant potencialment el rendiment en nombroses xarxes de criptomonedes.
La conclusió
Aplicant l’aprenentatge automàtic a un repte fonamental de la cadena de blocs, he demostrat que fins i tot sistemes madurs com Bitcoin encara tenen marge d’optimització. La reducció del 18,62% en els accessos a disc potser no sembla revolucionària, però en una xarxa que processa milers de milions de dòlars en transaccions diàries, cada punt percentual importa.
A mesura que Bitcoin continua creixent i evolucionant, innovacions com la memòria cau predictiva podrien ser clau per mantenir la xarxa accessible, eficient i veritablement descentralitzada durant els propers anys.
Aquesta investigació es va presentar a la Conferència Internacional sobre Informàtica i Aplicacions Blockchain de 2025 i va ser parcialment finançada per subvencions del govern espanyol per a la seguretat de xarxes cibernètiques.