Les grans recompenses acceleren l’aprenentatge: un estudi mostra que els ratolins poden dominar una tasca en un sol dia

#Neurociència #Dopamina #Aprenentatge

Un estudi publicat en Science pel Howard Hughes Medical Institute mostra que les recompenses grans prolonguen les senyals de dopamina i permeten aprendre tasques en molt menys temps.

Aprendre no era només repetir. O no només això. Un nou estudi del Howard Hughes Medical Institute (HHMI), publicat este dijous en la revista Science, apunta que la grandària de la recompensa pot canviar de dalt a baix la velocitat amb què el cervell incorpora una nova habilitat.

La idea clàssica era coneguda: constància, pràctica i assaig i error. La mateixa lògica que s’aplica a qui vol jugar millor al tenis, al pòquer o a qualsevol altra tasca que demane precisió. Segons eixe model, l’experiència acumulada marca el ritme de l’aprenentatge, amb independència de si al final hi ha una recompensa simbòlica o un premi enorme.

Però l’equip dirigit per Josh Dudman ha trobat una peça que no encaixava del tot. Quan els investigadors van canviar la mida de la recompensa en ratolins assedegats, el procés d’aprenentatge es va disparar.

L’experiment partia d’un esquema habitual en neurociència: entrenar animals amb centenars de xicotetes recompenses, com si a una persona se li donara una sola llepolia cada vegada. Sessions llargues, molts intents i avanços graduals. El grup del Laboratori Dudman va provar una altra via: menys premis, però més grans.

La resposta va ser clara. Els ratolins que van rebre uns pocs glops grans d’aigua van aprendre la tasca en una sola jornada, després de menys de deu recompenses importants. Els animals entrenats amb el mètode clàssic van necessitar milers de xicotets estímuls durant diversos dies per a arribar al mateix nivell.

«Tot el camp de les neurociències ha estat fent el mateix durant dècades i ho dic de manera literal: ningú s’havia molestat a verificar-ho»

Josh Dudman, director del grup de recerca i coautor del treball

La recompensa gran no només feia aprendre més ràpid. També igualava els resultats. En els entrenaments habituals, la diferència entre animals pot ser enorme: un ratolí domina una tasca en una setmana i un altre necessita un mes. Amb incentius més grans, eixa distància es reduïa de manera dràstica en qüestió de dies.

«Com a neurocientífics, estem resignats a assumir que haurem d’entrenar un animal durant setmanes fins que comence a entendre de què va la història. En lloc d’això, ara veig els ratolins dominar la tasca per complet en un sol dia»

Luke Coddington, científic sènior del Laboratori Dudman i líder de l’estudi

La pista biològica estava en la dopamina. Els investigadors van monitorar l’activitat química del cervell i van observar que les grans recompenses reforçaven tres elements alhora: la informació assimilada en cada repetició, la retenció de l’aprés d’un dia per a l’altre i l’atenció durant la sessió.

No es tractava només d’un augment puntual de dopamina. La diferència era la duració. Les recompenses grans generaven una senyal més sostinguda en el circuit de recompensa del cervell, connectat amb estructures com l’àrea tegmental ventral i el nucli accumbens.

Per a comprovar que eixa prolongació era determinant, els científics van modificar artificialment les senyals de dopamina vinculades a recompenses menudes. Quan van aconseguir allargar-les amb ferramentes biològiques, els ratolins també van aprendre molt més ràpidament.

«Creiem que, en amplificar i prolongar les respostes de dopamina en estos experiments, estem transformant tots els “xiquets” de la nostra “classe” en estudiants brillantment aplicats»

Luke Coddington, Laboratori Dudman

La conseqüència pot ser important per als laboratoris que estudien l’aprenentatge i el desenvolupament d’habilitats. Si els animals aprenen abans i amb menys diferències entre individus, els processos cognitius es poden observar amb més estabilitat i en menys temps.

El Laboratori Dudman ja ha modificat els seus protocols interns després dels resultats.

«Ha canviat la manera en què executem pràcticament tots els nostres projectes actuals»

Josh Dudman

El pròxim pas és explorar fins on pot arribar este canvi metodològic. Amb animals més implicats en la tasca i entrenaments més eficients, els investigadors esperen abordar preguntes més complexes sobre cognició animal. «Si aconseguim captar la seua atenció i implicar-los adequadament en la tasca, qui sap què seran capaços d’aprendre», conclou Coddington.

Redacció AGORA CT

Referència: Luke Coddington et al., «Reward magnitude determines reinforcement learning efficiency», Science, 2026.

Font: SINC.

* Ho pots llegis perqué som Creative Commons.

Josh Dudman y Luke Coddington, els dos investigadors