CONGRESSO NAZIONALE DELLA SEZIONE DI

PSICOLOGIA SPERIMENTALE

·Alghero 2001·

 

 

ACQUISIZIONE DI NUOVE CATEGORIE IN RETI NEURALI

ATTRAVERSO SIMBOLI "FONDATI"

 

A. Greco (1), T. Riga (1), A. Cangelosi (2)

(1) DISA, Università di Genova; (2) University of Plymouth, UK

 

 

Introduzione

 

  Uno dei maggiori problemi incontrati dalla metodologia simulativa in psicologia è quello del symbol grounding, cioè di rendere il significato dei simboli effettivamente intrinseco al sistema e non dipendente da una interpretazione esterna ad esso. Questo problema può essere risolto usando la metodologia connessionista. Esistono diversi modelli che sono in grado di estrarre le caratteristiche invarianti degli stimoli presentati e ad associarvi etichette "linguistiche" (Plunkett, Sinha, Moller & Strandsby, 1992; Cangelosi, Greco & Harnad, 2000). Tuttavia, avere una collezione di nomi associati a certe categorie concettuali non è condizione sufficiente per poter sviluppare un linguaggio ed esprimere significati più complessi attraverso la combinazione di simboli in proposizioni. I simboli che non fossero fondati su precedenti rappresentazioni di origine sensomotoria sarebbero vuoti, come avverrebbe nel caso in cui si volesse comprendere il significato di un termine di una lingua sconosciuta consultando un dizionario scritto solo in quella lingua: la definizione conterrebbe altri simboli bisognosi di definizione e così via in un circolo vizioso all'infinito (Harnad, 1990).

Lo scopo del modello qui presentato è di studiare attraverso reti neurali in che modo sia possibile conferire un fondamento alle descrizioni simboliche di stimoli mai incontrati da un sistema, attraverso l'uso di simboli già fondati in precedenza. In sostanza viene studiata la possibilità di trasferire il fondamento (grounding transfer) da un simbolo all'altro. Le simulazioni proposte sono un'estensione di un precedente modello (Cangelosi, Greco & Harnad, 2000).

 

Metodo

 

Stimoli e procedura. Dieci reti neurali sono state addestrate a categorizzare e denominare forme animali (es. cavallo, tartaruga) e loro caratteristiche (es. strisce, puntini), costituite da immagini di 50 X 50 pixel proiettate sui campi recettivi di una retina costituita da 7 X 7 unità. L'addestramento è stato svolto in tre fasi. Nella prima fase (categorizzazione), le reti hanno appreso a classificare 216 stimoli visivi (4 forme animali e 4 caratteristiche di texture, ciascuna in 27 varianti) nelle 8 categorie corrispondenti. Nella seconda fase (denominazione delle categorie di base), le reti sono state addestrate ad associare gli stessi stimoli retinici con i nomi delle loro categorie. In queste prime due fasi le reti hanno appreso sulla base dell'esperienza diretta per tentativi ed errori, supervisionata attraverso un feedback correttivo (algoritmo di backpropagation). Nella terza fase (apprendimento di alto livello), sono state presentate alle reti soltanto stringhe di simboli, costituite dalla combinazione di nomi di forme animali e di loro caratteristiche (ad es. cavallo, strisce; zebra), che definivano 4 categorie di alto livello.

  Le reti sono state infine testate presentando altri 180 stimoli retinici contenenti effettivamente le combinazioni di forme e caratteristiche definite nella terza fase. Il risultato atteso era che, anche se si trattava di stimoli nuovi per le reti, se il grounding transfer si fosse realizzato, le reti sarebbero state in grado di categorizzarli correttamente.

 

Architettura delle reti.Sono state usate dieci reti feed-forward costituite da tre strati (input, output e intermedio), i cui pesi iniziali erano casuali. Lo strato di input era suddiviso in due gruppi di unità: la retina di 7 X 7 campi recettivi, dunque costituita di 49 unità; 12 unità linguistiche corrispondenti  alle 8 categorie di base (4 forme animali e 4 caratteristiche di texture) e alle 4 categorie di alto livello. Lo strato nascosto, costituito da 6 unità, era connesso a quello di input in modo che le prime tre unità nascoste ricevessero input dalla periferia della retina e le altre tre unità dalla parte centrale della retina stessa. Lo strato di output, come quello di input, era suddiviso in due gruppi di unità: il primo conteneva le 8 unità che rappresentavano l'output sensomotorio e il secondo conteneva 12 unità linguistiche strutturate in maniera simile a quelle di input. Lo strato di output era connesso con quello nascosto in modo da ottenere, grazie alla particolare connettività della retina, una struttura modulare, in cui tre unità si specializzano nel rappresentare forme animali e le altre tre nel rappresentare loro caratteristiche.

 

Risultati

 

  Tutte e dieci le reti hanno appreso i tre compiti con successo. L'errore medio per la fase di categorizzazione è stato 0.07, per la denominazione di base 0.15 e per l'apprendimento di alto livello 0.04. Per quanto riguarda la fase di test, è stata calcolata la frequenza di risposte corrette alle immagini corrispondenti agli stimoli di alto livello sia per l'output sensomotorio che linguistico. Tutte e dieci le reti hanno categorizzato e denominato correttamente gli stimoli del test, dimostrando che il fondamento realizzato per i simboli al livello di base si era trasferito con successo alla categorie di alto livello.

  Allo scopo di controllare se questo risultato potesse dipendere da qualche altra variabile non controllata piuttosto che dal grounding transfer, abbiamo ripetuto le fasi di training delle reti escludendo la fase di denominazione di base, facendo seguire l'apprendimento di alto livello subito dopo la prima categorizzazione. In questa simulazione di controllo nessuna delle 10 reti ha fornito risultati corretti.

 

Conclusioni

 

  Questi risultati sostengono l'approccio al problema del symbol grounding basato su modelli interamente connessionisti. Nel nostro modello la stessa rete elabora sia il fondamento sensomotorio dei simboli, sia la generazione di nuove categorie attraverso la combinazione di simboli. L'organizzazione modulare delle unità nascoste suggerisce che è importante che il fondamento sensomotorio sia separato per le diverse caratteristiche alla base della classificazione. Stiamo lavorando allo sviluppo del modello in varie direzioni, esplorando l'uso di stimoli e caratteristiche diversi, di gerarchie di categorie più complesse e di nuove architetture.

 

Riferimenti bibliografici

 

  Cangelosi A., Greco A., & Harnad S. (2000). From robotic toil to symbolic theft: Grounding transfer from entry-level to higher-level categories. Connection Science, 12(2), 143-162.

  Cangelosi A. & Harnad S. (in press). The adaptive advantage of symbolic theft over sensorimotor toil: Grounding language in perceptual categories. Evolution of Communication

  Harnad S. (1990). The Symbol Grounding Problem. Physica D, 42, 335-346

  Plunkett K., Sinha C., Møller M.F., & Strandsby O. (1992). Symbol grounding or the emergence of symbols? Vocabulary growth in children and a connectionist net. Connection Science, 4, 293-312.