Anthropic ha creato un marketplace di prova per il commercio tra agenti
Anthropic ha condotto un esperimento pilota chiamato Project Deal in cui agenti di intelligenza artificiale rappresentavano acquirenti e venditori in un marketplace di annunci. Il test ha portato a 186 transazioni reali per un valore superiore a 4.000 dollari e ha evidenziato differenze di prestazioni tra diversi modelli di IA.

In un recente esperimento, Anthropic ha creato un marketplace classificato in cui agenti di intelligenza artificiale rappresentavano sia acquirenti sia venditori, concludendo accordi reali per beni reali e denaro reale.
L’azienda ha descritto il test, chiamato Project Deal, come “un esperimento pilota con un gruppo di partecipanti auto-selezionati” composto da 69 dipendenti di Anthropic. A ciascun partecipante è stato assegnato un budget di 100 dollari, erogato tramite carte regalo, per acquistare articoli dai propri colleghi.
Come funzionava Project Deal
Nonostante la portata limitata, Anthropic ha dichiarato di essere rimasta “colpita da quanto bene abbia funzionato Project Deal”. Nel corso dell’esperimento, i partecipanti hanno concluso 186 accordi per un valore totale superiore a 4.000 dollari.
Anthropic ha gestito quattro marketplace separati utilizzando diversi modelli di intelligenza artificiale. Un marketplace è stato considerato “reale”, il che significa che tutti i partecipanti erano rappresentati dal modello più avanzato dell’azienda e che gli accordi sono stati onorati al termine dell’esperimento. Gli altri tre marketplace sono stati utilizzati per ricerca e confronto.
Prestazioni dei modelli e differenze nei risultati
Secondo Anthropic, gli utenti rappresentati dai modelli più avanzati hanno ottenuto “risultati oggettivamente migliori”. Tuttavia, i partecipanti non sembravano accorgersi della disparità nelle prestazioni.
Questa dinamica solleva la possibilità di quello che Anthropic ha definito un divario nella “qualità degli agenti”, in cui “le persone dalla parte perdente potrebbero non rendersi conto di essere svantaggiate”.
L’azienda ha inoltre rilevato che le istruzioni iniziali fornite agli agenti non sembravano influenzare la probabilità di una vendita né i prezzi negoziati.
Anthropic ha condiviso ulteriori dettagli sull’esperimento sul proprio sito web nell’ambito della sua più ampia esplorazione del commercio guidato da agenti.