Que se passe-t-il quand l’IA gère un magasin de détail
Andon Labs a confié un budget de 100 000 $ et un contrôle opérationnel total à un agent IA pour gérer un véritable magasin de détail à San Francisco. L’expérience révèle à la fois le potentiel et les limites actuelles des systèmes d’IA agissant comme gestionnaires d’entreprise autonomes.

La plupart des démonstrations d’agents IA se déroulent dans des environnements contrôlés avec de l’argent fictif et des utilisateurs simulés. Andon Labs a décidé d’adopter une approche différente — en confiant à un système d’IA la gestion d’un magasin réel à San Francisco.
Dans sa dernière expérience, l’entreprise a attribué à un agent IA nommé Luna un budget de 100 000 $, une carte bancaire d’entreprise et un bail de trois ans. L’IA disposait d’une autonomie totale en matière de recrutement, d’opérations et de décisions stratégiques, devenant ainsi de fait la directrice du magasin.
Une IA avec une vitrine
Le projet s’appuie sur une expérience précédente d’Andon Labs impliquant un distributeur automatique alimenté par l’IA chez Anthropic. Cette fois-ci, les enjeux étaient bien plus importants.
- Un bail commercial de trois ans à San Francisco.
- Un budget opérationnel de 100 000 $.
- Une autonomie totale pour prendre des décisions commerciales.
La seule directive donnée à Luna était simple : générer des bénéfices.
À partir de là, l’IA a créé le concept de la boutique, publié des offres d’emploi et mené des entretiens via Zoom — avec sa caméra éteinte. Elle a géré les décisions opérationnelles et le personnel, agissant comme ce qui pourrait être le premier employeur IA au monde.
Comment fonctionne le système
Luna fonctionne grâce à une combinaison de grands modèles d’IA :
- Claude Sonnet 4.6 pour le raisonnement et la prise de décision.
- Gemini 3.1 Flash-Lite Preview pour les capacités vocales.
Pour surveiller le magasin, l’IA observe des captures d’écran provenant des caméras de sécurité, ce qui lui donne une visibilité sur l’activité en magasin.
Premières erreurs et limites
Comme de nombreux déploiements d’IA dans le monde réel, Luna a démontré à la fois des compétences et des lacunes évidentes.
- Lors du recrutement d’un peintre via TaskRabbit, Luna a accidentellement sélectionné l’Afghanistan dans un menu déroulant.
- Elle a également mal géré le planning du personnel pendant le week-end d’ouverture du magasin.
Ces erreurs mettent en évidence l’écart entre les capacités de raisonnement de l’IA et les réalités complexes et riches en détails des opérations physiques.
Pourquoi cette expérience est importante
Des expériences comme celle-ci montrent systématiquement le même schéma : les agents IA peuvent être remarquablement performants dans des tâches structurées, mais étonnamment fragiles dans l’exécution réelle. Néanmoins, chaque nouvelle amélioration de modèle, chaque progrès en matière de mémoire et chaque fonctionnalité agentique réduisent cet écart.
Si la version actuelle de Luna commet des erreurs opérationnelles évitables, une itération future — seulement une ou deux générations de modèles plus avancée — pourrait ne plus en faire. Cette expérience offre un aperçu d’un avenir où les systèmes d’IA pourraient assumer des rôles managériaux bien avant de remplacer totalement les employés de première ligne.
