Evals: the foundation of reliable AI products

Description

Lors du développement de fonctionnalités d'IA, il est impossible de tout prévoir. Les interactions réelles des utilisateurs révèlent des entrées inattendues et des défaillances qui n'apparaissent qu'en production, obligeant les équipes à tâtonner pour identifier les corrections à apporter et à évaluer l'impact réel de leurs modifications sur le produit.

Dans cette présentation, nous verrons pourquoi les jeux de données et les évaluations sont devenus le socle du développement de produits d'IA. Vous découvrirez comment les équipes les plus performantes utilisent les évaluations pour identifier les défaillances, orienter leur feuille de route, prévenir les régressions et mettre en place des boucles de rétroaction rapides.

Cette évolution transforme la conception des produits, passant de spécifications statiques à une amélioration continue. Car à l'ère de l'IA, les équipes qui réussissent sont celles qui possèdent les boucles d'apprentissage les plus rapides.

‍

Speaker(s)

Calliste Duru

Founding Product @Basalt

télécharger