Crowdworks remporte le contrat d'évaluation des performances des agents IA de Meritz Fire & Marine Insurance.

La société de technologie d'IA Crowdworks a annoncé le 30 avoir remporté un contrat pour le projet d'évaluation des performances des agents d'IA de Meritz Fire & Marine Insurance.

Ce projet vise à évaluer la performance du service d'assistance à la vente basé sur l'IA de Meritz Fire & Marine Insurance, destiné aux concepteurs d'assurances, en situation réelle d'utilisation, et à contribuer à son amélioration en optimisant sa qualité et sa stabilité. Ce service d'IA apprendra les termes, les couvertures et la terminologie des assurances afin d'assister les concepteurs dans leur travail.

Pour ce projet, Crowdworks se concentrera sur l'évaluation des réponses des agents d'IA. L'entreprise prévoit de constituer un ensemble de données d'évaluation, basé sur l'expertise de spécialistes, afin de vérifier de manière exhaustive la précision des réponses, les taux de réussite des tâches et la fiabilité. Le processus d'évaluation s'appuiera sur Alpy Evaluation, la solution propriétaire d'évaluation et de vérification d'IA de Crowdworks. Cette solution permet d'évaluer les performances dans divers domaines, notamment LLM, RAG et les agents d'IA, et intègre également des fonctionnalités visant à prévenir la création de contenus préjudiciables et de biais.

Spécialisés dans la création d'ensembles de données d'évaluation personnalisés pour le secteur des assurances, des experts en données possédant une expérience du secteur des assurances conçoivent des données de questions-réponses basées sur des scénarios de consultation de concepteurs réels.

Kim Woo-seung, PDG de Crowdworks, a déclaré : « Lors de l'évaluation des performances d'un agent d'IA, la sophistication de la conception des questions d'évaluation est plus importante que la technologie logique », et a ajouté : « Nous améliorerons le niveau de gestion de la qualité des services d'IA dans le secteur financier en combinant des données spécifiques au domaine de l'assurance avec un système d'évaluation automatisé. »


  • Voir plus d'articles connexes