
Cubic, une société d'infrastructure d'utilisation des données, a annoncé que son programme de vérification de la qualité et de la sécurité des données synthétiques « SynData v1.0 » a reçu la certification GS Grade 1.
Face à l'explosion récente des données sensibles dans des domaines tels que l'information publique, financière et médicale, le recours aux données synthétiques se développe comme alternative à la protection des données personnelles. Cependant, faute de vérification objective de leur utilisabilité et du risque de réidentification associé, leur utilisation reste limitée lors de la divulgation de données et de l'entraînement des IA. SynData est une solution conçue pour combler cette lacune en matière de vérification.
SynData analyse automatiquement les données synthétiques générées par l'utilisateur et évalue leur qualité et leur sécurité à partir d'indicateurs clés tels que la similarité de distribution avec les données originales, la cohérence statistique et le niveau de protection de la vie privée. Au-delà de l'attribution d'un score unique, SynData est conçu pour identifier les dégradations potentielles de la qualité ou les risques pour la vie privée dans des sections spécifiques grâce à une interprétation basée sur des seuils et une analyse par classe.
De plus, compte tenu des environnements publics et industriels réglementés, nous avons adopté une architecture autonome fonctionnant sur un seul client, sans connexion à un serveur externe. Après le chargement des données originales et synthétiques, la vérification s'effectue simplement en sélectionnant les colonnes d'étiquettes. La classification automatique des colonnes et les fonctions de recherche/filtrage permettent une vérification efficace, même sur des ensembles de données volumineux. Les résultats de la vérification sont générés dans un format de fichier prêt à l'emploi pour la création de rapports et le partage.
Cubic a expliqué que SynData démontre simultanément l'utilité et la sécurité des données synthétiques, en servant de système de vérification facilitant la prise de décision en matière d'ouverture des données, d'apprentissage de l'IA et de collaboration externe. La certification GS est un système national qui vérifie la qualité des logiciels et constitue un indicateur de confiance essentiel lors de leur introduction dans le secteur public.
Cubic prévoit d'utiliser cette certification GS Grade 1 comme une opportunité pour promouvoir l'expansion des processus standard couvrant la création, la vérification et l'utilisation de données synthétiques dans tous les secteurs d'activité traitant des données sensibles, notamment les secteurs public, financier, médical et manufacturier.
- Voir plus d'articles connexes
You must be logged in to post a comment.