– Cibler le marché mondial avec une technologie propriétaire combinant protection différentielle des informations et IA générative
-Devient l’une des quatre plus grandes sociétés de données synthétiques au monde
-Rêver de devenir « l’Amazon » du monde des données
Les données sont comme le cerveau de l’IA. Tout comme les humains grandissent grâce à diverses expériences, l’IA développe également un jugement sophistiqué grâce à des données abondantes. Cependant, il n’est pas facile d’obtenir des données de qualité. Les données originales sont difficiles à collecter et les tâches de prétraitement telles que l'étiquetage sont compliquées. Il existe des restrictions sur le partage de données en raison du risque de fuite d'informations sensibles et personnelles, et une distribution déséquilibrée des données réduit les performances d'analyse.
Une entreprise a vu le jour pour résoudre ces problèmes de données. CUBIG est une société d'IA spécialisée dans la sécurité des données et la génération de données synthétiques. CUBIG se prépare à entrer sur le marché mondial avec sa technologie unique qui combine une technologie de protection différentielle des informations et une IA générative.
Le co-PDG Bae Ho, qui dirige CUBIG, est actuellement professeur à l'Université Ewha Womans. Il a obtenu une maîtrise en sécurité de l'information de l'Université de Londres et un doctorat en IA de l'Université nationale de Séoul, et a reçu l'attention pour la publication du premier article au monde établissant la confidentialité et la sécurité dans le domaine de l'IA. Le co-PDG Jeong Min-chan détient de nombreux brevets liés à la R&D et à l'IA et possède de l'expérience dans le développement d'applications de données d'IA. Le CTO Ha Heon-seok est un expert en IA qui recherche des données synthétiques depuis plus de 10 ans.
Après avoir créé la société en 2021, CUBIG a attiré des investissements d'amorçage de Naver D2SF et de VNTG en 2023, et des investissements pré-A de la Banque coréenne de développement et d'Intops Investment en 2024. En 2024, elle a remporté le prix du ministre des Sciences et des TIC lors des Information Security Product Innovation Awards et a été sélectionnée pour le « 2e accélérateur de startups IA » géré conjointement par SK Telecom et Hana Bank. Nous avons rencontré le PDG Bae Ho et le PDG Jeong Min-chan pour en savoir plus sur le processus par lequel CUBIG s'est imposée comme la seule entreprise au monde spécialisée dans les données synthétiques sécurisées.
■ « Défi mondial… « L’IA est le moteur de croissance de la prochaine génération »

Le PDG Jeong Min-chan, que nous avons rencontré chez Naver D2SF à Gangnam, a commencé par dire aux startups de « tenter leur chance sur les marchés étrangers ».
« Dans le domaine de l’IA, il ne faut pas hésiter à démarrer une entreprise par défaitisme ou avoir peur de s’étendre à l’étranger. « Même si nous ne sommes pas reconnus au niveau national, nous pouvons devenir une entreprise dont on a besoin à l’étranger. »
Le PDG Jeong a comparé les entreprises d’IA à des « roues ». « Peu importe la qualité d’une « roue » que vous fabriquez, elle ne vaut rien si vous n’avez pas de « voiture de sport » pour l’utiliser. "Cependant, s'il existe une "voiture de sport" à l'étranger, nous pouvons y créer une synergie", a-t-il déclaré, nous conseillant de trouver une "voiture de sport" qui corresponde à nos "roues" sur le marché mondial.
Le représentant Jeong a également souligné le potentiel de croissance de l'industrie coréenne de l'IA. « Une entreprise d’IA dotée de son propre algorithme doit également émerger en Corée. « L’IA deviendra le moteur de croissance de nouvelle génération de notre pays », a-t-il déclaré. « La différence dans les performances de l’IA vient de l’apprentissage des données. Même si le même moteur apprend avec des données de haute qualité, de bien meilleurs résultats peuvent être obtenus », a-t-il déclaré, soulignant l'importance des données dans l'industrie de l'IA.
■ Seulement 4 entreprises dans le monde spécialisées dans les données synthétiques
Les données synthétiques sont une sorte de substitut qui surmonte les limites des données originales. Contrairement aux données existantes, elles sont faciles à obtenir, ne nécessitent aucun prétraitement et ne comportent aucune restriction quant à l’utilisation d’informations sensibles. Le risque de fuite d’informations personnelles est faible et le partage de données est gratuit. De plus, les performances d'analyse peuvent être améliorées même si la distribution des données d'origine est déséquilibrée.
Le représentant Jeong a comparé des données synthétiques à des répliques dans un musée. « Tout comme un musée expose des objets contrefaits au lieu d’objets réels, les données synthétiques remplacent les données réelles et sensibles. Les données réelles contiennent des informations sensibles telles que des informations génétiques, des informations financières, des secrets d'affaires et des informations personnellement identifiables et sont soumises à une réglementation stricte. « Le Royaume-Uni applique un système d'approbation préalable, les États-Unis appliquent un système de post-responsabilité et la Corée a des réglementations plus strictes que l'Europe », a-t-il expliqué à propos de la nécessité de données synthétiques. En d’autres termes, les données synthétiques peuvent être considérées comme des données artificielles qui remplacent des données réelles dont l’utilisation est limitée en raison de la réglementation.
Seules quatre sociétés dans le monde, dont CUBIG, disposent d'une technologie avancée de données synthétiques qui remplace les informations personnelles tout en conservant les caractéristiques statistiques et la distribution des données réelles.
■ Combinaison de protection différentielle des informations et d'IA générative… Renforcer la sécurité tout en préservant la qualité des données
Ce qui est important lors de la génération de données synthétiques, c'est la taille et la sécurité des données. Par exemple, lors de l'annonce des statistiques démographiques d'une petite région, si l'on analyse la population des « hommes octogénaires de la région OO », il existe un risque d'identification d'individus en raison du petit nombre de paramètres. Pour résoudre ces problèmes, une technologie de protection différentielle des informations est nécessaire.
La technologie de protection différentielle des informations préserve les caractéristiques statistiques de l’ensemble de données tout en rendant impossible l’identification des données individuelles. La technologie de protection différentielle des informations fait partie du top 10 des technologies innovantes de 2020 sélectionnées par le MIT et est actuellement connue comme la méthode de sécurité des données la plus sûre. Le caractère innovant de la technologie de protection différentielle des informations réside dans le fait que la restauration des données originales est impossible. Contrairement au traitement de désidentification ou au cryptage existant, les données auxquelles une protection différentielle des informations a été appliquée ne peuvent pas être restituées aux informations d'origine. Cela permet d’atteindre simultanément les deux objectifs de protection des informations personnelles et d’utilisation des données.
Le PDG Bae a déclaré : « La technologie de protection différentielle des informations est la dernière technologie de sécurité des données actuellement adoptée par des entreprises et des organisations mondiales telles qu'Apple et le Bureau de recensement des États-Unis. Ce qui est innovant dans cette technologie, c'est que la restauration des données originales est impossible. Contrairement au traitement de désidentification ou au cryptage existant, les données auxquelles une protection différentielle des informations a été appliquée ne peuvent pas être restituées à leurs informations d'origine. "Cela permet d'atteindre les deux objectifs de protection des informations personnelles et d'utilisation des données en même temps."
CUBIG est allé encore plus loin et a combiné la protection différentielle des informations et l’IA générative. Le PDG Bae a déclaré : « Si seule une protection différentielle des informations est appliquée, il existe une limite où les performances des données chutent à 70-80 %. « Pour résoudre ce problème, nous avons combiné la protection différentielle des informations et l’IA générative, et grâce à cela nous avons présenté un nouveau paradigme appelé « données synthétiques sécurisées ». Les données synthétiques sécurisées sont une technologie innovante qui améliore la sécurité tout en préservant la qualité des données.

■ Créez des données identiques à l'original sans voir les données d'origine… Technologie sans accès aux données
Tout comme la création d’une réplique de musée nécessite de voir l’original, la création de données synthétiques nécessite des données originales. Cependant, CUBIG a développé une « technologie d’inaccessibilité des données » pour créer des données synthétiques sans voir les données originales.
Le PDG Bae a déclaré : « Auparavant, les données originales devaient être partagées pour des raisons de sécurité. Cependant, il est difficile pour les entreprises ou les organisations de fournir des données sensibles à des tiers. "Nous avons résolu ce problème fondamental grâce à la technologie d'inaccessibilité des données."
La technologie d'inaccessibilité des données de CUBIG pour créer des produits contrefaits sans examiner les œuvres originales selon la méthode « 20 questions ». Si le client décrit simplement les propriétés de base des données souhaitées, CUBIG crée et transmet l'ensemble de données attendu. Le client sélectionne les données appropriées parmi celles-ci et répète ce processus pour augmenter la précision des données.
Le PDG Jeong a déclaré : « Si vous expliquez que la première colonne est le sexe et la deuxième colonne l'âge, nous générerons plusieurs ensembles de données attendues et vous les enverrons. Lorsque le client sélectionne les données appropriées parmi celles-ci, un nouvel ensemble de données est créé et renvoyé à nouveau en fonction des données sélectionnées. « Nous améliorons la qualité des données en posant « vingt questions » aux clients », a-t-il expliqué à propos de la technologie d'inaccessibilité des données.
CUBIG a acquis un brevet pour la technologie sans accès aux données et a prouvé l'excellence de la technologie grâce à PoC (Proof of Concept) avec Naver. Le PDG Jeong a déclaré : « En mai 2024, Microsoft a annoncé un algorithme similaire, et bien que Microsoft ne puisse traiter que des données d'image, CUBIG peut traiter divers types de données telles que du texte, des images et des tableaux. » L'excellence de la technologie d'inaccessibilité des données a été soulignée.
■ « DTS » et « azoo », un nouveau paradigme dans l'industrie de la donnée
CUBIG propose deux solutions principales. Le premier est le B2B SaaS « DTS », un outil qui permet aux entreprises de générer des données synthétiques en interne. DTS, lancé en juillet 2024, est utilisé pour partager des données entre affiliés et sécuriser des données pour l'apprentissage de l'IA, et fonctionne selon un modèle d'abonnement.
La seconde est « azoo », une plateforme d’échange de données lancée en juin 2024. En raison de la réglementation sur les données, diverses données ont dû être achetées individuellement, mais azoo utilise des données synthétiques pour permettre l'échange intégré de diverses données en un seul endroit.
Le PDG Jeong a déclaré : « En raison de la réglementation actuelle, nous sommes dans une situation où nous devons acheter des données auprès de différentes sources. Cependant, comme les données synthétiques ne sont pas soumises à réglementation, toutes les données peuvent être achetées au même endroit, comme dans un centre commercial en ligne », a-t-il expliqué.
azoo fournit actuellement des fonctions de transaction de données de base et prépare un service de combinaison de données. Une fonction d’analyse intégrée devrait également être introduite au premier semestre 2025. Grâce à cela, nous prévoyons de développer au-delà d’une simple plateforme de trading vers une plateforme complète de solutions de données.

■ Entrer sur le marché mondial et attirer les investissements étrangers
CUBIG se prépare actuellement à entrer sur le marché mondial. La stratégie consiste notamment à cibler d’abord le marché européen, qui applique des réglementations strictes en matière de données. Nous sommes en train de créer une société britannique et prévoyons également d’attirer des investissements étrangers. Le PDG Jeong a déclaré : « L'Europe a des réglementations strictes en matière de données telles que le RGPD (Règlement général sur la protection des données), le besoin de notre solution est donc plus grand. "Nous nous préparons actuellement à créer une société au Royaume-Uni et nous envisageons ensuite d'entrer sur le marché américain", a-t-il déclaré à propos des projets d'expansion mondiale.
« Pour que l’IA soit sûre, les données d’entraînement doivent être sécurisées. CUBIG ouvrira un nouveau paradigme dans l’industrie des données », a-t-il déclaré. « Nous voulons devenir « l’Amazon du monde des données ». "Tout comme Amazon commercialise des produits du monde entier sur une seule plateforme, nous voulons créer un écosystème où toutes les données peuvent être échangées en toute sécurité et librement", a-t-il déclaré, exprimant son ambition d'ouvrir un nouvel horizon dans l'industrie des données.
You must be logged in to post a comment.