Évolution des modèles de langage IA : les entreprises se lancent dans des technologies personnalisées spécifiques à leur secteur d’activité

Avec les progrès de l'intelligence artificielle (IA), l'émergence de modèles de langage à grande échelle (MLGE), entraînés à comprendre et à générer le langage humain, est un moteur d'avancées rapides dans le domaine du traitement automatique du langage naturel (TALN). L'IA générative, comme ChatGPT, est également capable de comprendre le contexte et de tenir des conversations plus naturelles grâce aux progrès réalisés dans le domaine des MLGE. Ces modèles sont utilisés dans tous les secteurs du traitement des données et jouent un rôle essentiel dans la croissance rapide des technologies d'IA.

Récemment, les modèles de langage (LLM) ont évolué vers des formes sophistiquées et spécialisées pour des domaines spécifiques tels que les communications, les jeux vidéo, la sécurité et le droit. Les LLM généralistes, malgré leur entraînement sur de vastes quantités de données, présentent des limitations dans les domaines exigeant une expertise approfondie. Ils sont également confrontés à des problèmes inhérents, comme des vulnérabilités en matière de sécurité de l'information et des hallucinations. Par conséquent, les entreprises développent des modèles de langage propriétaires plus précis, en les entraînant sur des connaissances et des données spécialisées reflétant les caractéristiques uniques de chaque secteur. Examinons des exemples d'entreprises qui font progresser les technologies d'IA grâce à des « LLM de domaine » optimisés pour leurs secteurs et leurs activités.

Crowdworks minimise les problèmes d'hallucinations grâce à son expérience dans le développement d'IA d'entreprise dans divers secteurs.

La société Crowdworks, spécialisée dans les technologies d'IA , propose un moteur de données qui prétraite les données nécessaires à l'apprentissage de l'IA , ainsi qu'une solution d'IA offrant des services personnalisés de construction de modèles de langage à grande échelle ( LLM ) pour chaque entreprise. Grâce à son moteur de données, Crowdworks exploite une plateforme d'annotation de données qui convertit divers types de données, comme des images et des vidéos, en formats reconnaissables par l'IA . La plateforme permet aux particuliers de participer à des tâches d'annotation et de partager les bénéfices, en vendant les données ainsi obtenues à des clients tels que des institutions financières et des portails de recherche. Crowdworks revendique 620 000 annotateurs inscrits, soit le plus grand nombre en Corée.

Concernant les solutions d'IA , la plateforme LLM , dédiée à l'optimisation, a été lancée en septembre 2023. Sélectionnée comme partenaire officiel de Naver HyperClova X, elle a également lancé au premier semestre de cette année WorksOne , une solution SLM spécifique au secteur d'activité. LLM gère par ailleurs Crowd Academy, qui forme le personnel nécessaire à la création de données pour l'IA . Crowd Academy propose des contenus pédagogiques pour la formation des étiqueteurs et a été sélectionnée pour le programme « National Tomorrow Learning Card » en 2021 et le projet « Platform Worker Specialized Training » en 2023.

En particulier, Crowdworks a minimisé le problème d'hallucination chronique du LLM grâce à son expérience dans le développement de l'IA d'entreprise dans divers secteurs, et a augmenté la satisfaction client en améliorant l'exhaustivité et la précision des réponses grâce aux données de résultats et à la vérification des performances.

◆ Démonstration de capacités de traitement de données spécialisées avec un modèle de langage spécifique au dark web, S2W

S2W (ci-après dénommée S2W), une entreprise spécialisée dans l'intelligence artificielle et la sécurité des données, se distingue par le développement de « DarkBERT », le premier modèle de langage IA au monde spécifiquement conçu pour le dark web. Ce modèle est capable d'analyser le langage complexe et les contenus illégaux présents sur le dark web, connu pour être un foyer de cybercriminalité variée, notamment le trafic de drogue, les ransomwares et le piratage informatique. Entraîné sur un vaste corpus de données textuelles comprenant environ 300 millions de pages collectées sur le dark web, le modèle affiche d'excellentes performances dans des tâches d'analyse telles que la classification thématique des pages et la détection des sites de fuite de ransomwares, améliorant ainsi l'efficacité des enquêtes en matière de cybercriminalité. Par ailleurs, S2W a intégré « DarkCHAT », un chatbot dédié au dark web utilisant DarkBERT, à sa plateforme d'analyse de données massives basée sur l'IA « XARVIS GLOBAL ». Cette plateforme, fournie à une agence gouvernementale indonésienne, permet aux utilisateurs d'accéder instantanément aux informations relatives à la cybercriminalité dont ils ont besoin.

Après Darkbert, le nouveau modèle de langage IA dédié à la cybersécurité, CyberTuned, est conçu pour apprendre efficacement les données non structurées de cybersécurité, notamment les éléments non verbaux tels que les URL et les hachages SHA, démontrant ainsi des capacités exceptionnelles pour les missions de renseignement sur les cybermenaces (CTI). Par ailleurs, l'entreprise étend son expertise en traitement automatique du langage naturel (TALN) et ses compétences spécialisées en traitement de données, acquises grâce au développement de modèles de langage dédiés à la cybersécurité, à divers secteurs d'activité, dont l'industrie manufacturière, la distribution, la finance et le secteur public.

BHSN développe son propre programme de maîtrise en droit spécialisé afin d'améliorer l'efficacité, du conseil juridique à la révision des contrats.

Il existe également des plateformes d'IA qui optimisent l'efficacité juridique grâce à des LLM spécialisés dans le marché juridique. Développée par BHSN, une société spécialisée dans les solutions d'IA juridique, Allibee est une plateforme SaaS (Software-as-a-Service) basée sur une IA générative et dédiée au secteur juridique. Elle offre des fonctionnalités optimisées pour les tâches liées aux contrats juridiques en comprenant le contexte, en saisissant le sens des mots et en fournissant des réponses appropriées.

Allybee repose sur le modèle de langage juridique IA propriétaire de BHSN, « BHSN Legal-LLM ». Ce modèle a été intensivement entraîné sur un vaste volume de données juridiques de haute qualité, comprenant des contrats, des lois, de la jurisprudence et des politiques, sélectionnés et générés grâce à la collaboration entre juristes et ingénieurs en IA. À partir de ces informations très précises, Allybee a implémenté des fonctionnalités détaillées adaptées au domaine juridique. La plateforme propose également des services tels que la modification des contrats pour les aligner sur les politiques internes, en s'appuyant sur les données de clients variés, notamment des entreprises, des institutions publiques et des cabinets d'avocats. Actuellement, Allybee est utilisée comme une solution d'IA métier tout-en-un qui améliore la productivité grâce à ses fonctionnalités spécialisées dans le domaine juridique.

SKT innove en matière de gestion interne avec « Telco LLM », un modèle linguistique personnalisé pour les entreprises de télécommunications.

Le modèle LLM « Telco » de SK Telecom (ci-après SKT) est un modèle LLM dédié aux télécommunications. Il a étudié la terminologie spécifique du secteur (forfaits 5G, abonnements T, subventions publiques, etc.) ainsi que les directives éthiques internes en matière d'IA. SKT a collecté et sélectionné un vaste volume de données sur les télécommunications coréennes, puis l'a entraîné sur ses propres moteurs « AX », « GPT » d'OpenAI et « Claude » d'Antropic afin de construire un modèle LLM multi-moteurs. Ce modèle a fait l'objet d'un processus d'optimisation poussé, exclusivement destiné aux entreprises de télécommunications. Il est conçu pour traiter des données dans des domaines spécialisés (services, avantages des abonnements, comportements des clients, etc.), ce qui lui permet d'effectuer des tâches de haut niveau, contrairement aux modèles LLM généralistes.

SKT améliore son efficacité opérationnelle interne en sélectionnant et en appliquant des modèles multimodaux (LLM) optimisés pour chaque service grâce à sa plateforme multi-moteurs Telco LLM. Cette plateforme met en œuvre des fonctionnalités adaptées aux différentes situations de travail dans le secteur des télécommunications et renforce ainsi son efficacité opérationnelle interne. Récemment, SKT a lancé le « Système d'assistance à la consultation par IA », le premier système basé sur un LLM parmi les principaux centres clients nationaux. Ce système permet aux conseillers de rechercher et d'organiser rapidement les informations nécessaires en posant des questions en langage naturel. Par ailleurs, SKT a également développé un « Système de traitement automatisé de documents par IA » qui traite automatiquement les documents envoyés par les clients par SMS et e-mail, grâce à un modèle multimodal étendu (LMM) capable de comprendre non seulement le texte, mais aussi diverses images. SKT prévoit d'étendre l'application de Telco LLM à divers secteurs d'activité, au-delà de la gestion des réseaux de distribution et de l'exploitation des infrastructures réseau.

Le « Barco LLM » de NCsoft présente un nouveau paradigme pour l'IA créative au-delà des domaines du jeu et du divertissement.

VARCO LLM est le premier modèle de langage IA développé en interne par NCSOFT. Véritable moteur d'innovation dans l'industrie du jeu vidéo et du divertissement, il contribue à la création de contenus de haute qualité, spécialement conçus pour le développement de jeux. VARCO analyse les données relatives au développement de contenus de jeu, tels que les textes et les scénarios, optimisant ainsi l'efficacité de chaque étape du processus : planification, développement et direction artistique. Plus précisément, VARCO Studio, basé sur VARCO LLM, est une plateforme IA dédiée à la production de jeux. Il prend en charge l'intégralité du développement grâce à des fonctionnalités IA majeures : VARCO Art, un outil web de création d'images spécialisé dans la propriété intellectuelle de NCSOFT ; VARCO Text, un outil de création et de gestion de textes ; et VARCO Avatar, pour la création de PNJ et de chatbots IA. VARCO contribue ainsi à la création de contenus de haute qualité.

Bien que Varco LLM soit un modèle de langage spécialisé dans la création de contenu pour les jeux vidéo, il est appliqué à divers secteurs, tels que l'automobile et l'éducation, grâce à des accords commerciaux portant sur le développement de modèles spécifiques à chaque domaine. NCsoft souhaite que Varco offre une créativité différenciée des IA créatives généralistes existantes et a continuellement développé et publié des modèles de langage optimisés aux performances améliorées, comme les versions de nouvelle génération « Varco LLM 2.0 » et « Llama-VARCO LLM ». À terme, NCsoft prévoit de scinder « NC Research », son organisme de recherche et développement en IA à l'origine de Varco, en une filiale spécialisée dans l'IA et le développement des technologies associées.


  • Voir plus d'articles connexes