
Jimmy Mission, société spécialisée dans le traitement intelligent de documents par IA, a annoncé le 22 qu'elle avait été sélectionnée pour le projet de recherche « Small and Medium Business Technology Innovation Development Project Market Expansion » organisé par le ministère des PME et des startups.
Le projet de recherche sélectionné est « Recherche et développement d'une solution OCR intelligente multimodale basée sur VLM », et grâce à cette recherche, G-Mission prévoit de surmonter les limites de la technologie OCR d'IA d'apprentissage profond existante et de développer une solution de traitement de documents intelligente adaptée à l'ère de la transition de l'IA (AX).
Un modèle de langage visuel (MLV) est un modèle multimodal qui apprend et analyse simultanément les informations visuelles, telles que les images et les mises en page, en plus de la reconnaissance de texte. Alors que l'OCR classique se concentre sur l'extraction de caractères, l'OCR multimodal basé sur le MLV analyse en profondeur le texte, les tableaux, les graphiques et la mise en forme d'un document, permettant ainsi une compréhension globale du sens et du contexte du document.
Gmission utilise actuellement l'OCR par IA pour la classification automatique des formats de documents, le masquage automatique des informations personnelles et la synthèse et la recherche basées sur la LLM. Ce projet de recherche et développement intégrera la technologie VLM à cette technologie afin d'améliorer la compréhension et l'exploitation du sens du document dans son intégralité.
Cela permet aux utilisateurs de bénéficier d'un environnement de traitement de documents intelligent qui va au-delà de la simple extraction de texte et reflète le sens et le contexte de chaque élément d'un document. Par exemple, même des données numériques peuvent être extraites selon leur format, comme les numéros de compte ou les numéros d'enregistrement de résident, et seuls les éléments souhaités peuvent être synthétisés de manière sélective. De plus, les fonctionnalités de recherche contextuelle permettent aux utilisateurs de localiser rapidement et précisément les informations nécessaires dans des documents volumineux, ce qui devrait améliorer l'efficacité du travail.
Han Jun-seop, PDG de Jimision, a déclaré : « Grâce à cette recherche et développement, nous sécuriserons une technologie avancée de traitement de documents et présenterons des solutions d'IA innovantes qui peuvent être utilisées dans divers secteurs tels que les secteurs public, financier, médical et des entreprises. »
- Voir plus d'articles connexes
You must be logged in to post a comment.