Demande de brevet pour la technologie « Analyse de la complexité des documents » de Crowdworks

La société de technologie d'IA Crowdworks a annoncé le 22 qu'elle avait déposé une demande de brevet pour la « Document Complexity Analysis-Based Document Automation Processing Technology », une technologie de base appliquée à sa solution de prétraitement de données d'IA « Alpy Knowledge Compiler ».

La technologie analyse quantitativement la complexité structurelle des documents et détermine si l'automatisation peut être appliquée pendant le processus de prétraitement des données non structurées essentiel au développement d'agents d'IA basés sur la génération augmentée de récupération (RAG). Il peut empêcher la dégradation de la qualité du prétraitement et le gaspillage des ressources, et améliorer l'efficacité du travail et l'optimisation des coûts en décidant à l'avance s'il faut impliquer des experts en fonction du type de document.

Selon Crowdworks, cette technologie classe les documents en quatre niveaux, de la classe 1 à la classe 4, en fonction de leur complexité, et propose une norme pour le prétraitement automatique des documents avec des structures simples et l'analyse experte des documents avec des structures complexes. Cela peut être utilisé pour prédire la possibilité d’erreurs de prétraitement des données et peut également être utilisé pour les ressources humaines et la gestion des calendriers.

La technologie est actuellement appliquée et exploitée dans la solution développée par Crowdworks, « RP Knowledge Compiler ». Cette solution convertit divers formats de documents en formats apprenables par l'IA basés sur des fonctions OCR (reconnaissance optique de caractères), d'analyse et de segmentation, et prend en charge plusieurs formats de documents tels que Hangul (HWP/HWPX), PDF, Word et Excel. Il générera des métadonnées en reconnaissant des éléments visuels tels que des structures imbriquées, des graphiques et des images dans des tableaux, et fournira également des fonctions de traitement avancées à l'aide de LLM (Large Language Model) et VLM (Vision Language Model).

Alors que la demande des entreprises en matière de gestion d'actifs de données non structurées a récemment augmenté, Crowdworks prévoit de répondre activement aux besoins de prétraitement de diverses industries au pays et à l'étranger grâce à ses solutions et de renforcer sa compétitivité dans le domaine de l'automatisation du travail basée sur l'IA.

Kim Woo-seung, PDG de Crowdworks, a déclaré : « Cette demande de brevet est le premier cas d'augmentation de la précision et de l'efficacité du prétraitement des données grâce à une technologie basée sur l'analyse de la complexité des documents, et c'est une opportunité de prouver notre différenciation en tant qu'entreprise spécialisée dans le prétraitement des données d'IA. » Il a ajouté : « Nous recevons actuellement des demandes de renseignements de diverses entreprises concernant le compilateur de connaissances RPI, et nous prévoyons son application élargie sur le marché de l'IA d'entreprise. »


  • Voir plus d'articles connexes