Crowdworks présente les dernières tendances en matière de technologie de l'IA lors de la « Session d'information sur la technologie de l'IA »

Crowdworks a annoncé le 16 qu'il avait partagé les dernières tendances en matière de technologie de l'IA et présenté sa technologie de prétraitement des données lors de la « AI Technology Briefing Session » organisée par Jae-Cheol Kim, AI Graduate School de l'Institut coréen avancé des sciences et technologies (KAIST) qui s'est tenue au COEX le matin du 16.

Cette séance d'information technologique est conçue pour présenter les principales technologies d'IA étudiées au KAIST à l'industrie et au grand public, et pour promouvoir la diffusion des technologies d'IA et l'activation de la coopération entre l'industrie et le monde universitaire. Cet événement a eu lieu dans le cadre de l'« Exposition internationale sur l'intelligence artificielle 2025 (AI EXPO KOREA) », et Crowdworks a participé à la conférence à l'invitation du KAIST.

Yang Su-yeol, directeur technique de Crowdworks, a donné une conférence sur un sujet intéressant : « Pourquoi l'IA ne peut-elle pas lire le rapport du directeur Kim que le PDG lit bien ? »

Le directeur technique Yang a expliqué : « Bien que l'IA puisse lire des formats de documents généraux, il n'est toujours pas facile de comprendre la « signification » contenue dans le document et de l'extraire sous forme de métadonnées. » Il a poursuivi : « Les éléments visuels tels que les graphiques et les diagrammes doivent aller au-delà de simples explications et prendre en compte le contexte des phrases et des paragraphes environnants pour configurer des métadonnées basées sur le sens afin que l'IA puisse récupérer avec précision les informations connexes et améliorer la qualité des réponses. »

Il a poursuivi : « Étant donné que les documents de notre pays ont leur propre style et structure uniques, l’utilisation d’analyseurs étrangers tels qu’ils sont entraînera de nombreuses erreurs », et a souligné : « Nous devons refléter ces caractéristiques des documents nationaux et mettre en œuvre une grande précision grâce à une analyse et un traitement précis des tableaux et des éléments visuels. »

Parallèlement à cela, la société a également introduit sa propre solution, « Alpy Knowledge Compiler », qui peut prétraiter divers documents non structurés dans un format adapté au RAG (Retrieval-Augmented Generation). La solution effectue une analyse basée sur le LMM (Large Multimodal Model) sur des tableaux, des graphiques, des images, etc. dans des documents et ajoute des métadonnées sémantiques pour améliorer la précision de la recherche et la qualité des réponses aux requêtes. En particulier, il est possible d'analyser systématiquement la structure du document en appliquant un indice d'auto-évaluation qui peut quantifier la complexité des documents pour la première fois dans l'industrie, réduisant ainsi la possibilité d'erreurs de prétraitement des données et gérant efficacement la main-d'œuvre et le budget.


  • Voir plus d'articles connexes