Telepix se classe deuxième au niveau mondial en matière d'évaluation des performances de l'IA pour son modèle de recherche dans le domaine aérospatial.

Classé 2e mondial pour les modèles comportant moins d' un milliard de paramètres dans le benchmark de recherche mondial RTEB
Nous avons développé notre propre banc d'essai de recherche multilingue spécifique au domaine aérospatial , « Stella ».

TelePIX (PDG Seongik Cho), une société de solutions complètes d'IA spatiale, a annoncé le 3 que son modèle d'IA (intelligence artificielle) « PIXIE-v1.0 », qui recherche avec précision des documents techniques aérospatiaux, s'est classé parmi les meilleurs dans une évaluation mondiale des performances.

PIXIE 1.0 est un modèle de recherche d'informations dédié au domaine aérospatial. Il permet d'effectuer des recherches sémantiques dans des documents techniques hautement spécialisés, notamment dans les secteurs de l'aérospatiale, des satellites et de la défense. Conçu pour faciliter la recherche en langage naturel dans de vastes quantités de documents techniques aérospatiaux, tels que les documents de conception de satellites, les spécifications techniques et les manuels d'utilisation, PIXIE 1.0 a été développé pour optimiser les performances de SatCHAT, une solution d'IA pour satellites. Faisant suite à la version préliminaire PIXIE-Preview, PIXIE 1.0 se concentre sur la vérification quantitative des performances de recherche dans ce domaine.

Ce modèle s'est récemment classé deuxième au niveau mondial dans le Retrieval Embedding Benchmark (RTEB), un benchmark de recherche global publié par la plateforme Hugging Face, dans la catégorie des modèles comportant moins d'un milliard de paramètres. Cette catégorie inclut de nombreux modèles d'intégration publiés par de grandes entreprises technologiques et des instituts de recherche internationaux.

RTEB est un banc d'essai de recherche de nouvelle génération qui étend le Massive Text Embedding Benchmark (MTEB), la norme existante pour l'évaluation des modèles d'intégration de textes. Plutôt que de se concentrer sur la compétition de scores basée sur des données de test, il vise à évaluer les performances de recherche d'informations des modèles d'IA dans des environnements industriels réels. Il permet de vérifier l'applicabilité industrielle pratique des modèles dans des domaines complexes tels que le droit, la finance, la médecine et le développement informatique.

Alors que la plupart des modèles, y compris le modèle phare du secteur, sont des modèles à usage général qui couvrent de multiples domaines tels que le droit, la finance, la médecine et le code, le Pixie 1.0 de Telefix a atteint les meilleures performances mondiales malgré sa spécialisation dans le domaine aérospatial et les documents techniques coréens-anglais.

L'entreprise a déclaré que ces résultats démontrent qu'il est possible d'obtenir des performances de recherche élevées grâce à un affinement des données spécifique au domaine et à une meilleure qualité d'apprentissage, plutôt qu'en augmentant simplement la taille du modèle. Elle a notamment expliqué que la recherche sémantique s'est avérée fiable même dans des environnements documentaires aérospatiaux riches en terminologie technique et en abréviations, confirmant ainsi son potentiel pour les applications industrielles.

Par ailleurs, Telepix a mené une évaluation complémentaire à l'aide de son propre référentiel de recherche, « STELLA », afin de vérifier les performances de recherche dans les domaines aérospatiaux multilingues, notamment en coréen, qui ne sont pas directement couverts par le RTEB. Les résultats ont confirmé que Pixie 1.0 a démontré une excellente précision de recherche par rapport à son échelle de paramètres et a maintenu des capacités de recherche stables, tant linguistiques que spécifiques au domaine. STELLA est un référentiel de recherche d'informations multilingue, construit à partir de documents spécialisés en aérospatiale, et conçu pour pallier les limitations pratiques liées à l'absence quasi totale de critères d'évaluation de la recherche publics spécifiques au domaine aérospatial.

Telepix a publié Pixie 1.0 en tant que logiciel libre et prévoit qu'il sera utilisé comme modèle de base pour la recherche de documents techniques spécialisés dans les systèmes d'IA basés sur la génération augmentée par la recherche (RAG).

Kwon Darong-sae, responsable de la science des données chez Telepix, a déclaré : « Pixie 1.0, dont la sortie a eu lieu cette fois-ci, a conservé l’orientation présentée lors de la phase de prévisualisation, tout en se concentrant sur l’amélioration durable des performances de recherche dans le domaine aérospatial. Les résultats obtenus lors de l’évaluation des performances sont excellents. Nous prévoyons que Pixie et Stella serviront de base de données pour les futures recherches et applications concrètes en matière de recherche d’informations spécifiques au domaine. » Il a ajouté : « En tant qu’entreprise spécialisée dans les solutions matérielles et logicielles intégrées d’IA pour le secteur spatial, Telepix entend se concentrer sur l’amélioration des modèles et solutions d’IA afin qu’ils puissent être utilisés concrètement dans l’industrie satellitaire. »