L'IA peut même lire les émotions humaines, rendant ainsi plus intelligents les espaces à connectivité limitée comme les stades, les ports et les navires.
Le service de diffusion vocale par intelligence artificielle de la K-League destiné aux personnes malvoyantes s'apprête à s'étendre à BC Ferries et au port de Vancouver au Canada.
Nous ciblons des secteurs essentiels comme la défense et l'aérospatiale, en tirant parti de l'IA embarquée et de la souveraineté des données.

Le terrain où l'IA transforme la vie humaine se déplace de plus en plus : stades, ports, navires, aéroports, voire l'espace. D'innombrables capteurs et caméras déversent des données, mais la capacité à en comprendre le sens et à en tirer des conclusions reste l'apanage de l'humain.
H' Intelligence est une start-up qui explore précisément cette question. L'entreprise vise à créer non pas une IA capable de donner la position du ballon ou le score, mais une « IA d'intelligence spatiale » qui peut interpréter le flux et le contexte des mouvements dans un espace, voire la tension et les acclamations du moment.
Le 1er novembre, un match de K-League disputé au stade de la Coupe du monde de Daejeon a été l'occasion d'un projet pilote destiné aux spectateurs malvoyants, utilisant un système de commentaires assistés par intelligence artificielle. Grâce à ce système, qui analyse en temps réel les mouvements des joueurs et du ballon et restitue les commentaires d'un commentateur, Han Jong-min, malvoyant, a déclaré : « C'est la première fois que je regarde un match de football sans l'aide de mon petit frère. »
Pour Kim Byungjoon, PDG de H-Intelligence, cette scène ne se limite pas à une simple démonstration technologique. C'est un moment où la technologie redonne à une personne son autonomie et sa dignité, et le point de départ d'un changement plus profond. Nous avons rencontré Kim Byungjoon pour en savoir plus sur la définition que H-Intelligence donne de l'« intelligence artificielle spatiale » et sur sa stratégie d'expansion, qui s'étendra de la K-League au Canada, et aux secteurs portuaire, spatial et de la défense.
Une IA qui comprend le processus, et non le résultat.
Le mot-clé qui imprègne l'identité de H-Intelligence est « intelligence spatiale ». Le PDG, Kim, a décrit ce concept comme « une philosophie de l'IA qui comprend les processus, développée grâce à cinq années d'expérience sur le terrain et à la méthode des essais et erreurs ».
« La plupart des systèmes d'IA de vision généralistes ou basés sur le cloud existants ne voient que le résultat. Ils s'arrêtent à des choses comme : « Nous menons actuellement 2-1 », « Où se trouve le ballon ? » ou « Ce joueur court ». Ils ne comprennent pas pourquoi le score est de 2-1, ce qui s'est passé au cours des 20 dernières minutes, ni si le tir en question est véritablement un moment décisif. »
L'intelligence spatiale dont parle H-Intelligence est différente. Le PDG, Kim, a résumé la définition de l'intelligence spatiale de son entreprise comme suit :
« Il s'agit d'une technologie d'IA qui comprend de manière exhaustive les mouvements de tous les objets dans un espace spécifique, à travers le temps et le contexte, et les restitue sous forme d'histoire cohérente. »
Pour ce faire, H-Intelligence a d'abord redéfini la notion d'« espace ». Prenons l'exemple d'un terrain de football : celui-ci est entièrement délimité par des coordonnées x et y comprises entre 0 et 100, permettant ainsi à l'IA de traiter mathématiquement la perception humaine intuitive des notions d'« avant, arrière, gauche, droite ». L'IA reconnaît précisément les positions, comme par exemple : « Ce joueur se trouve sur l'aile droite (85, 40) ». Il s'agit d'une avancée significative par rapport aux IA existantes, qui se contentent d'exprimer « Il y a une personne à gauche ».
L'étape suivante est l'intégration de la chronologie. L'IA ne se contente pas de voir ce qui est actuellement à l'écran ; elle se souvient de chaque mouvement depuis le début du match jusqu'à présent.
« Nous analysons la position de ce joueur à la 5e minute de la première mi-temps, sa position à la 38e minute, les trajectoires qu'il a empruntées et les choix qu'il a faits dans des situations similaires. Cela nous permet de comprendre le contexte, par exemple : « Nous sommes sur le point de renverser la situation, le but est proche et ce joueur a eu tendance à se décaler vers la gauche dans des situations similaires par le passé. » »
Le suivi multi-objets est ici intégré. Sur un terrain de football, 22 joueurs, trois arbitres et un ballon – soit 26 objets au total – se déplacent simultanément. L'IA de H-Intelligence ne se contente pas de suivre ces objets individuellement ; elle interprète leur signification dans le contexte tactique et le déroulement du jeu. Au-delà de l'action « Le joueur 11 se projette vers l'avant », elle comprend également le contexte de cette percée : « La défense adverse s'est décalée sur la gauche, libérant un espace sur la droite. »
Les informations ainsi recueillies finissent par se transformer en « récit ». Le PDG Kim a déclaré : « Les émotions ne sont pas de simples données ; elles résultent d’une combinaison de contexte, d’importance, de temporalité et d’expérience humaine. » Grâce à son intelligence spatiale, l’IA comprend ces éléments, permettant même aux spectateurs malvoyants de percevoir, par la simple écoute, s’il s’agit d’un moment tendu, d’une opportunité cruciale ou d’une erreur regrettable.
Le moteur de diffusion vocale en temps réel ajoute une sensation de présence.

L'intelligence spatiale seule ne peut restituer pleinement la dimension émotionnelle d'une scène. H-Intelligence l'associe à un moteur de relais vocal en temps réel pour transformer l'information visuelle en une expérience complète. Le PDG, Kim, décrit ce système comme « une structure méticuleusement synchronisée en trois étapes ».
La première étape consiste en une analyse silencieuse par une IA d'intelligence spatiale.
Lorsque plusieurs caméras installées aux stades de la Coupe du monde de Daejeon et de Suwon capturent des images, une intelligence artificielle exécutée en périphérie du réseau effectue, en 0,05 à 0,59 seconde, le paramétrage des coordonnées, la reconnaissance des objets, le calcul de leur position, l'analyse des relations et l'analyse du contexte temporel. Ce processus génère des métadonnées pertinentes.
La deuxième étape consiste à générer du langage naturel.
Le modèle vision-langage exploite ces métadonnées et les traduit en une phrase décrivant la situation actuelle. Plutôt que de simplement affirmer : « La balle est partie à gauche », il transmet également des implications tactiques et temporelles, telles que : « Un espace crucial s’est ouvert sur la gauche, offrant une opportunité de retournement de situation imminente. »
La troisième étape révèle la force unique de H-Intelligence. L'entreprise enregistre les voix de commentateurs (le commentateur So Jun-il et le commentateur Lim Hyeong-cheol) en fonction de situations spécifiques, puis une IA associe ces voix au contexte en temps réel et les diffuse.
« Les systèmes de synthèse vocale existants se contentent de convertir le texte en parole standardisée générée par machine. Nous utilisons une méthode qui comprend à la fois le texte et le contexte, puis sélectionne en temps réel le ton émotionnel authentique du commentateur pour s'y adapter. Même au sein d'une même phrase, la puissance, le débit et la respiration de la voix peuvent varier en fonction du déroulement du match. »
En définitive, ce système possède une structure qui permet à l'IA de comprendre la situation et d'exprimer cette compréhension par le biais d'émotions humaines. Ainsi, les spectateurs malvoyants peuvent ressentir les mêmes émotions que les autres spectateurs du stade.
Conception inclusive : un point de départ pour les personnes malvoyantes
La diffusion vocale par IA de la K-League marque la première fois que la technologie de H-Intelligence est présentée au public, et elle sert également d'exemple de ce que l'entreprise appelle une « technologie inclusive ».
« L’expérience d’être sur un terrain de football ne se résume pas à “voir”. C’est une expérience émotionnelle globale, englobant tout, des clameurs des tribunes aux explosions de joie lors d’un but, en passant par le frisson du temps additionnel. Même si une personne est présente, une part importante de cette expérience lui est inaccessible. »
Alors que les technologies d'accessibilité existantes visaient principalement à pallier les lacunes des technologies existantes, H-Intelligence s'est fixé dès le départ pour objectif de créer une expérience permettant à tous de partager le même moment. Pour ce faire, trois principes ont été établis : une expérience en temps réel et sans latence, des voix de commentateurs captivantes et un récit contextualisé expliquant non seulement ce qui s'est passé, mais aussi pourquoi c'est important.
Le PDG Kim explique cela dans l'optique de la conception inclusive et universelle. De même que les rampes d'accès pour fauteuils roulants sont utiles aux parents poussant des poussettes et que les audioguides pour les personnes malvoyantes sont utilisés par les touristes étrangers, les technologies conçues pour les personnes malvoyantes profitent en fin de compte à un public plus large.
« Un système de relais basé sur l'intelligence artificielle, conçu pour les personnes malvoyantes, pourrait également servir d'interface audio utile aux conducteurs, aux parents qui cuisinent et même aux personnes faisant de l'exercice. Initialement destinée à un groupe spécifique, cette technologie deviendra accessible à un public plus large au fil du temps. »
Il explique le pouvoir de la conception inclusive en termes d’« échelle ».
« Imaginons une technologie qui réduit d'une minute le temps d'attente d'un passager. Si nous appliquons cette technologie à une infrastructure utilisée par 20 millions de personnes chaque année, cela représente 20 millions de minutes gagnées, soit environ 38 ans de vie. Voilà un exemple de la façon dont une petite amélioration peut transformer l'efficacité de toute une société. »
La scène au stade de la Coupe du monde de Daejeon où Han Jong-min a déclaré : « C'est la première fois que je vois un match de football sans l'aide de mon petit frère », revêt une portée symbolique encore plus grande. Le député Kim a affirmé : « C'est un moment où la liberté et la dignité de chacun sont restaurées, et cela démontre le potentiel de transformer d'innombrables vies. »
Des terrains de football aux ports, en passant par les navires et l'espace… Combler les lacunes du réseau

La vision de H-Intelligence dépasse le cadre du stade. Son PDG, Kim, a déclaré : « Il existe d’innombrables espaces dans le monde qui cherchent à devenir plus intelligents grâce aux données et à l’IA. Parmi eux, les espaces présentant d’importantes contraintes de réseau, tels que les ports, les navires et les avions, sont confrontés à des défis structurels et non résolus. »
C’est précisément pour cette raison que H-Intelligence a opté pour une IA spatiale embarquée. Afin de garantir son utilisation dans des situations critiques, cette IA doit fonctionner de manière autonome, même dans des environnements où la connexion internet est instable ou inexistante. Elle est conçue pour reconnaître et identifier les objets dans un espace, suivre leurs mouvements et fournir les résultats en temps réel par la voix.
Le terrain de football a servi de banc d'essai extrême pour valider cette technologie. Suivre en temps réel 22 joueurs, trois arbitres et un ballon, et interpréter leur contexte dans un environnement où les mouvements de chaque joueur sont en constante évolution, plutôt que prévisibles et répétitifs, représente un défi technique de taille. « Valider cette technologie dans les environnements les plus difficiles garantira sa fiabilité lors de son déploiement dans les ports, les navires, l'aviation et l'espace », a déclaré le PDG, M. Kim.
H-Intelligence s'apprête à déployer cette technologie au Canada. L'entreprise prévoit d'y établir une filiale d'ici janvier 2026. Son PDG, Kim, s'est rendu personnellement au Canada et a rencontré des représentants de BC Ferries, de l'Administration portuaire de Vancouver et de Seaspan. Leurs infrastructures sont vastes : BC Ferries exploite 48 terminaux, tandis que l'Administration portuaire de Vancouver gère 27 ports. Seaspan possède 227 porte-conteneurs. Bien que leur clientèle puisse paraître restreinte, leur réseau comprend des centaines de navires.
Le modèle économique reprend les caractéristiques des entreprises d'infrastructures. Initialement, les coûts de construction du système sont uniques, tandis que les coûts d'exploitation annuels de chaque espace génèrent des revenus récurrents sous forme d'abonnements. Les données spécifiques à chaque espace, accumulées au fil du temps, constituent un atout majeur pour l'amélioration du service. De par sa nature critique, un système mis en place est difficilement remplaçable. C'est pourquoi le PDG, Kim, estime que « la dépendance à l'infrastructure et le caractère critique du système sont des facteurs clés de la fidélisation de la clientèle ».
Interrogé sur sa stratégie de croissance, il l'a résumée en une phrase : « Commencer par le début. »
« Plutôt que de fixer un objectif chiffré, il est plus important de réaliser chaque terminal, chaque port, chaque navire au niveau souhaité par le client. Une fois une référence établie, l'espace se structure naturellement pour accueillir le client suivant. »
L’année 2026 marque un tournant pour H Intelligence. Elle célèbre le premier anniversaire de la création de sa filiale coréenne et le lancement de sa filiale canadienne. Le PDG, M. Kim, a déclaré : « Notre objectif pour 2026 est de mener à bien au moins un projet au Canada et d’y instaurer un climat de confiance. Forts de ce succès, nous espérons poursuivre notre croissance soutenue au Canada. »
Intelligence artificielle en périphérie, souveraineté des données et garde-fous de sécurité
Lorsque le PDG Kim explique l'intelligence artificielle spatiale, il y a un sujet qu'il ne manque jamais d'évoquer : la souveraineté des données et les garde-fous.
L'IA basée sur le cloud offre une évolutivité et une flexibilité supérieures, mais elle implique également le transfert de données sensibles, telles que les images de stades, les informations sur les véhicules terminaux et les données d'exploitation des navires, vers des serveurs externes. Cela représente un risque important non seulement pour la protection de la vie privée, mais aussi pour la sécurité nationale.
L'intelligence artificielle en périphérie (Edge AI) apporte une solution à ces problématiques. Le traitement des données s'effectuant sur site, sans quitter le terrain, le risque de fuite d'informations sensibles est réduit. Fonctionnant de manière autonome, même dans des zones à faible couverture réseau comme les océans et l'espace, l'intelligence spatiale en périphérie offre un avantage concurrentiel aux secteurs de la défense et de l'aérospatiale.
Le PDG Kim a fait part de cette préoccupation à la communauté internationale. Dans le rapport « Une approche de l’IA fondée sur les droits humains pour les startups technologiques et la gouvernance normative mondiale (GENEVA II) », publié par l’Approche fondée sur les droits humains des Nations Unies (UN/HRBA), il a souligné les risques cumulatifs de l’IA et l’importance de garde-fous dès les premières étapes.
« Si un système d'IA apprend à partir de données corrompues, il peut produire des résultats erronés, et lorsque ces résultats sont réinjectés dans les données d'entrée, les problèmes peuvent se multiplier de façon exponentielle. Par conséquent, il est primordial d'établir des garde-fous dès le départ. À mesure que le degré de liberté technologique augmente, l'importance des protections s'accroît également. »
Les garde-fous dont il parle ne sont pas des dispositifs qui freinent la technologie, mais plutôt des garde-fous qui permettent à la technologie d'aller plus loin et plus longtemps.
« Dans chaque espace, à chaque instant, dans chaque histoire »
Tout au long de l'entretien, le PDG Kim s'est surtout intéressé non pas à la technologie elle-même, mais à l'« espace » dans lequel elle s'inscrit et aux « personnes » qui l'utilisent. Il a notamment évoqué le moment où une personne malvoyante a pu regarder un match de football sans l'aide d'un frère ou d'une sœur, la réduction d'une minute du temps d'attente des passagers dans les ports et sur les navires, et les systèmes qui protègent la souveraineté des données dans les secteurs militaire et spatial. Chacun de ces moments est modeste, mais leur accumulation crée une force capable de transformer en profondeur la société.
Avec les progrès rapides de l'intelligence artificielle, certaines questions sont souvent négligées : « À qui appartiennent les données ? » et « Qui bénéficiera en premier lieu de cette technologie ? » H-Intelligence ambitionne de créer une entreprise qui réponde à ces questions de manière plus responsable.
L'IA profite à tous, des personnes malvoyantes aux passagers, en passant par les dockers et les astronautes, même au fond des océans où les réseaux sont inexistants, dans l'espace et dans les tribunes des stades. L'IA offre des performances optimales tout en préservant la souveraineté des données.
Le PDG Kim affirme que c'est la nouvelle norme vers laquelle devrait tendre l'industrie coréenne de l'IA.
You must be logged in to post a comment.