– L’interface vocale innovante « Whispering » implémentée avec une technologie de détection vocale de proximité sera lancée en mars
– « Rêver d’une interface qui changera le monde comme une souris »
– Attirer les investissements après le lancement de Whispering
« Nous entrons maintenant dans une ère de conversation avec l’IA, qui a commencé avec ChatGPT. Mais nous communiquons toujours uniquement via le clavier. « L’essence de la conversation est la voix. »
Seok-Joong Kim, PDG de Vtouch, a souligné les limites des interfaces vocales actuelles. Avec l'avènement de ChatGPT, les conversations naturelles avec l'IA sont devenues possibles, mais la méthode de saisie reste bloquée dans le passé, a-t-il souligné.
VTouch développe des interfaces vocales depuis plus de 10 ans. À l’époque, avec l’avènement des enceintes IA, on pensait que la voix deviendrait l’interface principale. Cependant, à l’époque, les performances de l’IA n’avaient pas atteint un niveau où une véritable conversation était possible, elle n’a donc pas été commercialisée. Au lieu de cela, ils ont attendu le bon moment pour sécuriser l’IP pertinente, et avec l’avènement de ChatGPT, l’IA s’est développée au niveau où une conversation réelle était possible, et VTouch a présenté sa technologie d’interface vocale au monde.
Le co-PDG de Vtouch, Seok-Joong Kim, a fondé une société de commerce électronique en 2002 alors qu'il était encore à l'université et l'a dirigée pendant 10 ans avant de créer Vtouch en 2012. Le cofondateur et PDG Kim Do-hyun est un expert en gestion qui a été PDG de Lazada, la plus grande société de commerce électronique d'Asie du Sud-Est. VTouch se concentre sur le développement de technologies d'interface de nouvelle génération et est à la pointe de l'innovation dans le domaine des interfaces vocales en particulier. Elle détient 71 brevets enregistrés et 55 brevets en instance, et ses prouesses technologiques ont été reconnues en remportant des prix d'innovation consécutifs au CES. En 2024, il a été sélectionné pour le « AI Startup Accelerator 2nd Batch » exploité par SK Telecom et Hana Bank. Vtouch prévoit d'attirer des investissements de série A après le lancement de WIZPR RING, qui utilise la technologie d'interface vocale.
■ Se préparer à l’ère des interfaces vocales

La manière dont les ordinateurs et les humains interagissent est en constante évolution. Il a défini l’environnement informatique de chaque époque, évoluant des premières méthodes de saisie en ligne de commande à l’interface utilisateur graphique (GUI), puis à l’écran tactile. Aujourd’hui, à l’ère de l’IA, la voix gagne en importance en tant que nouvelle interface standard.
Le PDG Kim a déclaré : « Les ordinateurs de bureau ont créé un environnement informatique complet basé sur le clavier et la souris, et les appareils mobiles ont ouvert une nouvelle ère de l'informatique avec la technologie multi-touch. Il a toutefois souligné les limites actuelles : « Les conversations avec l’IA se limitent encore au clavier. »
La voix est la forme la plus naturelle de communication humaine. Il peut transmettre efficacement un contexte et des nuances complexes, et tout le monde peut l'utiliser facilement sans apprentissage séparé. En particulier, à mesure que les interactions conversationnelles avec l’IA, représentées par ChatGPT, augmentent, la voix attire l’attention en tant que nouvelle interface capable de surmonter les limites de la saisie de texte.
Les changements qu’apporteront les interfaces vocales sont révolutionnaires. Vous pouvez utiliser votre ordinateur tout en marchant ou en faisant de l'exercice, et vous pouvez communiquer avec l'IA naturellement dans votre vie quotidienne en mains libres sans avoir à regarder l'écran. Cependant, plusieurs obstacles techniques s’opposaient à la popularisation des interfaces vocales. Les problèmes typiques comprenaient des dysfonctionnements dus au bruit ambiant, des problèmes de confidentialité, des temps de réponse longs, des erreurs de reconnaissance fréquentes et des restrictions d’utilisation dans les lieux publics.
VTouch a résolu ce problème en utilisant des principes de physique. Le représentant Kim a déclaré : « La voix a la caractéristique de perdre de l’énergie inversement proportionnellement au carré de la distance. En exploitant ce principe physique, nous avons surmonté les limitations existantes en reconnaissant uniquement les voix proches. Tout comme il a fallu 20 ans pour que l’interface graphique utilisateur devienne commercialement viable, il faut beaucoup de temps pour qu’une nouvelle interface informatique devienne populaire. « Nous nous préparons à une ère où la voix deviendra l’interface naturelle, et nous sommes convaincus que ce moment est désormais arrivé », a-t-il déclaré.
■ Whispering, Présentation d'une nouvelle interface pour l'ère de l'IA

« WIZPR RING », qui utilise la technologie d'interface vocale, devrait être lancé en mars. Développé comme un appareil portable en forme d'anneau, Whispering est une interface vocale innovante qui permet des conversations naturelles avec l'IA.
Même si votre smartphone est dans votre poche, vous pouvez envoyer des messages, contrôler la musique et gérer votre emploi du temps en utilisant simplement votre voix. Vous pouvez communiquer librement avec l’IA même dans des situations où il était auparavant difficile d’utiliser un ordinateur, comme la marche, l’exercice et la conduite. En particulier, le Whispering se caractérise par une interaction naturelle proche d’une véritable conversation, contrairement aux assistants vocaux existants. La voix est convertie en texte en temps réel et affichée, et même les noms propres et les phrases complexes sont reconnus avec précision. Il est également très utile car il peut contrôler diverses applications telles que la traduction, la gestion des horaires et la lecture de musique.
« Vous pouvez parler à l'IA pendant que vous marchez, faites de l'exercice ou conduisez, et vous pouvez communiquer librement avec l'IA même dans des situations où il était auparavant difficile d'utiliser un ordinateur », a déclaré le PDG Kim. C’est l’avenir que nous envisageons. « Whispering n’est pas seulement un simple produit, mais une solution qui présente une nouvelle interface pour l’ère de l’IA », a-t-il souligné.
Whispering a déjà obtenu 200 millions de wons de précommandes grâce au financement participatif nord-américain et commencera ses ventes officielles en mars.
■ Application d'une technologie de détection d'activité vocale de proximité qui reconnaît avec précision uniquement la voix voulue par l'utilisateur
VTouch a appliqué la technologie de détection d'activité vocale de proximité (PVAD) au chuchotement. Le PVAD est une technologie qui utilise la caractéristique physique selon laquelle le son diminue inversement proportionnellement au carré de la distance. Par exemple, une voix à une distance de 5 cm a une énergie 100 fois plus forte qu'une voix à une distance de 50 cm. En utilisant ce principe, seules les voix proches, c'est-à-dire la voix voulue par l'utilisateur, sont reconnues de manière sélective.
La technologie PVAD offre une nouvelle interface qui va au-delà de la simple reconnaissance vocale. Alors que la méthode push-to-talk existante nécessitait d'appuyer sur un bouton et de parler, PVAD a mis en œuvre une méthode close-to-talk qui permet la reconnaissance vocale avec un simple geste de près. Cela permet une interaction naturelle comme si vous aviez une vraie conversation.
Les principaux atouts de la technologie PVAD sont une reconnaissance vocale précise et une vitesse de réponse rapide. Alors que les dispositifs de reconnaissance vocale existants nécessitaient 3 à 4 secondes de temps d’activation, le PVAD reconnaît la voix en temps réel. Un autre point fort du PVAD est qu’il peut reconnaître avec précision même la parole chuchotée. Cela vous permet de communiquer librement avec l'IA tout en préservant votre confidentialité même dans les lieux publics. De plus, il est possible d'obtenir une reconnaissance précise même dans des environnements bruyants en parlant à proximité de l'appareil comme lors d'un appel téléphonique, ce qui est très utile dans les environnements d'utilisation réels.
■ « Je veux qu’on se souvienne de moi comme de la première entreprise à avoir créé une interface vocale. »
« Nous ne savons pas qui a inventé la souris, mais nous connaissons tous le changement apporté par l’innovation », a déclaré Kim. « Nous voulons également apporter ce changement », a-t-il déclaré. Il a poursuivi : « Notre objectif est d'introduire la technologie Whispering sur le marché de nos propres mains et de la commercialiser avec succès. « Je veux créer une ère où les gens pourront communiquer naturellement en utilisant leur voix tout en marchant », a-t-il déclaré, exprimant son ambition.
Conformément à la croissance de l’IA conversationnelle représentée par ChatGPT, Vtouch prévoit d’étendre son domaine d’activité à une interface vocale de nouvelle génération qui va au-delà des claviers et des écrans tactiles. À l’heure où le marché de l’IA évolue rapidement, les changements apportés par l’innovation de l’interface vocale de VTouch sont notables.
You must be logged in to post a comment.