-생체인증의 새로운 표준…기존 기술의 한계를 넘어선 완벽한 이중 인증 시스템
-입술 움직임의 고도로 개인화된 패턴으로 위조 불가능한 보안 구현
– 3초 만에 쉽게 인증해 사용자 편의성 높아

한 장의 정지 이미지나 5초의 영상만으로도 자연스러운 가짜 영상을 생성할 수 있다. 고급 3D 프린팅 기술로 만든 마스크는 피부의 미세한 질감, 모공, 심지어 혈관까지 정교하게 재현해 대부분의 얼굴 인식 시스템을 속인다. AI 음성 합성 기술은 이미 인간의 귀로 구분 불가능한 수준까지 발전했다. 지문 역시 고급 3D 프린팅으로 복제가 가능하다.
딥페이크 기술의 고도화로 얼굴 인식이 뚫리고, 음성 합성으로 음성 인식도 무용지물이 되는 시대. 창과 방패의 싸움처럼, 공격 기술이 진화하면 방어 기술도 함께 진화한다. 하지만 현실은 늘 창이 방패보다 한 발 앞선다.
이 문제를 해결하기 위해 2개 이상의 생체인증을 결합하는 방식을 시도해왔다. 그러나 기존의 다중 생체인증에는 근본적인 한계가 있다. 사용자가 여러 단계의 인증 과정을 거쳐야 하고, 절차가 복잡하며, 시간이 오래 걸려 사용성이 급격히 떨어진다는 것이다.
현재의 생체인증 시스템에 대해 테라마임은 전혀 다른 답을 제시한다. 바로 ‘입술 움직임’이다.
테라마임이 개발한 LIPS-Security(Lips Intelligent Password System)는 입술의 움직임과 특정 단어의 음성을 결합한 이중 인증 솔루션이다. 입술 움직임 기반 생체인증 기술은 글로벌에서 인정받았다. 올해 국제지식재산기구(WIPO)의 Global Awards Finalist에 선정되었으며, 중소벤처기업부의 창업성장 기술개발사업에 최종 선정되기도 했다. 지난 8월에는 SK텔레콤의 AI 스타트업 엑셀러레이터 3기에 선정됐고, 지난달에는 서울지역 투자브릿지 프로그램에서 1등을 차지해 가장 투자 매력이 높은 기업으로 평가받기도 했다. 최근에는 과기정통부와 NIPA의 AI컴퓨팅 자원 활용 기반 강화 사업에 선정되어 H200 GPU 8대를 할당받았다.
테라마임의 박재준 대표는 현재 고려대학교 스마트보안학부 4학년에 재학 중이다. 고려대학교 연구실에서 테라마임의 박재준 대표를 만나 생체인증의 미래, 그리고 그 안에서 우리의 일상이 어떻게 변할 것인지에 대해 이야기를 들어봤다.
‘입술’에서 보안의 새로운 패러다임을 찾다
왜 하필 ‘입술’일까? 얼굴도, 홍채도, 지문도 아닌 입술 움직임이 차별성을 가질 수 있는 이유가 무엇일까?
테라마임이 입술을 선택한 것은 기존 생체인증 기술들의 근본적인 한계를 보았기 때문이다. 얼굴 인식은 딥페이크에, 음성 인식은 음성 합성에, 지문은 복제 기술에 취약했다. 테라마임은 이 모든 기술을 개선할 수 없다면, 완전히 새로운 생체정보를 찾아야 한다고 판단했다.
“입술은 사람마다 구조가 다를 뿐 아니라, 특정 단어를 발음할 때의 움직임이 고도로 개인화되어 있습니다. 이것을 수치화하고 AI로 분석하면 위조가 거의 불가능한 생체정보가 될 수 있다고 생각했어요.”
입술 움직임은 세 가지 이유에서 완벽하다.
첫째, 같은 단어를 발음할 때도 모든 사람이 다르게 입술을 움직인다. 입술의 크기, 음성 습관, 신경 제어 패턴이 모두 다르기 때문이다. 이는 지문처럼 개인화되면서도, 지문과 달리 동적으로 변한다는 점에서 더욱 유일하다.
둘째, 입술 움직임을 위조하기는 거의 불가능하다. 딥페이크가 영상을 합성하더라도 음성과의 밀리초 단위 동기화, 주변 피부의 자연스러운 변형, 물리학적 일관성까지 모두 정확하게 재현해야 한다. 이는 기술적으로 극도로 어렵다.
셋째, 규제 관점에서 가장 덜 민감한 생체정보다. 지문은 평생 사용하는 신원 증명이고, 얼굴은 프라이버시 침해 우려가 크며, 홍채는 최상위 등급의 특수 정보로 분류된다. 하지만 입술 움직임은 단순한 신체 동작으로 인식되어 규제 리스크가 적다.
입술 인증은 아무도 시도하지 않은 공백 시장이었다. 테라마임은 이 시장을 선점한다면 시장 표준을 정하고 오랜 기간 리더십을 유지할 수 있을 것으로 판단했다.
이중 보안으로 완벽하게 막아내
LIPS-Security는 두 가지 생체정보를 동시에 분석하는 이중 인증 시스템이다. 첫 번째는 안면 인식(Face Recognition, FR)이고, 두 번째는 입술 인식(Lips Reading, LR)다. 박재준 대표는 이 둘을 결합할 때만 진정한 의미의 “위조 불가능한 생체인증”이 가능해진다고 강조했다.
이는 기존의 다중인증(Multi-Factor Authentication)과는 다르다. 기존 다중인증은 “비밀번호 입력 → 지문 인식 → 추가 코드 입력” 같은 식으로 순차적인 단계를 거쳐야 하지만, LIPS-Security는 음성과 입술 움직임을 실시간으로 동시에 검증한다.
LIPS-Security의 첫 번째 인증 레이어인 안면 인식 시스템은 사용자의 얼굴 구조적 특징을 분석한다. 눈과 눈 사이의 거리, 코의 길이, 턱의 형태, 얼굴의 전체적인 윤곽 등을 3D 좌표로 변환해서 저장된 데이터와 비교한다. 이 과정에서 시스템은 입술 주변의 미세한 특징까지 포착한다. 같은 사람이라도 나이가 들면서 피부가 처지거나 주름이 생기는데, 입술 주변의 특징점들이 이러한 변화에 어느 정도 견딜 수 있으면서도 개인성을 유지한다. 이것이 바로 입술이 생체인증에 최적화된 신체 부위인 이유다.
두 번째 생체정보는 입술 움직임의 고유성이다. 같은 단어를 발음할 때 사람마다 입술의 움직임이 다르다는 점이다.
예를 들어, ‘안녕하세요’라는 단어를 발음할 때, 모든 사람이 같은 방식으로 입술을 움직이지 않는다. 누구는 입을 크게 벌리지만, 누구는 작게 벌린다. 누구는 빠르게 움직이지만, 누구는 천천히 움직인다. 특히 중요한 것은 이러한 입술 움직임의 패턴이 거의 위조 불가능하다는 점이다.
입술은 여러 개의 랜드마크(특정 포인트)로 이루어져 있다. 입술의 꼭짓점, 입 모서리, 입술 중앙선 등이 그것이다. 30fps 단위로 추적하여 기본 사양의 휴대폰 카메라에서도 호환이 가능하다. 3초동안 90개의 프레임이 분석되며 각 프레임에서 입술의 정확한 위치나 모양, 미세움직임이 기록된다. 이렇게 기록된 입술의 다양한 고유의 특성들은 고도로 개인화된 서명(Signature)이 된다.
LIPS-Security는 입술의 동적 움직임(Motion Factor)과 정적인 얼굴 특징(Static Factor)을 동시에 검증한다. 단순히 입술의 정적인 특징만 본다면 3D 마스크나 고도의 영상 합성으로 속일 수 있다. LIPS-Security은 ‘입술이 실제로 움직이는지’를 판단하는 생체 신호 감지 기술을 추가로 적용해 딥페이크 방어 능력도 갖췄다.
“딥페이크는 대부분 영상을 대상으로 합니다. 하지만 우리가 검증하는 것은 입술의 물리적 움직임의 미묘한 차이입니다. 마치 서명이나 필체가 완벽히 같을 수 없듯, 입술의 움직임도 다시 만들 수 없다는 원리입니다.”

3초만에 이중 인증
사용자가 LIPS-Security를 사용하는 과정은 놀랍도록 단순하다. 사용자는 스마트폰이나 키오스크 앞에 서서 카메라를 바라본 채 특정 단어를 말하면 된다. 예를 들어 ‘오늘의 날씨는’이나 ‘비밀번호’ 같은 특정 문구를 3초 정도 발음한다. 공공장소나 시끄러운 환경에서도, 목소리를 낼 수 없는 상황에서도 음성 없이 인증이 가능하다.
시스템은 사용자의 입술이 어떻게 움직이는지를 기록하고, 얼굴을 인식한다. 그리고 시스템은 이 두 가지 정보를 거의 실시간으로 분석해서 거짓인지 아닌지를 판단한다. 중요한 것은 이 과정이 매우 빠르다는 점이다. 기존의 다중인증 시스템에서는 여러 단계를 거치느라 10초 이상 소요되기도 하지만 LIPS-Security 인증 속도는 3초다. 이는 사용자가 거의 불편함을 느끼지 못할 정도의 속도다.
입술 인증으로 20억 사용자를 노리다
테라마임은 우선 국내 B2B부터 공략한다는 계획이다. VDI(가상 데스크톱 인프라) 시장과 ACS(접근통제 시스템) 시장이 그것이다. 2030년까지 VDI 시장이 500억 달러, ACS 시장이 400억 달러 규모로 성장할 것으로 예상되는데, 이 두 시장에서 LIPS-Security는 보안과 편의성을 동시에 제공하는 이상적인 솔루션이 된다.
테라마임은 통신사와 협력하여 스마트폰에 LIPS-Security를 탑재하는 것을 궁극적인 목표로 세웠다. 이것이 실현되면 전 세계 20억 명 이상의 스마트폰 사용자가 매일 테라마임의 기술을 사용하게 된다.
테라마임은 올해 기술적인 완성도를 확보한 다음 국내 고객사와의 협력을 시작으로 내년엔 글로벌 기업과의 협력을 강화해 2027년부터는 본격적인 수익화를 기대하고 있다.
테라마임의 최종 비전은 LIPS-Security가 보안의 새로운 표준이 되는 것이다. 입술 인증이 세계 모든 디바이스의 기본 인증 수단으로 자리 잡으면, 기존의 복잡한 비밀번호와 다중인증 시스템은 과거의 유물이 될 것이다.
테라마임은 입술 움직임만으로 기기를 제어할 수 있는 시스템인 LIPS-Command 솔루션도 개발하고 있다. LIPS-Command는 Eye Tracking과 Lips Reading을 결합해 음성 없는 인터페이스를 구현한다. 손을 사용할 수 없거나 말을 할 수 없는 상황에서도 기기 제어가 가능하다.

우리가 보안 시스템에 더 많이 의존할수록 신뢰는 역설적으로 떨어진다. 딥페이크로 인해 우리의 눈과 귀도 믿기 어렵고, 보이스피싱으로 인해 지인의 목소리조차 의심하는 시대다.
이러한 혼란 속에서 테라마임이 제시하는 입술 움직임은 단순한 기술이 아니다. 위조 불가능한 생체정보를 통해 우리가 정말로 안전한 거래를 하고 있으며, 진짜 그 사람과 연결되어 있음을 증명하려는 노력이다.
LIPS-Security가 일상에 정착하면 복잡한 비밀번호와 번거로운 다중인증은 사라질 것이다. 은행 송금, 병원 진료, 회사 출근 때 입술 움직임 3초만으로 모든 인증이 완료된다. 테라마임이 그리는 미래가 실현된다면 우리의 삶은 그만큼 나아질 것이다.
Lip movements are changing the future of security… TERAMIME's unforgeable biometric authentication.
A new standard in biometric authentication… A perfect two-factor authentication system that transcends the limitations of existing technologies.
– Implementing tamper-proof security with highly personalized lip movement patterns
– Easy authentication in 3 seconds, enhancing user convenience

Even a single still image or a five-second video clip can be used to create a natural-looking fake video. Masks made with advanced 3D printing technology precisely replicate the fine texture, pores, and even blood vessels of skin, fooling most facial recognition systems. AI voice synthesis technology has already advanced to a level that makes it indistinguishable to the human ear. Fingerprints can also be replicated using advanced 3D printing.
Deepfake technology has advanced, making facial recognition impenetrable, and voice synthesis has rendered voice recognition useless. Like the battle between spear and shield, as offensive technology evolves, so too does defensive technology. However, the reality is that the spear always outpaces the shield.
To address this issue, attempts have been made to combine two or more biometric authentication methods. However, existing multi-biometric authentication methods have fundamental limitations. They require users to undergo multiple authentication steps, are complex, and take a long time, significantly reducing usability.
TERAMIME offers a completely different answer to current biometric authentication systems: lip movements.
Developed by TERAMIME, LIPS-Security (Lips Intelligent Password System) is a two-factor authentication solution that combines lip movements with the vocalization of specific words. This lip-motion-based biometric authentication technology has received global recognition. This year, it was selected as a finalist for the World Intellectual Property Organization (WIPO) Global Awards and was also selected for the Ministry of SMEs and Startups' Startup Growth Technology Development Project. Last August, it was selected for SK Telecom's third AI Startup Accelerator, and last month, it won first place in the Seoul Regional Investment Bridge Program, earning it the highest investment attractiveness. Recently, it was selected for the Ministry of Science and ICT and NIPA's AI Computing Resource Utilization Enhancement Project, and was allocated eight H200 GPUs.
TERAMIME CEO Jaejun Park is currently a senior in the Department of Smart Security at Korea University. We met with TERAMIME CEO Jaejun Park at his lab at Korea University to discuss the future of biometric authentication and how it will transform our daily lives.
Finding a New Paradigm for Security in the "Lips"
Why "lips" of all things? Why can lip movements, rather than face, iris, or fingerprints, create such a distinctive effect?
TERAMIME chose lips because it recognized the fundamental limitations of existing biometric authentication technologies. Facial recognition was vulnerable to deepfakes, voice recognition to voice synthesis, and fingerprints to cloning. TERAMIME concluded that if all these technologies could not be improved, they would need to find an entirely new biometric.
"Not only is the lip structure unique to each person, but the movements used when pronouncing certain words are highly personalized. I thought that if we quantify this and analyze it with AI, it could become biometric information that's nearly impossible to falsify."
Lip movements are perfect for three reasons.
First, even when pronouncing the same word, everyone moves their lips differently. This is because lip size, vocal habits, and neural control patterns are all different. Like a fingerprint, this is personalized, yet unlike a fingerprint, it dynamically changes, making it even more unique.
Second, it's nearly impossible to fake lip movements. Even if deepfakes synthesize video, they must accurately replicate everything—from millisecond-by-second synchronization with voice to natural deformation of surrounding skin and physical consistency. This is technically extremely difficult.
Third, it's the least sensitive biometric information from a regulatory perspective. Fingerprints serve as lifelong identification, facial recognition raises privacy concerns, and irises are classified as highly sensitive information. However, lip movements are recognized as simple bodily movements, so they pose less regulatory risk.
Lip authentication was a niche market, untapped. TERAMIME believed that if it could seize the initiative, it could set a market standard and maintain long-term leadership.
Completely blocked with double security
LIPS-Security is a dual-factor authentication system that analyzes two types of biometric information simultaneously. The first is facial recognition (FR) and the second is lip reading (LR). CEO Park Jae-jun emphasized that only by combining these two methods can true "unforgeable biometric authentication" be achieved.
This differs from conventional multi-factor authentication (MFA). While conventional MFA requires sequential steps like "password entry → fingerprint recognition → additional code entry," LIPS-Security simultaneously verifies voice and lip movements in real time.
LIPS-Security's first authentication layer, the facial recognition system, analyzes the user's facial structural features. It converts the distance between the eyes, the length of the nose, the shape of the chin, and the overall contour of the face into 3D coordinates and compares them with stored data. During this process, the system even captures subtle features around the lips. Even with the same person, skin sags and wrinkles as they age, but the features around the lips can withstand these changes to a certain degree while maintaining individuality. This is why lips are the ideal body part for biometric authentication.
The second biometric is the uniqueness of lip movements. Each person's lip movements vary when pronouncing the same word.
For example, when pronouncing the word "hello," not everyone moves their lips in the same way. Some open their mouths wide, others narrowly. Some move quickly, others slowly. Importantly, these lip movement patterns are nearly impossible to fake.
Lips are composed of several landmarks (specific points), including the corners of the lips, the center line of the lips, and more. Tracking at 30 frames per second (fps) ensures compatibility with even basic mobile phone cameras. Ninety frames are analyzed over three seconds, recording the precise position, shape, and micro-movements of the lips in each frame. These recorded, unique characteristics of the lips become a highly personalized signature.
LIPS-Security simultaneously verifies dynamic lip movement (Motion Factor) and static facial features (Static Factor). Simply examining static lip features can lead to deception using 3D masks or advanced image synthesis. LIPS-Security also incorporates biometric signal detection technology to determine whether the lips are actually moving, providing deepfake defense capabilities.
"Deepfakes mostly target videos. However, what we verify are the subtle differences in physical lip movements. Just as a signature or handwriting cannot be perfectly identical, lip movements cannot be recreated."

Two-factor authentication in 3 seconds
The process for users to use LIPS-Security is surprisingly simple. Users simply stand in front of their smartphone or kiosk, look into the camera, and speak a specific word. For example, they might say something like "Today's weather" or "password" for about three seconds. Voice-less authentication is possible even in public places, noisy environments, or situations where speaking is difficult.
The system records the user's lip movements and recognizes their face. It then analyzes these two pieces of information in near real-time to determine whether the information is fake or not. Crucially, this process is remarkably fast. While conventional multi-factor authentication systems can take over 10 seconds due to multiple steps, LIPS-Security authentication takes just 3 seconds. This speed is so fast that users will hardly notice any inconvenience.
Targeting 2 billion users with lip authentication
TERAMIME plans to initially target the domestic B2B market, targeting the VDI (Virtual Desktop Infrastructure) and ACS (Access Control System) markets. The VDI market is expected to grow to $50 billion and the ACS market to $40 billion by 2030, making LIPS-Security an ideal solution for both markets, offering both security and convenience.
TERAMIME's ultimate goal is to integrate LIPS-Security into smartphones in collaboration with telecommunications companies. If this is realized, over 2 billion smartphone users worldwide will use TERAMIME's technology every day.
TERAMIME aims to secure technological perfection this year, begin collaboration with domestic clients, and strengthen collaboration with global companies next year, with full-scale profitability expected starting in 2027.
TERAMIME's ultimate vision is for LIPS-Security to become the new standard in security. Once lip authentication becomes the default authentication method for all devices worldwide, existing complex passwords and multi-factor authentication systems will become a thing of the past.
TERAMIME is also developing the LIPS-Command solution, a system that allows devices to be controlled solely through lip movements. LIPS-Command combines eye tracking and lip reading to create a voiceless interface. This enables device control even in situations where hands or speech are unavailable.

The more we rely on security systems, the more paradoxically our trust declines. Deepfakes make it difficult to trust our eyes and ears, and voice phishing makes us doubt even the voices of acquaintances.
In this chaos, the lip movements presented by TERAMIME are not simply a technology. They are an effort to prove that we are truly engaging in secure transactions and connecting with a genuine person through tamper-proof biometric information.
As LIPS-Security becomes a part of our daily lives, complex passwords and cumbersome multi-factor authentication will disappear. Whether it's bank transfers, hospital visits, or commuting to work, authentication will be completed with just three seconds of lip movement. If the future envisioned by TERAMIME becomes a reality, our lives will become that much better.
唇の動き、セキュリティの未来を変える… TERAMIMEが描く偽造不可能な生体認証
-生体認証の新しい標準…既存技術の限界を超えた完全な二重認証システム
– 唇の動きの高度にパーソナライズされたパターンで偽造不可能なセキュリティを実現
– 3秒で簡単に認証し、ユーザーの利便性を高める

一枚の静止画像や5秒の映像だけでも自然な偽の映像を生成することができる。高度な3Dプリント技術で作られたマスクは、肌の微細な質感、毛穴、さらには血管まで精巧に再現し、ほとんどの顔認識システムをだます。 AI音声合成技術はすでに人間の耳で区別不可能なレベルまで発展している。指紋も高級3Dプリントで複製が可能だ。
ディープフェイク技術の高度化で顔認識が突き抜け、音声合成で音声認識も無用地物になる時代。槍と盾の戦いのように、攻撃技術が進化すると防御技術も一緒に進化する。だが現実はいつも窓が盾より一歩先立つ。
この問題を解決するために、2つ以上の生体認証を結合する方法を試みてきた。しかし、既存の多重生体認証には根本的な限界がある。ユーザーがさまざまな段階の認証プロセスを経なければならず、手順が複雑で、時間がかかり、使いやすさが急激に低下するということです。
現在の生体認証システムでは、TERAMIMEはまったく異なる答えを提示します。まさに「唇の動き」だ。
TERAMIMEが開発したLIPS-Security(Lips Intelligent Password System)は、唇の動きと特定の単語の音声を組み合わせた二重認証ソリューションです。唇の動きに基づく生体認証技術はグローバルに認められた。今年、国際知識財産機構(WIPO)のGlobal Awards Finalistに選定され、中小ベンチャー企業部の創業成長技術開発事業に最終選定された。去る8月にはSKテレコムのAIスタートアップアクセラレータ3期に選定され、先月にはソウル地域投資ブリッジプログラムで1位を占め、最も投資魅力の高い企業と評価された。最近では、過期正統部とNIPAのAIコンピューティング資源活用基盤強化事業に選定され、H200 GPU 8台を割り当てられた。
TERAMIMEのパク・ジェジュン代表は現在、高麗大学スマートセキュリティ学部4年生に在学中だ。高麗大学研究室でTERAMIMEのパク・ジェジュン代表に会って生体認証の未来、そしてその中で私たちの日常がどのように変わるかについて話を聞いた。
「唇」でセキュリティの新しいパラダイムを探す
なぜハーピル「唇」なのか?顔も、虹彩も、指紋でもない唇の動きが差別性を持つことができる理由は何だろうか?
TERAMIMEが唇を選んだのは、既存の生体認証技術の根本的な限界を見たからだ。顔認識はディープフェイクに、音声認識は音声合成に、指紋は複製技術に脆弱であった。 TERAMIMEは、これらすべての技術を改善できなければ、全く新しい生体情報を探すべきだと判断した。
「唇は人によって構造が異なるだけでなく、特定の単語を発音する時の動きが高度に個人化されています。これを数値化してAIで分析すれば偽造がほとんど不可能な生体情報になることができると思いました。」
唇の動きは3つの理由で完璧です。
まず、同じ単語を発音するときも、誰もが違うように唇を動かします。唇の大きさ、陰性習慣、神経制御パターンがすべて異なるためだ。これは指紋のように個人化されながらも、指紋とは異なり動的に変化するという点でさらに唯一である。
第二に、唇の動きを偽造することはほとんど不可能です。ディープフェイクが映像を合成しても、音声とのミリ秒単位の同期、周囲の皮膚の自然な変形、物理的一貫性まですべて正確に再現しなければならない。これは技術的に非常に困難です。
第三に、規制の観点から最も敏感な生体定より。指紋は生涯使用する身元証明であり、顔はプライバシー侵害の恐れが大きく、虹彩は最上位等級の特殊情報に分類される。しかし、唇の動きは単純な身体動作として認識され、規制リスクが少ない。
唇の認証は、誰も試していない空白市場でした。 TERAMIMEは、この市場を先取りすれば市場標準を定め、長期間リーダーシップを維持できると判断した。
二重セキュリティで完全に防ぎます
LIPS-Securityは、2つの生体情報を同時に分析する二重認証システムです。 1つ目は顔認識(Face Recognition、FR)、2つ目は唇認識(Lips Reading、LR)です。パク・ジェジュン代表はこの二つを結合する時だけ真の意味の「偽造不可能な生体認証」が可能になると強調した。
これは、従来の多重認証(Multi-Factor Authentication)とは異なる。既存の多重認証は「パスワード入力→指紋認識→追加コード入力」と同じように順次的なステップを経なければならないが、LIPS-Securityは音声と唇の動きをリアルタイムで同時に検証する。
LIPS-Securityの最初の認証層である顔認識システムは、ユーザーの顔の構造的特徴を分析します。目と目の間の距離、鼻の長さ、顎の形、顔の全体的な輪郭などを3D座標に変換して保存されたデータと比較します。この過程で、システムは唇の周りの細かい特徴まで捉えます。同じ人でも年をとるにつれて皮膚が垂れたりしわが生じるが、唇周辺の特徴点がこの変化にある程度耐えられながらも個人性を維持する。これが唇が生体認証に最適化された身体部位である理由だ。
2番目の生体情報は唇の動きの固有性です。同じ単語を発音するとき、人ごとに唇の動きが異なるという点だ。
例えば、「こんにちは」という言葉を発音するとき、誰もが同じ方法で唇を動かすわけではありません。誰は口を大きく開けるが、誰は小さく広げる。誰は速く動くが、誰はゆっくり動く。特に重要なのは、これらの唇の動きのパターンはほとんど偽造不可能であるということです。
唇はいくつかのランドマーク(特定のポイント)で構成されています。唇の頂点、口の隅、唇の中央線などがそれだ。 30fps単位で追跡し、基本仕様の携帯電話カメラでも互換性がある。 3秒間90個のフレームが分析され、各フレームで唇の正確な位置や形状、細かい職務が記録される。このように記録された唇の様々な固有の特性は、高度にパーソナライズされた署名になります。
LIPS-Securityは、唇の動的動き(Motion Factor)と静的な顔の特徴(Static Factor)を同時に検証します。単に唇の静的な特徴だけを見ると、3Dマスクや高度な映像合成でだますことができる。 LIPS-Securityは「唇が実際に動くか」を判断する生体信号検知技術を追加適用してディープフェイク防御能力も備えた。
「ディープフェイクはほとんど映像を対象にしていますが、私たちが検証するのは唇の物理的な動きの微妙な違いです。

3秒で二重認証
ユーザーがLIPS-Securityを使用するプロセスは驚くほど単純です。ユーザーは、スマートフォンやキオスクの前に立ってカメラを見たまま特定の単語を言えばよい。例えば「今日の天気は」や「パスワード」のような特定のフレーズを3秒ほど発音する。公共の場所や騒々しい環境でも、声が出せない状況でも音声なしで認証が可能だ。
システムは、ユーザの唇がどのように動くかを記録し、顔を認識する。そして、システムはこれら2つの情報をほぼリアルタイムで分析し、偽か否かを判断する。重要なのは、このプロセスが非常に速いということです。従来のマルチ認証システムでは、いくつかの段階を経て10秒以上かかることもあるが、LIPS-Security認証速度は3秒だ。これはユーザーがほとんど不便を感じないほどの速度だ。
唇認証で20億人のユーザーを狙う
TERAMIMEはまず国内B2Bから攻略する計画だ。 VDI(仮想デスクトップインフラ)市場とACS(アクセス制御システム)市場がそれだ。 2030年までにVDI市場が500億ドル、ACS市場が400億ドル規模に成長すると予想され、この2つの市場でLIPS-Securityはセキュリティと利便性を同時に提供する理想的なソリューションとなる。
TERAMIMEは通信会社と協力してスマートフォンにLIPS-Securityを搭載することを究極の目標に立てた。これが実現すれば、世界20億人以上のスマートフォンユーザーが毎日TERAMIMEの技術を使うことになる。
TERAMIMEは今年の技術的な完成度を確保し、国内顧客との協力をはじめ、来年はグローバル企業との協力を強化し、2027年からは本格的な収益化を期待している。
TERAMIMEの最終的なビジョンは、LIPS-Securityがセキュリティの新しい標準になることです。唇認証が世界中のすべてのデバイスの基本認証手段となっている場合、既存の複雑なパスワードと多重認証システムは過去の遺物になります。
TERAMIMEは唇の動きだけで機器を制御できるシステムであるLIPS-Commandソリューションも開発している。 LIPS-CommandはEye TrackingとLips Readingを組み合わせて音声レスインターフェースを実現する。手が使えなかったり話ができない状況でも機器制御が可能だ。

セキュリティシステムに依存するほど、信頼は逆説的に低下します。ディープフェイクによって私たちの目と耳も信じにくく、ボイスフィッシングによって知人の声すら疑う時代だ。
この混乱の中で、TERAMIMEが提示する唇の動きは単なる技術ではありません。偽造不可能な生体情報を通じて私たちが本当に安全な取引をしており、本当にその人とつながっていることを証明する努力だ。
LIPS-Securityが日常的に定着すると、複雑なパスワードと面倒な多重認証は消えます。銀行振込、病院診療、会社出勤時に唇の動き3秒ですべての認証が完了する。 TERAMIMEが描く未来が実現すれば、私たちの生活はそれほど良くなるでしょう。
唇部动作正在改变安全的未来……TERAMIME 不可伪造的生物特征认证。
生物识别认证的新标准……一种完美的双因素认证系统,超越了现有技术的局限性。
– 采用高度个性化的唇部动作模式实现防篡改安全措施
– 3 秒即可轻松完成身份验证,提升用户便利性

即使是一张静态图片或一段五秒钟的视频片段,也可以用来制作逼真的伪造视频。采用先进3D打印技术制作的面具能够精确复制皮肤的细微纹理、毛孔甚至血管,从而骗过大多数人脸识别系统。人工智能语音合成技术已经发展到人耳无法分辨的程度。指纹也可以利用先进的3D打印技术进行复制。
深度伪造技术日臻完善,使得人脸识别几乎无法破解;语音合成技术也让语音识别彻底失效。正如长矛与盾牌的较量,进攻性技术的进步必然伴随着防御性技术的革新。然而,现实是,长矛始终领先于盾牌。
为了解决这个问题,人们尝试将两种或多种生物特征认证方法结合起来。然而,现有的多生物特征认证方法存在根本性的局限性。它们需要用户完成多个认证步骤,流程复杂且耗时,大大降低了易用性。
TERAMIME 为当前的生物识别认证系统提供了一种完全不同的解决方案:唇部动作。
由TERAMIME开发的LIPS-Security(唇部智能密码系统)是一种双因素身份验证解决方案,它将唇部动作与特定词语的发音相结合。这项基于唇部动作的生物识别身份验证技术已获得全球认可。今年,它入围了世界知识产权组织(WIPO)全球奖的决赛,并入选韩国中小企业和创业部(SMEs and Startups Ministry)的创业成长技术开发项目。去年8月,它入选了SK Telecom第三届人工智能创业加速器项目;上个月,它在首尔地区投资桥梁计划中荣获第一名,获得了最高的投资吸引力。最近,它入选了韩国科学技术信息通信部(MSICT)和国家知识产权局(NIPA)的人工智能计算资源利用率提升项目,并获得了8块H200 GPU。
TERAMIME首席执行官朴宰俊目前是韩国大学智能安全系的一名高年级学生。我们与朴宰俊在韩国大学的实验室进行了会面,探讨了生物识别认证的未来及其将如何改变我们的日常生活。
在“嘴唇”中寻找安全的新范式
为什么偏偏是“嘴唇”?为什么嘴唇的动作,而不是面部、虹膜或指纹,能够产生如此独特的效果?
TERAMIME之所以选择唇部识别,是因为它认识到现有生物识别认证技术的根本局限性。面部识别容易受到深度伪造技术的攻击,语音识别容易受到语音合成技术的攻击,指纹识别容易受到克隆技术的攻击。TERAMIME得出结论:如果这些技术都无法改进,他们就需要寻找一种全新的生物识别技术。
“每个人的唇部结构不仅独一无二,而且发音时的动作也高度个性化。我认为,如果我们能将这些特征量化,并用人工智能进行分析,就能形成几乎不可能伪造的生物识别信息。”
唇部动作之所以完美,有三个原因。
首先,即使发同一个音,每个人的嘴唇动作也各不相同。这是因为每个人的嘴唇大小、发声习惯和神经控制模式都不一样。就像指纹一样,嘴唇动作是个性化的,但与指纹不同的是,它会动态变化,使其更加独特。
其次,伪造唇部动作几乎是不可能的。即使深度伪造技术能够合成视频,也必须精确复制所有细节——从与语音的毫秒级同步到周围皮肤的自然形变和物理质感。这在技术上极其困难。
第三,从监管角度来看,唇部动作是敏感度最低的生物特征信息。指纹可作为终身身份识别,面部识别会引发隐私担忧,虹膜则被归类为高度敏感信息。然而,唇部动作被视为简单的身体动作,因此带来的监管风险较小。
唇部鉴定是一个尚未开发的细分市场。TERAMIME 认为,如果能够抢占先机,就能树立市场标准并保持长期领先地位。
双重安全措施,完全封锁
LIPS-Security 是一款双因素认证系统,可同时分析两种生物特征信息:面部识别 (FR) 和唇语识别 (LR)。CEO 朴宰俊强调,只有将这两种方法结合起来,才能实现真正“不可伪造的生物特征认证”。
这与传统的多因素身份验证 (MFA) 不同。传统的 MFA 需要“输入密码 → 指纹识别 → 输入附加代码”等顺序步骤,而 LIPS-Security 可以实时同时验证语音和唇部动作。
LIPS-Security 的第一层认证——面部识别系统,会分析用户的面部结构特征。它将眼间距、鼻长、下巴形状以及面部整体轮廓转换为 3D 坐标,并与存储的数据进行比对。在此过程中,系统甚至会捕捉到嘴唇周围的细微特征。即使是同一个人,随着年龄的增长,皮肤也会松弛下垂,出现皱纹,但嘴唇周围的特征在一定程度上能够抵御这些变化,保持其独特性。正因如此,嘴唇是生物特征认证的理想部位。
第二项生物特征是唇部动作的独特性。每个人在发同一个词的音时,唇部动作都会有所不同。
例如,在发“hello”这个词的音时,每个人的嘴唇动作都不尽相同。有些人张大嘴巴,有些人则张小嘴。有些人动作很快,有些人则很慢。重要的是,这些嘴唇动作模式几乎不可能伪装。
嘴唇由多个特征点(特定点)组成,包括嘴角、唇线等等。每秒 30 帧 (fps) 的追踪速度确保了即使是入门级手机摄像头也能兼容。在三秒钟内分析 90 帧,记录每一帧中嘴唇的精确位置、形状和细微运动。这些记录下来的独特唇部特征将成为高度个性化的签名。
LIPS-Security 可同时验证动态唇部运动(运动因子)和静态面部特征(静态因子)。仅检测静态唇部特征可能导致使用 3D 面具或高级图像合成技术进行欺骗。LIPS-Security 还集成了生物特征信号检测技术,以判断唇部是否实际运动,从而具备抵御深度伪造攻击的能力。
“深度伪造技术主要针对视频。然而,我们验证的是嘴唇动作的细微差别。就像签名或笔迹不可能完全相同一样,嘴唇动作也无法完全复制。”

3 秒内完成双因素身份验证
用户使用 LIPS-Security 的过程非常简单。只需站在智能手机或自助服务终端前,看向摄像头,然后说出一个特定的词语即可。例如,他们可以说“今天的天气”或“密码”,持续大约三秒钟。即使在公共场所、嘈杂的环境或不方便说话的情况下,也能进行无声身份验证。
该系统会记录用户的唇部动作并识别其面部。然后,它会近乎实时地分析这两项信息,以判断信息是否真实。至关重要的是,这个过程速度极快。传统的多因素身份验证系统由于步骤繁多,可能需要超过 10 秒的时间,而 LIPS-Security 身份验证仅需 3 秒。如此之快,用户几乎感觉不到任何不便。
利用唇部认证技术瞄准20亿用户
TERAMIME计划初期瞄准国内B2B市场,重点关注VDI(虚拟桌面基础架构)和ACS(门禁系统)市场。预计到2030年,VDI市场规模将增长至500亿美元,ACS市场规模将增长至400亿美元,因此LIPS-Security将成为这两个市场的理想解决方案,兼具安全性和便捷性。
TERAMIME的最终目标是与电信公司合作,将LIPS安全技术集成到智能手机中。如果这一目标实现,全球将有超过20亿智能手机用户每天使用TERAMIME的技术。
TERAMIME 的目标是今年实现技术上的完美,明年开始与国内客户合作,并加强与全球公司的合作,预计从 2027 年开始全面盈利。
TERAMIME 的最终愿景是让 LIPS-Security 成为安全领域的新标准。一旦 LIPS 认证成为全球所有设备的默认认证方式,现有的复杂密码和多因素认证系统都将成为历史。
TERAMIME公司正在开发LIPS-Command解决方案,该系统仅通过唇部动作即可控制设备。LIPS-Command结合了眼动追踪和唇语识别技术,打造出无声交互界面。即使在无法使用双手或说话的情况下,也能实现设备控制。

我们越依赖安全系统,信任度反而越低,这本身就是一个悖论。深度伪造技术让我们难以相信自己的眼睛和耳朵,而语音钓鱼则让我们甚至对熟人的声音都产生怀疑。
在这种混乱局面下,TERAMIME 所展示的唇部动作不仅仅是一项技术。它们旨在证明,我们正在进行真正安全的交易,并通过防篡改的生物识别信息与真人建立联系。
随着唇部安全技术融入我们的日常生活,复杂的密码和繁琐的多因素认证将成为历史。无论是银行转账、就医还是通勤上班,只需三秒钟的唇部动作即可完成所有认证。如果TERAMIME所设想的未来成为现实,我们的生活将会变得更加美好。
Les mouvements des lèvres transforment l'avenir de la sécurité… L'authentification biométrique infalsifiable de TERAMIME.
Une nouvelle norme en matière d'authentification biométrique… Un système d'authentification à deux facteurs parfait qui transcende les limites des technologies existantes.
– Mise en œuvre d'une sécurité inviolable avec des motifs de mouvements labiaux hautement personnalisés
– Authentification facile en 3 secondes, pour une utilisation plus intuitive

Une simple image fixe ou un clip vidéo de cinq secondes suffisent à créer une fausse vidéo d'apparence naturelle. Les masques fabriqués grâce à une technologie d'impression 3D avancée reproduisent avec précision la texture fine, les pores et même les vaisseaux sanguins de la peau, trompant ainsi la plupart des systèmes de reconnaissance faciale. La technologie de synthèse vocale par intelligence artificielle a déjà atteint un niveau de performance tel qu'elle est indiscernable de l'oreille humaine. Les empreintes digitales peuvent également être reproduites grâce à l'impression 3D avancée.
La technologie des deepfakes a progressé, rendant la reconnaissance faciale impénétrable, et la synthèse vocale a rendu la reconnaissance vocale obsolète. À l'instar du combat entre la lance et le bouclier, l'évolution des technologies offensives s'accompagne de celle des technologies défensives. Or, force est de constater que la lance a toujours une longueur d'avance sur le bouclier.
Pour remédier à ce problème, des tentatives ont été faites pour combiner deux méthodes d'authentification biométrique, voire plus. Cependant, les méthodes d'authentification multi-biométriques existantes présentent des limitations fondamentales. Elles exigent des utilisateurs qu'ils effectuent plusieurs étapes d'authentification, sont complexes et longues, ce qui réduit considérablement leur convivialité.
TERAMIME propose une réponse totalement différente des systèmes d'authentification biométrique actuels : les mouvements des lèvres.
Développée par TERAMIME, LIPS-Security (Lips Intelligent Password System) est une solution d'authentification à deux facteurs qui combine les mouvements des lèvres à la prononciation de mots spécifiques. Cette technologie d'authentification biométrique basée sur la reconnaissance des mouvements des lèvres a acquis une renommée internationale. Cette année, elle a été finaliste des Prix mondiaux de l'Organisation mondiale de la propriété intellectuelle (OMPI) et sélectionnée pour le projet de développement technologique de croissance des startups du ministère des PME et des Startups. En août dernier, elle a été retenue pour la troisième édition du programme d'accélération de startups en IA de SK Telecom et, le mois dernier, elle a remporté la première place du programme Seoul Regional Investment Bridge, ce qui lui confère le plus haut niveau d'attractivité pour les investisseurs. Récemment, elle a été sélectionnée pour le projet d'amélioration de l'utilisation des ressources de calcul en IA du ministère des Sciences et des TIC et de l'Institut national de physique et de robotique (NIPA), et s'est vu attribuer huit GPU H200.
Jaejun Park, PDG de TERAMIME, est actuellement étudiant en dernière année au département de sécurité intelligente de l'Université de Corée. Nous l'avons rencontré dans son laboratoire pour discuter de l'avenir de l'authentification biométrique et de son impact sur notre quotidien.
Trouver un nouveau paradigme pour la sécurité dans les "lèvres"
Pourquoi les lèvres, parmi toutes les choses possibles ? Pourquoi les mouvements des lèvres, plutôt que ceux du visage, de l’iris ou des empreintes digitales, peuvent-ils créer un effet aussi distinctif ?
TERAMIME a opté pour la reconnaissance des lèvres en raison des limitations fondamentales des technologies d'authentification biométrique existantes. La reconnaissance faciale était vulnérable aux deepfakes, la reconnaissance vocale à la synthèse vocale et les empreintes digitales au clonage. TERAMIME a conclu que si toutes ces technologies ne pouvaient être améliorées, il faudrait trouver une solution biométrique entièrement nouvelle.
« Non seulement la structure des lèvres est unique à chaque individu, mais les mouvements utilisés pour prononcer certains mots sont également très personnalisés. Je me suis dit que si nous quantifions ces mouvements et les analysons grâce à l'IA, nous pourrions obtenir des informations biométriques quasiment impossibles à falsifier. »
Les mouvements des lèvres sont parfaits pour trois raisons.
Tout d'abord, même en prononçant le même mot, chacun bouge ses lèvres différemment. Cela s'explique par le fait que la taille des lèvres, les habitudes vocales et les schémas de contrôle neuronal varient d'une personne à l'autre. À l'instar des empreintes digitales, cette particularité est unique, mais contrairement à ces dernières, elle évolue constamment, la rendant encore plus singulière.
Deuxièmement, il est quasiment impossible de falsifier les mouvements des lèvres. Même si les deepfakes synthétisent la vidéo, ils doivent tout reproduire avec précision : de la synchronisation milliseconde à seconde avec la voix à la déformation naturelle de la peau et à la consistance physique. C’est techniquement extrêmement difficile.
Troisièmement, d'un point de vue réglementaire, il s'agit de l'information biométrique la moins sensible. Les empreintes digitales servent à l'identification permanente, la reconnaissance faciale soulève des problèmes de confidentialité et l'iris est classé comme information hautement sensible. En revanche, les mouvements des lèvres sont considérés comme de simples mouvements corporels et présentent donc moins de risques réglementaires.
L’authentification labiale représentait un marché de niche inexploité. TERAMIME était convaincue qu’en prenant l’initiative, elle pourrait établir une norme sur le marché et conserver un leadership durable.
Complètement bloqué avec double sécurité
LIPS-Security est un système d'authentification à deux facteurs qui analyse simultanément deux types d'informations biométriques : la reconnaissance faciale (RF) et la lecture labiale (RL). Le PDG, Park Jae-jun, a souligné que seule la combinaison de ces deux méthodes permet d'obtenir une véritable authentification biométrique infalsifiable.
Cela diffère de l'authentification multifacteurs (MFA) classique. Alors que la MFA classique exige des étapes séquentielles telles que « saisie du mot de passe → reconnaissance d'empreinte digitale → saisie d'un code supplémentaire », LIPS-Security vérifie simultanément la voix et les mouvements des lèvres en temps réel.
Le premier niveau d'authentification de LIPS-Security, le système de reconnaissance faciale, analyse les caractéristiques structurelles du visage de l'utilisateur. Il convertit la distance entre les yeux, la longueur du nez, la forme du menton et le contour général du visage en coordonnées 3D et les compare aux données enregistrées. Au cours de ce processus, le système capture même les détails subtils autour des lèvres. Même chez une même personne, la peau se relâche et se ride avec l'âge, mais les traits autour des lèvres résistent à ces changements dans une certaine mesure, tout en conservant leur individualité. C'est pourquoi les lèvres constituent la partie du corps idéale pour l'authentification biométrique.
Le second critère biométrique est l'unicité des mouvements des lèvres. Les mouvements des lèvres varient d'une personne à l'autre lorsqu'elle prononce un même mot.
Par exemple, lorsqu'on prononce le mot « bonjour », tout le monde ne bouge pas les lèvres de la même façon. Certains ouvrent grand la bouche, d'autres la resserrent. Certains bougent rapidement, d'autres lentement. Surtout, il est quasiment impossible de simuler ces mouvements des lèvres.
Les lèvres sont composées de plusieurs points de repère (points spécifiques), notamment les commissures, le contour et bien d'autres. Le suivi à 30 images par seconde (ips) assure la compatibilité avec les appareils photo des téléphones portables, même les plus basiques. Quatre-vingt-dix images sont analysées en trois secondes, enregistrant la position précise, la forme et les micromouvements des lèvres dans chaque image. Ces caractéristiques uniques des lèvres, ainsi enregistrées, constituent une signature hautement personnalisée.
LIPS-Security vérifie simultanément les mouvements dynamiques des lèvres (facteur de mouvement) et les traits statiques du visage (facteur statique). L'examen des seuls traits statiques des lèvres peut permettre de tromper le système à l'aide de masques 3D ou de synthèse d'images avancée. LIPS-Security intègre également une technologie de détection de signaux biométriques pour déterminer si les lèvres sont réellement en mouvement, offrant ainsi une protection contre les deepfakes.
« Les deepfakes ciblent principalement les vidéos. Cependant, ce que nous vérifions, ce sont les différences subtiles dans les mouvements physiques des lèvres. De même qu'une signature ou une écriture manuscrite ne peuvent être parfaitement identiques, les mouvements des lèvres ne peuvent être recréés. »

Authentification à deux facteurs en 3 secondes
L'utilisation de LIPS-Security est étonnamment simple. Il suffit aux utilisateurs de se placer devant leur smartphone ou la borne, de regarder la caméra et de prononcer un mot précis, comme « La météo du jour » ou « Mot de passe », pendant environ trois secondes. L'authentification sans voix est possible même dans les lieux publics, les environnements bruyants ou les situations où parler est difficile.
Le système enregistre les mouvements des lèvres de l'utilisateur et reconnaît son visage. Il analyse ensuite ces deux informations en temps quasi réel pour déterminer leur authenticité. Surtout, ce processus est remarquablement rapide. Alors que les systèmes d'authentification multifacteurs classiques peuvent prendre plus de 10 secondes en raison de leurs nombreuses étapes, l'authentification LIPS-Security ne prend que 3 secondes. Cette rapidité est telle que les utilisateurs ne remarqueront pratiquement aucun inconvénient.
Objectif : 2 milliards d'utilisateurs grâce à l'authentification labiale.
TERAMIME prévoit de cibler initialement le marché B2B national, en particulier les marchés des infrastructures de bureau virtuel (VDI) et des systèmes de contrôle d'accès (ACS). Le marché des VDI devrait atteindre 50 milliards de dollars et celui des ACS 40 milliards de dollars d'ici 2030, faisant de LIPS-Security une solution idéale pour ces deux marchés, alliant sécurité et simplicité d'utilisation.
L'objectif ultime de TERAMIME est d'intégrer LIPS-Security aux smartphones en collaboration avec les opérateurs de télécommunications. Si cet objectif est atteint, plus de 2 milliards d'utilisateurs de smartphones dans le monde utiliseront quotidiennement la technologie de TERAMIME.
TERAMIME vise à atteindre la perfection technologique cette année, à entamer une collaboration avec des clients nationaux et à renforcer sa collaboration avec des entreprises internationales l'année prochaine, avec une rentabilité à grande échelle attendue à partir de 2027.
La vision ultime de TERAMIME est que la sécurité par reconnaissance labiale devienne la nouvelle norme. Une fois que l'authentification labiale sera la méthode d'authentification par défaut pour tous les appareils dans le monde, les mots de passe complexes et les systèmes d'authentification multifacteurs actuels appartiendront au passé.
TERAMIME développe également la solution LIPS-Command, un système permettant de contrôler des appareils uniquement par les mouvements des lèvres. LIPS-Command combine le suivi oculaire et la lecture labiale pour créer une interface sans voix. Ceci permet de contrôler les appareils même lorsque les mains ou la parole sont indisponibles.

Plus nous dépendons des systèmes de sécurité, plus paradoxalement notre confiance diminue. Les deepfakes rendent difficile la confiance que nous accordons à nos yeux et à nos oreilles, et l'hameçonnage vocal nous fait douter même de la voix de nos connaissances.
Dans ce contexte chaotique, les mouvements des lèvres proposés par TERAMIME ne sont pas qu'une simple technologie. Ils constituent un effort pour prouver que nous effectuons des transactions réellement sécurisées et que nous communiquons avec une personne authentique grâce à des informations biométriques infalsifiables.
À mesure que la sécurité par reconnaissance labiale s'intègre à notre quotidien, les mots de passe complexes et l'authentification multifacteurs fastidieuse disparaîtront. Qu'il s'agisse de virements bancaires, de consultations médicales ou de trajets domicile-travail, l'authentification se fera en trois secondes grâce à un simple mouvement des lèvres. Si le futur imaginé par TERAMIME devient réalité, notre vie n'en sera que plus agréable.
You must be logged in to post a comment.