-영상을 저장하지 않고도 체류·재방문·동선을 실시간 분석하는 비전 AI 접근
-핵심 솔루션 ‘라이브 리뷰’ 중심으로 MICE에서 소상공인 시장까지 확장
-오프라인 데이터를 광고·CRM·의사결정으로 연결하는 SaaS 전환 진행
오프라인 공간은 늘 ‘비어 있는 데이터’였다. 온라인은 클릭과 스크롤이 남지만, 매장에서 누가 어디에 앉았고, 누구와 함께 왔고, 얼마나 머물렀는지는 대부분 사라진다. 남는 건 대개 CCTV 영상뿐이다. 하지만 영상은 저장되는 순간 비용이 되고, 개인정보가 되며, 확장성의 족쇄가 된다.
비전 AI 스타트업 메이즈(MAZE)가 처음부터 ‘영상을 저장하지 않는다’는 제약을 기술의 전제 조건으로 삼은 이유가 여기 있다. 송기선 대표는 이를 한 문장으로 정리한다.
“기억만 남기고 영상은 남기지 않는다.”

그에게 이 선택은 ‘도덕적 선언’만이 아니다. 오프라인 고객 경험을 데이터화하려면, 결국 카메라는 필요하다. 문제는 “촬영을 막을 수 없다면, 들어온 이미지를 즉시 해석하고 버리는 방식으로 균형을 맞춰야 한다”는 데 있다. 송 대표는 오프라인 공간을 “더 많이 보는 AI”가 아니라, “필요한 만큼만 기억하는 데이터 구조”로 바꾸고 있다. 그가 택한 해법은 고성능보다 저전력, 정확도보다 윤리, 축적보다 실시간이다.
공항에서 시작된 질문, “오프라인 활동 데이터가 있다면”
그는 서울대학교에서 항공우주공학을 전공한 뒤 조지아 공과대학교에서 박사 연구를 이어갔다. 연구 주제는 미국 민간항공 네트워크의 ‘근본 법칙’을 찾는 일이었다. 송 대표의 출발점은 매장이 아니라 공항이었다. 왜 공항은 그렇게 배치되는가, 항공사는 왜 인수합병을 하는가, 허브는 어떻게 형성되는가, 직항과 경유는 어떤 조건에서 갈리는가.
그 복잡한 시스템을 풀기 위해 필요한 것은 결국 사람들의 ‘이동’ 데이터였다. 하지만 항공은 데이터를 쉽게 공개하지 않는다. 제한된 샘플과 여러 가정, 누락을 보정하는 추론의 연속. 그 과정을 거치며 그는 확신하게 됐다. 오프라인 활동 데이터가 확보되는 순간, 세상은 훨씬 더 정교하게 설명되고 예측될 수 있다.
그리고 그 확신은 사소의 생활의 불편에서도 이어졌다. “미용실에 갔는데 1시간 반을 기다려야 한다는 걸 그때 알았다. 알았으면 안 왔을 선택이다.” “차를 타고 간 카페에 자리가 없으면, 그 경험은 한 번으로 끝나지 않는다.”
오프라인의 문제는 늘 비슷했다. 선택을 돕는 정보가 늦게 온다. 내비게이션처럼 ‘가기 전에 알 수 있다면’ 불필요한 선택을 줄일 수 있는데, 오프라인은 그게 어렵다.
“AI는 돈을 못 번다”에서 시작된 역설적 설계
메이즈가 거대한 영상 저장·학습 체계를 거부한 이유는 단순한 비용 절감이 아니다. 송 대표는 “영상 스트리밍 저장, 대규모 레이블링, 스토리지·클라우드 비용이 붙는 순간 스타트업은 구조적으로 돈을 벌기 어렵다”고 말한다. 그래서 메이즈는 ‘정확도 100’을 위해 영상을 쌓아두는 길 대신, 필요한 순간에만 최소 정보로 판단하는 길을 택했다.
핵심은 두 가지다. 첫째, 영상을 저장하지 않고도 ‘그 사람을 다시 알아볼 수’ 있어야 한다. 메이즈는 안면인식을 전면에 내세우지 않으면서도, 학습 데이터 없이도 동일 주체를 빠르게 연결하는 알고리즘을 고도화해 왔다고 설명한다. 박람회처럼 처음 보는 사람이 대량으로 들어오는 환경에서도, 실시간으로 ‘허수 아이디’를 줄이고 교차 방문을 분석할 수 있다는 것이다.
둘째, 이 모든 과정이 엣지에서 돌아가야 한다. ‘영상이 저장되지 않기 때문에, 그 순간에 뽑지 못하면 기회가 없다’는 제약이 오히려 제품 설계를 날카롭게 만들었다.
그 결과 메이즈는 영상 기반 AI가 80~90% 정확도로 가더라도, 남은 10%를 포기해 100분의 1 비용으로 훨씬 더 많은 공간에 퍼지는 전략을 선택했다. 기술의 방향이 ‘더 많이 모으기’가 아니라 ‘덜 모으고 더 잘 쓰기’로 정렬된 셈이다.
MICE에서 소상공인으로, 그리고 ‘오프라인 CRM’의 다음
이 설계를 서비스로 구현한 제품이 메이즈의 비전 AI 솔루션 ‘라이브 리뷰(Live Review)’다. 라이브 리뷰는 CCTV 영상을 저장하지 않으면서도, 오프라인 공간에서 방문자의 체류 시간, 재방문 여부, 동선 패턴 등을 실시간으로 분석하는 고객 행동 분석 솔루션이다. 송 대표는 이를 두고 “영상은 남기지 않되, 공간 안에서 일어난 선택의 흐름은 읽어내는 방식”이라고 설명한다. 이 서비스가 가장 먼저 안착한 곳은 ‘동의가 구조적으로 가능한 공간’이었다. 박람회·전시(MICE)처럼 촬영과 데이터 수집에 대한 고지가 명확한 환경은 메이즈에게 최적의 시장이었다. 송 대표는 “입장 과정에서 명시적 동의를 받는 곳에서 먼저 상용화가 가능했다”고 설명한다.
이후 메이즈는 소상공인·외식업으로 확장하고 있다. 최근 미국 네바다주 리노에서 진행한 PoC에서는 3주간 수천 명 단위의 방문자 흐름을 실시간으로 분석했다. 송 대표는 “법적으로 허용되는 범위 내에서, 카메라 친화 각도에 일정 시간 머무는 정보만으로도 행동 패턴을 읽어낼 수 있다”고 설명한다.
BM도 온디맨드에서 SaaS로 옮겨가고 있다. 일회성 분석이나 이벤트성 활용이 아니라, 매장이 지속적으로 데이터를 확인하고 의사결정에 활용할 수 있는 형태로 전환하는 과정이다. 송 대표는 이를 두고 “오프라인 데이터도 결국 반복적으로 쓰일 수 있어야 비즈니스가 되고, 매출이 1%만 올라도 가치는 바로 증명된다”고 설명한다.
그가 그리는 ‘오프라인 CRM’의 끝은 단순한 매장 분석을 넘어선다. 송 대표는 온라인 플랫폼의 한계를 “들어오게 하는 게 가장 어렵다”는 말로 정리한다. 넷플릭스가 ‘체류’를 붙잡는 것과 달리, 앱을 열게 만드는 것은 점점 비싸지고 어려워졌다. 그래서 그는 오프라인을 ‘새로운 광고·전환 플랫폼’으로 본다.
사람이 매장에 머무는 시간, 주문을 기다리는 시간, 테이블 앞의 순간이 개인화된 콘텐츠·오퍼로 이어지고, 전환이 일어나면 점주는 리워드를 받고 광고주는 성과 기반으로 비용을 낸다. “푸시 알림을 넘어서는 새로운 광고 플랫폼”이라는 표현이 여기서 나온다.

다음 무대는 스마트글라스·휴머노이드
메이즈의 다음 제품 방향은 더 범용적인 영역을 향한다. 송 대표는 비전 센서가 달린 기기가 폭증하는 시대를 예상한다. 스마트글라스, 드론, 로봇, 태블릿, 각종 카메라 장치가 동시에 영상을 만들어내는 환경에서 ‘만 대의 영상을 중앙에서 분석하는 방식은 불가능해진다’는 것이다. 결국 해법은 엣지에서의 초저전력·초고속 인식, 그리고 최소 수집이다.
송 대표는 이를 특정 매장이나 산업에 한정된 솔루션이 아니라, 어디든 붙여 쓸 수 있는 인식 기술의 기반으로 설명한다. SDK나 API 형태로 제공해, 다양한 디바이스와 서비스가 필요할 때 호출해 쓰는 구조를 구상하고 있다는 것이다. 휴머노이드나 웨어러블 기기가 인간과 상호작용하기 위해서는 ‘눈앞의 사람을 이해하고 기억하는 기능’이 필요하고, 이 과정에서 메이즈가 개발해온 저전력 인식 기술이 기반 역할을 할 수 있다는 설명이다.
로컬에서 글로벌로, 제한에서 범용으로
메이즈는 2022년 설립 이후 누적 11억 원 이상 투자를 유치했고, 현재 프리A 브릿지 라운드를 진행 중이다. 송 대표는 “M&A 또는 미국 시장 중심의 확장” 가능성도 열어두고 있다. 그가 올해의 방향성을 세 가지로 정리한 것도 인상적이다. 첫째 로컬에서 글로벌로, 둘째 제한적 영역에서 범용 영역으로, 셋째 온디맨드에서 SaaS로.
흥미로운 건, 그의 최종 비전이 ‘메이즈’ 하나로 끝나지 않는다는 점이다. 그는 장기적으로 알파벳(Alphabet)처럼 지주회사 구조를 상상한다. 그리고 다음 창업 아이템으로 “교과서 이론으로 구현 가능한 항공우주 분야의 민간 운송 시스템”을 언급했다. 통신이 삶을 바꿨듯, 운송수단이 바뀌면 사회의 시간표가 재편된다는 논리다.

오프라인 데이터는 ‘비어 있는 영역’이었지만, 메이즈는 그 빈칸을 무작정 채우지 않는다. 저장하지 않는 방식으로, 덜 모으는 방식으로, 하지만 더 넓게 쓰이는 방식으로 오프라인을 데이터베이스로 바꾸려 한다.
결국 메이즈가 던지는 질문은 기술의 성능이나 정확도 경쟁에 머무르지 않고, 오프라인을 이해하기 위해 ‘우리는 어디까지 모아야 하는가’ 그리고 ‘어디부터는 버릴 수 있어야 하는가’이다. 데이터는 무조건 많이 모을수록 강해지는 것이라기 보다 목적에 맞게 설계될 때 비로소 힘을 갖는다는 그의 관점은 메이즈의 모든 선택에 일관되게 반영돼 있다.
영상 없이도 오프라인을 읽을 수 있다는 메이즈의 발상은 이제 하나의 선택지로 자리잡고 있으며, 오프라인 데이터를 다루는 하나의 새로운 기준이 되고 있다.
Reading offline without saving video: How MAZE CEO Kisun Song handles data.
A vision AI approach that analyzes stays, revisits, and movement patterns in real time without storing video.
Expanding from the MICE market to the small business market, focusing on the core solution, "Live Review."
-SaaS transition in progress, connecting offline data to advertising, CRM, and decision-making.
Offline spaces have always been "empty data." While clicks and scrolls remain online, the details of who sat where, who came with whom, and how long they stayed in a store largely disappear. What remains is usually CCTV footage. But the moment footage is stored, it becomes a cost, personal information, and a shackle to scalability.
This is why MAZE, a visionary AI startup, has made the requirement of "not storing video" a prerequisite for its technology from the beginning. CEO Kisun Song summarizes this in a single sentence.
“ Leave only memories, not images. ”

For him, this choice isn't just a "moral declaration." To digitize offline customer experiences, cameras are ultimately necessary. The challenge lies in the fact that "if we can't stop filming, we have to strike a balance by immediately interpreting and discarding the incoming images." CEO Song is transforming offline spaces not with "AI that sees more," but with "data structures that remember only what's needed." His chosen solution prioritizes low power consumption over high performance , ethics over accuracy , and real-time over accumulation.
The question that began at the airport: "What if we had offline activity data?"
After majoring in aerospace engineering at Seoul National University, he continued his doctoral research at the Georgia Institute of Technology. His research focused on uncovering the "fundamental laws" of the US civil aviation network. Song's starting point wasn't stores, but airports. Why are airports laid out the way they are? Why do airlines merge and acquire? How are hubs formed? Under what conditions do direct and transit flights differ?
Ultimately, what was needed to unravel that complex system was people's "movement" data. However, aviation doesn't readily disclose data. It requires a limited sample, numerous assumptions, and a series of inferences to correct for omissions. Through this process, he became convinced: the moment offline activity data becomes available, the world can be described and predicted with far greater precision.
And that conviction extended even to minor inconveniences in life. "I went to the hair salon and realized I'd have to wait an hour and a half. If I'd known, I wouldn't have gone." "If there's no seating at a cafe I drive to, that experience isn't just a one-time thing."
The problem with offline experiences has always been the same: information to help you make decisions arrives late. Like navigation, if you could "know before you go," you could reduce unnecessary choices, but that's difficult in offline environments.
A paradoxical design that started with “AI can’t make money”
MAZE's rejection of a massive video storage and learning system isn't simply about cost savings. CEO Song explains, "Once video streaming storage, large-scale labeling, and storage/cloud costs become a factor, it becomes structurally difficult for startups to make money." Therefore, instead of accumulating video footage to achieve "100% accuracy," MAZE opted to make decisions based on minimal information only when necessary.
There are two key points. First, it must be possible to "re-identify the person" without storing the video. MAZE explains that it has developed an algorithm that quickly connects identical individuals without training data, without focusing on facial recognition. Even in environments with a large number of unfamiliar visitors, such as exhibitions, it can reduce "dummy IDs" in real time and analyze cross-visits.
Second, this entire process must be performed at the edge. The constraint that "videos aren't stored, so if you don't pull them out at that moment, you lose the opportunity" actually forced product design to be more rigorous.
As a result, MAZE opted for a strategy where, even though its image-based AI achieved 80-90% accuracy, it sacrificed the remaining 10% to spread its data over a much larger area at one-hundredth the cost. The technology's direction shifted from "collecting more" to "collecting less and using it better."
From MICE to small business owners, and the next step of ‘offline CRM’
This design is implemented as a service in MAZE's vision AI solution, "Live Review." Live Review is a customer behavior analysis solution that analyzes visitors' dwell time, repeat visits, and movement patterns in real time in offline spaces without storing CCTV footage. CEO Song explains, "It doesn't record footage, but it interprets the flow of choices made within the space." This service first took root in spaces where consent was structurally feasible. Environments like MICE (Meetings, Incentives, and Incentives) where filming and data collection are clearly notified were the optimal market for MAZE. CEO Song explains, "We were able to commercialize it first in places where explicit consent was obtained at the entrance."
Since then, MAZE has expanded into the small business and restaurant industries. A recent PoC conducted in Reno, Nevada, USA, analyzed the real-time flow of thousands of visitors over a three-week period. CEO Song explains, "Within legally permissible limits, we can decipher behavioral patterns simply by observing a user's presence within a camera-friendly angle for a certain amount of time."
BM is also shifting from on-demand to SaaS. This shift is moving beyond one-time analysis or event-based use, to a form where stores can continuously monitor and utilize data for decision-making. CEO Song explains, "Offline data ultimately needs to be reusable to thrive, and even a 1% increase in sales immediately demonstrates its value."
The "offline CRM" he envisions goes beyond simple store analysis. CEO Song summarizes the limitations of online platforms by saying, "Getting people in is the hardest part." Unlike Netflix, which focuses on retaining customers, getting them to open an app has become increasingly expensive and difficult. Therefore, he views offline platforms as "new advertising and conversion platforms."
The time people spend in stores, the time they wait for their orders, and the moments at their tables are all connected to personalized content and offers. When conversions occur, store owners receive rewards, and advertisers pay based on performance. This is where the term "a new advertising platform that goes beyond push notifications" comes from.

The next stage is smart glasses and humanoids.
MAZE's next product direction is geared toward more general-purpose applications. CEO Song anticipates an era of explosive growth in devices equipped with vision sensors. In an environment where smart glasses, drones, robots, tablets, and various camera devices simultaneously generate video, he argues, "central analysis of tens of thousands of images will become impossible." Ultimately, the solution lies in ultra-low-power, ultra-high-speed recognition at the edge, and minimal data collection.
CEO Song explains that this isn't a solution limited to specific stores or industries, but rather a foundation for recognition technology that can be applied anywhere. He envisions a structure that provides SDK or APIs, allowing for access to various devices and services as needed. He explains that for humanoids and wearable devices to interact with humans, they need the ability to "understand and remember the person in front of them," and that the low-power recognition technology developed by MAZE can serve as a foundation for this process.
From local to global, from limited to universal
Since its founding in 2022, MAZE has attracted over 1.1 billion won in cumulative investment and is currently in the process of a pre-A bridge round. CEO Song also leaves open the possibility of "M&A or expansion focused on the US market." His three-pronged approach for this year is also striking: first, from local to global; second, from limited to universal; and third, from on-demand to SaaS.
What's interesting is that his ultimate vision doesn't end with just "MAZE." He envisions a long-term holding company structure similar to Alphabet. He also mentioned "a civilian aerospace transportation system that can be implemented using textbook theory" as his next startup idea. His logic is that, just as communications transformed our lives, changes in transportation will reshape society's timeline.

Offline data has been a "blank space," but MAZE doesn't simply fill that void. It aims to transform offline data into a database—without storing it, with less data collected, but with broader use.
Ultimately, the question MAZE poses goes beyond competing for technological performance or accuracy. To understand the offline world, it asks, "How much should we collect?" and "Where should we be willing to discard?" His perspective—that data is not inherently more powerful the more it is collected, but rather that it only becomes powerful when designed for its intended purpose—is consistently reflected in all MAZE's decisions.
MAZE's idea of being able to read offline without video is now established as an option and a new standard for handling offline data.
画像を保存せずにオフラインを読む、MAZE Kisun Song代表がデータを扱う方法
-映像を保存せずに在留・再訪問・銅線をリアルタイム分析するビジョンAIアプローチ
– コアソリューション「ライブレビュー」を中心にMICEから小商人市場まで拡張
-オフラインデータを広告・CRM・意思決定に連結するSaaS転換進行
オフライン空間はいつも「空のデータ」だった。オンラインはクリックとスクロールが残るが、店内で誰がどこに座って、誰と一緒に来て、どれだけ滞在したかはほとんど消えてしまう。残るのは通常CCTV映像だけだ。だが映像は保存される瞬間費用となり、個人情報となり、拡張性の束縛となる。
ビジョンAIスタートアップMAZE(MAZE)が最初から「映像を保存しない」という制約を技術の前提条件とした理由がここにある。 Kisun Song代表はこれを一文にまとめる。
「記憶だけ残して映像は残さない。 」

彼にとって、この選択は「道徳的宣言」だけではありません。オフラインの顧客体験をデータ化するには、最終的にカメラが必要です。問題は「撮影を防ぐことができなければ、入ってきたイメージを直ちに解釈してしまう方法でバランスをとらなければならない」ということにある。ソング代表はオフライン空間を「もっと見るAI」ではなく、「必要なだけ記憶するデータ構造」に変えている。彼が選んだ解決策は、高性能より低電力、精度よりも倫理、蓄積よりリアルタイムである。
空港で始まった質問、「オフライン活動データがあれば」
彼はソウル大学で航空宇宙工学を専攻した後、ジョージア工科大学で博士研究を続けた。研究テーマは米国民間航空ネットワークの「根本法則」を探すことだった。ソン代表の出発点は店頭ではなく空港だった。なぜ空港はそう配置されるのか、航空会社はなぜ買収合併をするのか、ハブはどのように形成されるのか、直航と経由はどのような条件で分かれるのか。
その複雑なシステムを解くために必要なのは結局、人々の「移動」データだった。しかし、航空はデータを簡単に公開しません。限られたサンプルといくつかの仮定、欠落を補正する推論の連続。その過程を経て彼は確信することになった。オフライン活動データが確保された瞬間、世界ははるかに洗練されて説明され予測され得る。
そしてその確信は些細の生活の不便にもつながった。 「美容室に行ったのに1時間半を待たなければならないということをその時知った。 「車に乗ったカフェに席がなければ、その経験は一度で終わらない。」
オフラインの問題はいつも似ていた。選択を助ける情報が遅く来る。ナビゲーションのように「行く前に知ることができれば」不要な選択を減らすことができるが、オフラインはそれが難しい。
「AIはお金を稼ぐことができない」から始まった逆説的設計
MAZEが巨大な映像保存・学習体系を拒否した理由は、単なるコスト削減ではない。ソン代表は「映像ストリーミングストレージ、大規模ラベリング、ストレージ・クラウドコストがかかる瞬間スタートアップは構造的にお金を稼ぐことが難しい」と話す。そこでMAZEは「精度100」のために映像を積み重ねる道の代わりに、必要な瞬間だけに最小情報で判断する道を選んだ。
鍵は二つある。まず、映像を保存せずに「その人を再び知ることができる」必要がある。 MAZEは、顔認識を前面に掲げずに、学習データがなくても同じ主体を素早く連結するアルゴリズムを高度化してきたと説明する。博覧会のように初めて見る人が大量に入ってくる環境でも、リアルタイムで'虚数ID'を減らして交差訪問を分析できるということだ。
第二に、これらのプロセスはすべてエッジから戻る必要があります。 「映像が保存されないため、その瞬間に抜かないと機会がない」という制約がむしろ製品設計を鋭くした。
その結果、MAZEは映像ベースのAIが80~90%の精度で行っても、残りの10%を放棄して100分の1コストではるかに多くの空間に広がる戦略を選択した。技術の方向が「より多く集める」ではなく、「あまり集めてよりよく書く」に整列されたわけだ。
MICEから小商工人へ、そして「オフラインCRM」の次
この設計をサービスで具現した製品がMAZEのビジョンAIソリューション「ライブレビュー(Live Review)」だ。ライブレビューは、CCTV映像を保存せずに、オフライン空間で訪問者の滞在時間、再訪問の可否、動線パターンなどをリアルタイムで分析する顧客行動分析ソリューションである。ソン代表はこれを置いて「映像は残さないが、空間内で起こった選択の流れは読み取る方式」と説明する。このサービスが最初に安着したのは「同意が構造的に可能な空間」だった。博覧会・展示(MICE)のように撮影とデータ収集に対する告知が明確な環境は、MAZEにとって最適な市場だった。ソン代表は「入場過程で明示的な同意を受けるところで先に商用化が可能だった」と説明する。
以後、MAZEは小商工人・外食業に拡張している。最近、米国ネバダ州リノで行われたPoCでは、3週間数千人単位の訪問者の流れをリアルタイムで分析した。ソン代表は「法的に許容される範囲内で、カメラ親和角度に一定時間留まる情報だけでも行動パターンを読み取ることができる」と説明する。
BMもオンデマンドからSaaSに移っている。ワンタイム分析やイベント性活用ではなく、店舗が継続的にデータを確認し、意思決定に活用できる形に切り替える過程だ。ソン代表はこれを置いて「オフラインデータも結局繰り返し使うことができなければビジネスになり、売上が1%だけ上がっても価値はすぐに証明される」と説明する。
彼が描く「オフラインCRM」の終わりは、単純な店舗分析を超えている。ソン代表はオンラインプラットフォームの限界を「持ち込むことが最も難しい」という言葉でまとめる。 Netflixが「滞在」をつかむのとは異なり、アプリを開くことはますます高価で困難になった。それで彼はオフラインを「新しい広告・転換プラットフォーム」とみなす。
人が店舗に滞在する時間、注文を待つ時間、テーブルの前の瞬間が個人化されたコンテンツ・オファーにつながり、転換が起きれば店主はリワードを受けて広告主は成果ベースで費用を出す。 「プッシュ通知を超えた新しい広告プラットフォーム」という表現がここに出てくる。

次のステージはスマートグラス・ヒューマノイド
MAZEの次の製品方向は、より汎用的な領域に向けられています。ソング代表は、ビジョンセンサーを搭載した機器が爆増する時代を予想する。スマートグラス、ドローン、ロボット、タブレット、各種カメラ装置が同時に映像を作り出す環境で「万台の映像を中央で分析する方式は不可能になる」ということだ。結局の解決法はエッジでの超低電力・超高速認識、そして最小収集だ。
ソン代表はこれを特定の店舗や産業に限られたソリューションではなく、どこでも貼り付けることができる認識技術の基盤として説明する。 SDKやAPI形式で提供し、さまざまなデバイスとサービスが必要なときに呼び出す構造を構想しているということだ。ヒューマノイドやウェアラブル機器が人間と相互作用するためには「目の前の人を理解して記憶する機能」が必要であり、この過程でMAZEが開発してきた低電力認識技術が基盤となることができるという説明だ。
ローカルからグローバルへ、制限から汎用へ
MAZEは2022年設立以来累積11億ウォン以上の投資を誘致しており、現在フリーAブリッジラウンドを進行中だ。ソン代表は「M&Aまたは米国市場中心の拡張」の可能性も開いている。彼が今年の方向性を3つにまとめたのも印象的だ。最初のローカルからグローバルへ、2番目の制限領域から汎用領域へ、3番目のオンデマンドからSaaSへ。
興味深いのは、彼の最終ビジョンが「MAZE」一つで終わらないという点だ。彼は長期的にアルファベットのように持株会社の構造を想像しています。そして次の創業アイテムとして「教科書理論で具現可能な航空宇宙分野の民間輸送システム」に言及した。通信が人生を変えたように、輸送手段が変われば社会の時刻表が再編されるという論理だ。

オフラインデータは「空の領域」でしたが、MAZEはその空白を無作為に埋めません。保存しない方法で、より少ない収集方法で、しかしより広く使われる方法でオフラインをデータベースに変えようとする。
結局MAZEが投げる質問は技術の性能や精度も競争にとどまらず、オフラインを理解するために「私たちはどこまで集めなければならないのか」そして「どこからは捨てられるべきか」だ。データは無条件に多く集まるほど強くなるというよりも、目的に合わせて設計されたときに初めて力を持つという彼の視点は、MAZEのすべての選択に一貫して反映されている。
映像がなくてもオフラインを読むことができるというMAZEの発想は、もう一つの選択肢に位置しており、オフラインデータを扱う一つの新しい基準となっている。
无需保存视频即可离线阅读:MAZE CEO Kisun Song 如何处理数据。
一种视觉人工智能方法,无需存储视频即可实时分析停留、重访和移动模式。
从会展市场扩展到小型企业市场,专注于核心解决方案“现场评审”。
-SaaS转型正在进行中,将离线数据与广告、CRM和决策联系起来。
线下空间一直以来都是“空白数据”。虽然点击和滚动等信息仍然保留在网上,但顾客的座位、同行人员以及在店内停留时间等细节却大多消失不见。通常留存下来的只有监控录像。然而,一旦录像被存储,它就变成了成本、个人信息,以及扩展性的桎梏。
正因如此,富有远见的AI初创公司MAZE从一开始就将“不存储视频”作为其技术的先决条件。首席执行官宋基善用一句话概括了这一点。
“只留下回忆,不要留下影像。 ”

对他而言,这不仅仅是一种“道德宣言”。要实现线下客户体验的数字化,摄像头最终是必不可少的。挑战在于,“如果我们无法停止拍摄,就必须找到平衡点,立即解读并丢弃接收到的图像。” 宋CEO正在变革的并非“能够看到更多内容的AI”,而是“只记住所需信息的数据结构”。他选择的解决方案优先考虑低功耗而非高性能,优先考虑伦理而非准确性,优先考虑实时性而非数据积累。
这个问题始于机场:“如果我们有离线活动数据会怎样?”
在首尔国立大学获得航空航天工程专业学位后,他继续在佐治亚理工学院攻读博士学位。他的研究重点是揭示美国民用航空网络的“基本规律”。宋的研究起点并非商店,而是机场。机场的布局为何如此?航空公司为何合并收购?枢纽机场是如何形成的?直飞航班和中转航班在哪些条件下存在差异?
最终,要解开这个复杂系统的关键在于人们的“出行”数据。然而,航空业并不愿意轻易公开数据。这需要有限的样本、大量的假设以及一系列的推断来弥补遗漏。通过这个过程,他确信:一旦离线活动数据可用,我们就能以更高的精度描述和预测世界。
这种信念甚至延伸到了生活中一些微不足道的不便。“我去理发店,发现要等一个半小时。早知道这样,我就不去了。”“如果我开车去的咖啡馆没有座位,那可不仅仅是一次经历。”
线下体验的问题始终如一:帮助你做决定的信息总是姗姗来迟。就像导航一样,如果你能“提前了解情况”,就能减少不必要的选择,但这在离线环境中很难做到。
一个看似矛盾的设计,其出发点是“人工智能无法赚钱”。
MAZE 拒绝采用大规模视频存储和学习系统并非仅仅出于成本考虑。首席执行官宋解释说:“一旦视频流存储、大规模标注以及存储/云成本成为考量因素,初创公司就很难盈利。” 因此,MAZE 没有选择积累大量视频素材以达到“100% 准确率”,而是选择仅在必要时基于最少的信息做出决策。
有两个关键点。首先,必须能够在不存储视频的情况下“重新识别人物”。MAZE解释说,他们开发了一种算法,无需训练数据,也无需进行面部识别,就能快速关联相同的个体。即使在展览等陌生人众多的环境中,该算法也能实时减少“虚假ID”,并分析交叉访问情况。
其次,整个过程必须在边缘执行。“视频不会被存储,所以如果你不立即提取出来,就会错失机会”这一限制实际上迫使产品设计更加严谨。
因此,MAZE公司选择了一种策略:尽管其基于图像的人工智能达到了80-90%的准确率,但它牺牲了剩余的10%准确率,将数据分散到更大的区域,而成本仅为原来的百分之一。这项技术的发展方向从“收集更多数据”转向了“收集更少数据并更好地利用数据”。
从会展行业到小型企业主,以及“离线客户关系管理”的下一步发展
MAZE 的视觉 AI 解决方案“Live Review”以服务形式实现了这一设计。Live Review 是一项客户行为分析解决方案,无需存储监控录像,即可在离线空间中实时分析访客的停留时间、重复访问和移动模式。首席执行官宋解释说:“它不录制视频,而是解读空间内用户做出的选择。”这项服务最初应用于那些在结构上可行且能够获得用户同意的场所。例如,会展(MICE,即会议、奖励旅游和会展活动)等场所,由于拍摄和数据收集会明确告知用户,因此是 MAZE 的理想市场。宋首席执行官解释说:“我们首先在入口处获得明确同意的场所实现了这项服务的商业化。”
此后,MAZE 的业务拓展到了小型企业和餐饮行业。最近在美国内华达州里诺市进行的一项概念验证 (PoC) 分析了三周内数千名访客的实时流量。首席执行官宋解释说:“在法律允许的范围内,我们只需观察用户在摄像头可拍摄角度内的停留时间,就能解读其行为模式。”
BM 也正在从按需服务转向 SaaS 模式。这种转变超越了一次性分析或基于事件的使用,转而采用一种能够让门店持续监控和利用数据进行决策的形式。首席执行官宋解释说:“线下数据最终需要能够重复利用才能发挥作用,即使销售额只增长 1%,也能立即体现其价值。”
他设想的“线下客户关系管理”远不止简单的门店分析。宋CEO总结了线上平台的局限性,他说:“最难的是吸引用户。” 与专注于用户留存的Netflix不同,让用户打开应用程序的成本和难度都越来越高。因此,他将线下平台视为“新型广告和转化平台”。
人们在商店停留的时间、等待订单的时间以及在餐桌上的用餐时间都与个性化内容和优惠息息相关。当转化发生时,商家会获得奖励,而广告商则根据效果付费。这就是“超越推送通知的新型广告平台”这一概念的由来。

下一阶段是智能眼镜和人形机器人。
MAZE的下一个产品方向将面向更通用的应用。首席执行官宋先生预测,配备视觉传感器的设备将迎来爆发式增长。他认为,在智能眼镜、无人机、机器人、平板电脑和各种摄像头设备同时生成视频的环境下,“集中分析数万张图像将变得不可能”。最终,解决方案在于边缘端的超低功耗、超高速识别以及极简的数据采集。
宋先生CEO解释说,这并非局限于特定商店或行业的解决方案,而是一个可应用于任何领域的识别技术基础。他设想构建一个提供SDK或API的架构,以便根据需要访问各种设备和服务。他解释说,人形机器人和可穿戴设备要与人类互动,就需要具备“理解并记住面前的人”的能力,而MAZE开发的低功耗识别技术可以作为这一过程的基础。
从地方到全球,从有限到普遍
MAZE自2022年成立以来,已累计获得超过11亿韩元的投资,目前正在进行A轮融资前的过渡轮融资。CEO宋先生也表示,未来可能会进行“并购或专注于美国市场的扩张”。他今年的三管齐下战略也引人注目:首先,从本土化走向全球化;其次,从有限化走向普适化;第三,从按需服务转向SaaS模式。
有趣的是,他的最终愿景并非仅限于“MAZE”。他设想建立一个类似于Alphabet的长期控股公司架构。他还提到,他的下一个创业想法是“利用教科书理论实现的民用航空航天运输系统”。他的逻辑是,正如通信改变了我们的生活一样,交通运输的变革也将重塑社会的发展进程。

离线数据一直是一个“空白领域”,但 MAZE 并非简单地填补这一空白。它的目标是将离线数据转化为数据库——无需存储数据,收集的数据量也更少,但用途却更广泛。
归根结底,MAZE提出的问题超越了技术性能或准确性的竞争。为了理解线下世界,它提出了这样的问题:“我们应该收集多少数据?”以及“我们应该舍弃哪些数据?”他的观点——数据本身并非收集得越多就越强大,而是只有当数据被设计用于其预期用途时,才能发挥其真正的力量——始终贯穿于MAZE的所有决策之中。
MAZE 提出的无需视频即可离线读取数据的想法,现在已成为一种选择,也是处理离线数据的新标准。
Lecture hors ligne sans enregistrer la vidéo : comment Kisun Song, PDG de MAZE, gère les données.
Une approche d'IA de vision qui analyse en temps réel les séjours, les revisites et les schémas de déplacement sans stocker de vidéo.
S'étendant du marché MICE au marché des petites entreprises, en se concentrant sur sa solution principale, « Live Review ».
-Transition vers le SaaS en cours, reliant les données hors ligne à la publicité, au CRM et à la prise de décision.
Les espaces physiques ont toujours été des « données vides ». Si les clics et les défilements restent en ligne, les détails concernant les clients (qui était assis où, qui les accompagnait, et combien de temps ils sont restés dans un magasin) disparaissent en grande partie. Il ne reste généralement que les images de vidéosurveillance. Mais dès lors que ces images sont stockées, elles deviennent un coût, des informations personnelles et un frein à l'évolutivité.
C’est pourquoi MAZE, une start-up visionnaire spécialisée en IA, a fait de l’absence de stockage vidéo une condition préalable à son développement dès le départ. Son PDG, Kisun Song, résume cela en une phrase.
« Ne laissez que des souvenirs, pas des images. »

Pour lui, ce choix ne relève pas d'une simple « déclaration morale ». La numérisation des expériences client hors ligne est essentielle, car les caméras restent indispensables. Le défi réside dans le fait que, « si l'on ne peut cesser de filmer, il faut trouver un équilibre en interprétant et en supprimant immédiatement les images reçues ». Le PDG, Song, transforme les espaces physiques non pas grâce à une « IA qui voit plus », mais grâce à des « structures de données qui ne conservent que l'essentiel ». Sa solution privilégie la faible consommation d'énergie à la haute performance , l'éthique à la précision et le temps réel à l'accumulation.
La question qui a surgi à l'aéroport : « Et si nous disposions de données d'activité hors ligne ? »
Après des études d'ingénierie aérospatiale à l'Université nationale de Séoul, il a poursuivi ses recherches doctorales au Georgia Institute of Technology. Ses travaux portaient sur la mise au jour des « lois fondamentales » du réseau de l'aviation civile américaine. Le point de départ de Song n'était pas les magasins, mais les aéroports. Pourquoi les aéroports sont-ils aménagés de cette façon ? Pourquoi les compagnies aériennes fusionnent-elles et font-elles des acquisitions ? Comment se forment les plateformes de correspondance ? Dans quelles conditions les vols directs et les vols avec correspondance diffèrent-ils ?
Finalement, pour décrypter ce système complexe, il fallait accéder aux données de déplacement des personnes. Or, l'aviation ne divulgue pas facilement ces données. Cela nécessite un échantillon limité, de nombreuses hypothèses et une série d'inférences pour pallier les omissions. Au fil de ce processus, il acquit la conviction suivante : dès que les données d'activité hors ligne seront disponibles, le monde pourra être décrit et prédit avec une précision bien supérieure.
Et cette conviction s'étendait même aux petits désagréments du quotidien. « Je suis allée chez le coiffeur et j'ai réalisé que je devrais attendre une heure et demie. Si j'avais su, je n'y serais pas allée. » « S'il n'y a pas de place assise dans un café où je vais en voiture, ce n'est pas un cas isolé. »
Le problème des expériences hors ligne a toujours été le même : les informations nécessaires à la prise de décision arrivent trop tard. À l’instar de la navigation, si l’on pouvait « savoir avant de partir », on pourrait réduire les choix inutiles, mais c’est difficile dans un environnement hors ligne.
Une conception paradoxale qui a débuté par le constat suivant : « L’IA ne peut pas générer de revenus ».
Le refus de MAZE d'un système massif de stockage et d'apprentissage vidéo ne se résume pas à une simple question d'économies. Son PDG, Song, explique : « Dès lors que le stockage de flux vidéo, l'étiquetage à grande échelle et les coûts de stockage/cloud entrent en ligne de compte, il devient structurellement difficile pour les startups d'être rentables. » Par conséquent, au lieu d'accumuler des séquences vidéo pour atteindre une « précision à 100 % », MAZE a choisi de prendre des décisions basées sur un minimum d'informations, uniquement lorsque cela s'avère nécessaire.
Deux points essentiels sont à retenir. Premièrement, il doit être possible de réidentifier une personne sans stocker la vidéo. MAZE explique avoir développé un algorithme qui associe rapidement des individus identiques sans données d'apprentissage, sans recourir à la reconnaissance faciale. Même dans des environnements à forte affluence, comme les expositions, il permet de réduire en temps réel les fausses identifications et d'analyser les parcours de visite.
Deuxièmement, l'ensemble du processus doit être réalisé en périphérie du réseau. La contrainte selon laquelle « les vidéos ne sont pas stockées, donc si vous ne les extrayez pas à ce moment-là, vous perdez l'opportunité » a en réalité forcé la conception du produit à être plus rigoureuse.
Par conséquent, MAZE a opté pour une stratégie où, même si son IA basée sur l'image atteignait une précision de 80 à 90 %, elle sacrifiait les 10 % restants pour répartir ses données sur une zone beaucoup plus vaste à un coût cent fois inférieur. L'orientation de la technologie est ainsi passée de « collecter plus » à « collecter moins et mieux utiliser ».
Du tourisme d'affaires (MICE) aux petites entreprises, et la prochaine étape du « CRM hors ligne »
Ce concept est intégré à la solution d'intelligence artificielle de vision de MAZE, « Live Review ». Live Review est une solution d'analyse du comportement client qui analyse en temps réel le temps passé par les visiteurs, leurs visites répétées et leurs déplacements dans les espaces physiques, sans enregistrement vidéo. Le PDG, M. Song, explique : « La solution n'enregistre pas d'images, mais interprète le parcours des visiteurs au sein de l'espace. » Ce service a d'abord été déployé dans des espaces où le consentement était techniquement possible. Les environnements tels que le MICE (Meetings, Incentives, and incentives), où la prise de vue et la collecte de données sont clairement annoncées, représentaient le marché idéal pour MAZE. M. Song précise : « Nous avons pu le commercialiser en premier lieu dans des établissements où le consentement explicite était obtenu à l'entrée. »
Depuis, MAZE s'est implantée dans le secteur des petites entreprises et de la restauration. Une preuve de concept récente, menée à Reno (Nevada, États-Unis), a permis d'analyser en temps réel le flux de milliers de visiteurs sur une période de trois semaines. Le PDG, Song, explique : « Dans le respect de la législation en vigueur, nous pouvons décrypter les comportements en observant simplement la présence d'un utilisateur dans le champ de vision de la caméra pendant un certain temps. »
BM évolue également du modèle à la demande vers le SaaS. Cette transition dépasse l'analyse ponctuelle ou l'utilisation événementielle pour permettre aux magasins de surveiller et d'exploiter en continu les données afin d'éclairer leurs décisions. Le PDG, Song, explique : « Pour prospérer, les données hors ligne doivent impérativement être réutilisables, et même une augmentation de 1 % des ventes démontre immédiatement leur valeur. »
Le « CRM hors ligne » qu'il envisage va bien au-delà de la simple analyse des points de vente. Le PDG, Song, résume les limites des plateformes en ligne en déclarant : « Attirer les clients est le plus difficile. » Contrairement à Netflix, qui mise sur la fidélisation, inciter les utilisateurs à ouvrir une application est devenu de plus en plus coûteux et complexe. C'est pourquoi il considère les plateformes hors ligne comme de « nouvelles plateformes publicitaires et de conversion ».
Le temps passé en magasin, l'attente pour leurs commandes et les moments passés à table sont tous liés à des contenus et des offres personnalisés. Lorsqu'une conversion a lieu, les commerçants reçoivent des récompenses et les annonceurs sont rémunérés en fonction des performances. C'est de là que vient l'expression « une nouvelle plateforme publicitaire qui va au-delà des simples notifications push ».

La prochaine étape sera celle des lunettes intelligentes et des humanoïdes.
La prochaine orientation produit de MAZE est axée sur des applications plus généralistes. Son PDG, Song, anticipe une croissance exponentielle des appareils équipés de capteurs de vision. Dans un contexte où lunettes intelligentes, drones, robots, tablettes et divers appareils photo génèrent simultanément des vidéos, il affirme que « l'analyse centralisée de dizaines de milliers d'images deviendra impossible ». La solution réside en définitive dans une reconnaissance ultra-rapide et à très faible consommation en périphérie du réseau, ainsi que dans une collecte de données minimale.
Le PDG Song explique qu'il ne s'agit pas d'une solution limitée à certains magasins ou secteurs d'activité, mais plutôt d'une base pour une technologie de reconnaissance applicable partout. Il envisage une structure fournissant des SDK ou des API, permettant l'accès à divers appareils et services selon les besoins. Il explique que pour interagir avec les humains, les humanoïdes et les dispositifs portables doivent être capables de « comprendre et de se souvenir de la personne qui se trouve devant eux », et que la technologie de reconnaissance basse consommation développée par MAZE peut servir de fondement à ce processus.
Du local au global, du limité à l'universel
Depuis sa création en 2022, MAZE a levé plus de 1,1 milliard de wons d'investissements cumulés et est actuellement en phase de levée de fonds de pré-série A. Son PDG, Song, n'exclut pas la possibilité d'acquisitions ou d'une expansion axée sur le marché américain. Sa stratégie en trois volets pour cette année est également marquante : d'abord, passer du local au global ; ensuite, d'une offre limitée à une offre universelle ; et enfin, du modèle à la demande au SaaS.
Ce qui est intéressant, c'est que sa vision à long terme ne se limite pas à « MAZE ». Il envisage une structure de holding à long terme similaire à Alphabet. Il a également évoqué « un système de transport aérospatial civil pouvant être mis en œuvre à l'aide de théories éprouvées » comme prochaine idée de start-up. Son raisonnement est le suivant : tout comme les communications ont transformé nos vies, les évolutions des transports redessineront le cours de l'histoire de la société.

Les données hors ligne ont longtemps constitué un « espace vide », mais MAZE ne se contente pas de combler ce manque. Son objectif est de transformer ces données en une base de données : sans les stocker, avec moins de données collectées, mais avec une utilisation plus large.
En définitive, la question que pose MAZE dépasse la simple compétition pour la performance ou la précision technologiques. Pour comprendre le monde hors ligne, l'entreprise se demande : « Quelle quantité de données devons-nous collecter ? » et « Quelles données devons-nous être prêts à supprimer ? » Son point de vue – selon lequel les données ne sont pas intrinsèquement plus puissantes à mesure qu'elles sont collectées, mais qu'elles ne le deviennent que lorsqu'elles sont exploitées à des fins spécifiques – se reflète systématiquement dans toutes les décisions de MAZE.
L'idée de MAZE, qui permet de lire hors ligne sans vidéo, est désormais considérée comme une option et une nouvelle norme pour la gestion des données hors ligne.
You must be logged in to post a comment.