无需保存视频即可离线阅读:MAZE CEO Kisun Song 如何处理数据。

一种视觉人工智能方法,无需存储视频即可实时分析停留、重访和移动模式。

从会展市场扩展到小型企业市场,专注于核心解决方案“现场评审”。

-SaaS转型正在进行中,将离线数据与广告、CRM和决策联系起来。

线下空间一直以来都是“空白数据”。虽然点击和滚动等信息仍然保留在网上,但顾客的座位、同行人员以及在店内停留时间等细节却大多消失不见。通常留存下来的只有监控录像。然而,一旦录像被存储,它就变成了成本、个人信息,以及扩展性的桎梏。

正因如此,富有远见的AI初创公司MAZE从一开始就将“不存储视频”作为其技术的先决条件。首席执行官宋基善用一句话概括了这一点。

只留下回忆,不要留下影像。

MAZE首席执行官宋基顺

对他而言,这不仅仅是一种“道德宣言”。要实现线下客户体验的数字化,摄像头最终是必不可少的。挑战在于,“如果我们无法停止拍摄,就必须找到平衡点,立即解读并丢弃接收到的图像。” 宋CEO正在变革的并非“能够看到更多内容的AI”,而是“只记住所需信息的数据结构”。他选择的解决方案优先考虑低功耗而非高性能优先考虑伦理而非准确性优先考虑实时性而非数据积累。

这个问题始于机场:“如果我们有离线活动数据会怎样?”

在首尔国立大学获得航空航天工程专业学位后,他继续在佐治亚理工学院攻读博士学位。他的研究重点是揭示美国民用航空网络的“基本规律”。宋的研究起点并非商店,而是机场。机场的布局为何如此?航空公司为何合并收购?枢纽机场是如何形成的?直飞航班和中转航班在哪些条件下存在差异?

最终,要解开这个复杂系统的关键在于人们的“出行”数据。然而,航空业并不愿意轻易公开数据。这需要有限的样本、大量的假设以及一系列的推断来弥补遗漏。通过这个过程,他确信:一旦离线活动数据可用,我们就能以更高的精度描述和预测世界。

这种信念甚至延伸到了生活中一些微不足道的不便。“我去理发店,发现要等一个半小时。早知道这样,我就不去了。”“如果我开车去的咖啡馆没有座位,那可不仅仅是一次经历。”

线下体验的问题始终如一:帮助你做决定的信息总是姗姗来迟。就像导航一样,如果你能“提前了解情况”,就能减少不必要的选择,但这在离线环境中很难做到。

一个看似矛盾的设计,其出发点是“人工智能无法赚钱”。

MAZE 拒绝采用大规模视频存储和学习系统并非仅仅出于成本考虑。首席执行官宋解释说:“一旦视频流存储、大规模标注以及存储/云成本成为考量因素,初创公司就很难盈利。” 因此,MAZE 没有选择积累大量视频素材以达到“100% 准确率”,而是选择仅在必要时基于最少的信息做出决策。

有两个关键点。首先,必须能够在不存储视频的情况下“重新识别人物”。MAZE解释说,他们开发了一种算法,无需训练数据,也无需进行面部识别,就能快速关联相同的个体。即使在展览等陌生人众多的环境中,该算法也能实时减少“虚假ID”,并分析交叉访问情况。
其次,整个过程必须在边缘执行。“视频不会被存储,所以如果你不立即提取出来,就会错失机会”这一限制实际上迫使产品设计更加严谨。

因此,MAZE公司选择了一种策略:尽管其基于图像的人工智能达到了80-90%的准确率,但它牺牲了剩余的10%准确率,将数据分散到更大的区域,而成本仅为原来的百分之一。这项技术的发展方向从“收集更多数据”转向了“收集更少数据并更好地利用数据”。

会展行业到小型企业主,以及“离线客户关系管理”的下一步发展

MAZE 的视觉 AI 解决方案“Live Review”以服务形式实现了这一设计。Live Review 是一项客户行为分析解决方案,无需存储监控录像,即可在离线空间中实时分析访客的停留时间、重复访问和移动模式。首席执行官宋解释说:“它不录制视频,而是解读空间内用户做出的选择。”这项服务最初应用于那些在结构上可行且能够获得用户同意的场所。例如,会展(MICE,即会议、奖励旅游和会展活动)等场所,由于拍摄和数据收集会明确告知用户,因此是 MAZE 的理想市场。宋首席执行官解释说:“我们首先在入口处获得明确同意的场所实现了这项服务的商业化。”

此后,MAZE 的业务拓展到了小型企业和餐饮行业。最近在美国内华达州里诺市进行的一项概念验证 (PoC) 分析了三周内数千名访客的实时流量。首席执行官宋解释说:“在法律允许的范围内,我们只需观察用户在摄像头可拍摄角度内的停留时间,就能解读其行为模式。”

BM 也正在从按需服务转向 SaaS 模式。这种转变超越了一次性分析或基于事件的使用,转而采用一种能够让门店持续监控和利用数据进行决策的形式。首席执行官宋解释说:“线下数据最终需要能够重复利用才能发挥作用,即使销售额只增长 1%,也能立即体现其价值。”

他设想的“线下客户关系管理”远不止简单的门店分析。宋CEO总结了线上平台的局限性,他说:“最难的是吸引用户。” 与专注于用户留存的Netflix不同,让用户打开应用程序的成本和难度都越来越高。因此,他将线下平台视为“新型广告和转化平台”。
人们在商店停留的时间、等待订单的时间以及在餐桌上的用餐时间都与个性化内容和优惠息息相关。当转化发生时,商家会获得奖励,而广告商则根据效果付费。这就是“超越推送通知的新型广告平台”这一概念的由来。

实时点评分析顾客在店内的移动轨迹和停留时间。

下一阶段是智能眼镜和人形机器人。

MAZE的下一个产品方向将面向更通用的应用。首席执行官宋先生预测,配备视觉传感器的设备将迎来爆发式增长。他认为,在智能眼镜、无人机、机器人、平板电脑和各种摄像头设备同时生成视频的环境下,“集中分析数万张图像将变得不可能”。最终,解决方案在于边缘端的超低功耗、超高速识别以及极简的数据采集。

宋先生CEO解释说,这并非局限于特定商店或行业的解决方案,而是一个可应用于任何领域的识别技术基础。他设想构建一个提供SDK或API的架构,以便根据需要访问各种设备和服务。他解释说,人形机器人和可穿戴设备要与人类互动,就需要具备“理解并记住面前的人”的能力,而MAZE开发的低功耗识别技术可以作为这一过程的基础。

从地方到全球,从有限到普遍

MAZE自2022年成立以来,已累计获得超过11亿韩元的投资,目前正在进行A轮融资前的过渡轮融资。CEO宋先生也表示,未来可能会进行“并购或专注于美国市场的扩张”。他今年的三管齐下战略也引人注目:首先,从本土化走向全球化;其次,从有限化走向普适化;第三,从按需服务转向SaaS模式。

有趣的是,他的最终愿景并非仅限于“MAZE”。他设想建立一个类似于Alphabet的长期控股公司架构。他还提到,他的下一个创业想法是“利用教科书理论实现的民用航空航天运输系统”。他的逻辑是,正如通信改变了我们的生活一样,交通运输的变革也将重塑社会的发展进程。

首席执行官宋基顺在 MAZE 办公室前摆姿势拍照。

离线数据一直是一个“空白领域”,但 MAZE 并非简单地填补这一空白。它的目标是将离线数据转化为数据库——无需存储数据,收集的数据量也更少,但用途却更广泛。

归根结底,MAZE提出的问题超越了技术性能或准确性的竞争。为了理解线下世界,它提出了这样的问题:“我们应该收集多少数据?”以及“我们应该舍弃哪些数据?”他的观点——数据本身并非收集得越多就越强大,而是只有当数据被设计用于其预期用途时,才能发挥其真正的力量——始终贯穿于MAZE的所有决策之中。

MAZE 提出的无需视频即可离线读取数据的想法,现在已成为一种选择,也是处理离线数据的新标准。