엘리스그룹, 모듈형 데이터센터로 AI 생태계 혁신

-이동형 모듈러 데이터센터(AI PMDC)로 기존 데이터센터 한계 극복

-10년간 쌓은 기술력으로 시간 단축 및 비용 절감…국내 최초 CSAP IaaS 인증

-엘리스그룹, AI 교육 플랫폼에서 시작해 AI 클라우드까지 AI 생태계 혁신

 

창립 10주년을 맞은 엘리스그룹(이하 엘리스)이 AI 교육 실습 플랫폼에서 쌓은 기술력을 바탕으로 AI 클라우드 분야에서 두각을 나타내고 있다. 특히 국내 최초로 엔비디아 B200을 탑재한 이동형 모듈러 데이터센터(PMDC, Portable Modular Data Center)를 구축하는 등 혁신적인 성과를 거두고 있다.

최신 GPU 성능을 제공하는 ‘엘리스클라우드’는 3개월 만에 구축이 가능하며, 특히 글로벌 클라우드 대비 77% 이상 비용을 절감할 수 있다. 이러한 장점으로 엘리스클라우드는 6개월 만에 이용 기관 수가 9배 증가하는 성장을 기록했다.

엘리스는 올해 3월 국내 최초로 AI PMDC의 CSAP IaaS 인증을 획득했다. 이로 인해 물리적 보안이 중요한 공공 부문 진출을 확대할 수 있게 되었다. 중학교 정보 교과 AI 디지털교과서 AI 챗봇 ‘헬피’도 엘리스의 이러한 보안 구조 위에서 운영되고 있다.

김재원 대표는 “AI가 사회적 필수재가 된 시대에 기술 안보를 위한 클라우드 국산화와 AI 교육 확산이 중요하다”고 강조했다.

서울 강남구 엘리스 사무실에서 김재원 대표를 만나 AI 생태계 구축에 필요한 AI 데이터센터와 AI 교육에 대해 이야기를 나눴다.

AI 시대, 기존 데이터센터로는 한계

AI와 데이터센터는 자동차와 도로 같은 관계다. AI가 발전함에 따라 더욱 강력하고 특화된 인프라가 필요하지만, 기존 데이터센터로는 AI 환경의 요구사항을 충족하기 어려워 AI 생태계 발전의 걸림돌이 되고 있다.

우선 전력 문제부터 해결해야 한다. 기존 데이터센터는 CPU 기반 서버들은 비교적 전력 소비가 적고 발열도 관리 가능한 수준이었기 때문에, 공냉식 냉각 시스템과 표준적인 전력 공급 설비로도 충분했다. 하지만 AI 시대에 필수가 된 GPU는 기존 서버 대비 10배에서 100배까지 많은 전력을 소비한다. 따라서 전력 공급을 위한 변전 설비부터 배전반, 케이블링까지 모든 것을 새로 구축해야 한다. 냉각 비용만으로도 전체 운영비의 30-40%를 차지할 정도로 냉각 시스템 구축이 중요한 과제다.

특히 H100과 같은 고성능 GPU는 막대한 열을 발생시킨다. 기존 데이터센터의 공냉식 시스템으로는 이를 감당하기 어렵다. 수냉식으로 전환하려 해도 기존 건물 구조로는 하중을 견디지 못하는 경우가 많다. 배관 설치를 위한 대규모 구조 변경이 필요해 사실상 신축 수준의 공사가 불가피하다.

AI 학습을 위해서는 수천 개의 GPU 간 실시간 데이터 교환이 필요하다. 이를 위해 엔비디아 인피니밴드와 같은 초고속 네트워크 기술이 필수적인데 이를 적용하기 위해서는 일반 데이터센터와는 완전히 다른 네트워크 구조로 설계해야 한다. 또한 AI 학습 데이터에 국가 기밀이나 개인정보가 포함되는 경우가 많아, 물리적 보안과 데이터 주권이 중요한 고려 사항으로 대두되고 있다.

이 모든 문제들이 복합적으로 작용하면서 한국의 AI 인프라 구축이 크게 지연되고 글로벌 AI 경쟁에서 뒤처질 수밖에 없었다. 엘리스의 모듈형 데이터센터는 바로 이런 문제들을 해결하기 위한 혁신적 대안으로 손꼽히고 있다.

이동형 모듈러 데이터센터…구축 시간 단축과 구축 및 운영 비용 절감

엘리스의 핵심 기술은 AI PMDC다. 이동형 모듈러 데이터센터로 불리는 이 기술은 기존 데이터센터의 한계를 극복한 혁신적 솔루션으로 평가받고 있다.

“기존 방식으로는 AI 특화 데이터센터를 구축하는 데 3-5년이 걸립니다. 하지만 엘리스의 모듈형 방식은 3개월 만에 구축할 수 있습니다. 컨테이너 내부에 설비를 탑재하고 여러 모듈을 유연하게 조합하는 방식이기 때문에 가능합니다.”

기존 방식으로 AI 특화 데이터센터를 구축하려면 부지 선정부터 설계, 건설, 장비 설치까지 오랜 시간이 필요하다. 여기에 복잡한 인허가 절차를 거쳐야 한다. 시간이 곧 경쟁력인 상황에서 데이터센터 구축에 많은 시간을 투자할 수 없다. 엘리스의 모듈형 방식은 미리 제작된 컨테이너에 필요한 설비를 탑재한 후 컨테이너를 원하는 위치에 이동해 설치하고 전력과 네트워크만 연결하면 즉시 운영이 가능하다. 구축해서 운영하기까지 3개월이면 충분하다.

초기 투자 부담을 크게 줄여준다. 기존 데이터센터 건설에는 토지 구입, 건물 신축, 냉각 시설 구축 등에 막대한 초기 투자가 필요하지만, 표준화된 컨테이너를 활용하면 필요에 따라 점진적 확장이 가능하다. 운영 중에도 수요 변화에 맞춰 모듈을 추가하거나 재배치할 수 있어 운영비를 최적화할 수 있다. 글로벌 클라우드와 동일한 조건에서 77% 이상 비용을 절감할 수 있다. 이런 파격적인 가격 경쟁력의 비결은 무엇일까?

“엘리스가 A to Z까지 모든 것을 자체 개발했기 때문입니다. 클라우드 소프트웨어, 동적할당 기술(사용자가 필요한 만큼의 컴퓨팅 자원을 실시간으로 할당받고, 사용이 끝나면 즉시 반환하는 기술), 클러스터링 기술까지 4년간 독자적으로 개발해 비용 최적화를 달성했어요.”

특히 클러스터링 기술이 핵심이다. 거대언어모델(LLM) 개발에는 GPU 한두 장이 아닌 수천 장을 하나처럼 연결해야 한다. 엘리스는 엔비디아의 인피니밴드 기술을 활용해 국내 최대 규모의 클러스터링 환경을 구축했다. 인피니밴드를 통해 10개, 100개, 1000개 단위로 GPU를 묶어 제공함으로써 다양한 거대 AI 프로젝트 수요까지 충족할 수 있다.

“기존 데이터센터는 일반 컴퓨터 서버 규격에 맞춰져 있어요. 하지만 AI 데이터센터는 서버 한 대당 기존 대비 10배에서 100배까지 전력이 필요합니다. 이런 고전력을 효율적으로 냉각하려면 수냉식 시스템이 필요한데, 국내 기존 데이터센터는 이런 하중을 견딜 수 없어요.”

엘리스의 PMDC는 이런 고전력, 고발열 환경에 최적화된 수냉식 냉각 시스템을 탑재했다. 기존 데이터센터의 공냉식으로는 감당할 수 없는 열을 효율적으로 처리하면서도 전력 소비를 최소화한다. 특히 PUE(전력효율지수) 1.27을 달성해 국내 데이터센터 평균 2.3 대비 약 절반 수준의 효율성을 보여준다.

모듈형의 또 다른 장점은 보안이다. 컨테이너 자체가 견고한 철제 구조물이어서 물리적 침입이 매우 어렵다. 각 컨테이너는 독립적인 물리적 공간으로, 고객별로 완전히 별도의 컨테이너를 제공하기 때문에 내부에 서버와 데이터가 완전히 격리되어 있다. 마치 금고를 여러 개 분리해 놓은 것과 같은 개념이다. 물리적 격리 공간 덕분에 민감한 데이터나 1급 비밀을 다루는 공공기관, 금융회사 등에서 요구하는 높은 보안 수준을 자연스럽게 충족한다. 이는 클라우드 보안에 대한 우려가 높은 국내 환경에서 특히 강력한 경쟁력이다. 김 대표는 “원래 모듈형 데이터센터를 구축하려는 첫 번째 이유는 보안 때문이었다”고 강조했다.

국내 최초 CSAP IaaS 인증으로 공공시장 진출의 교두보 마련

엘리스가 국내 AI PMDC 최초로 CSAP(Cloud Service Assurance Program, 클라우드서비스 보안인증) IaaS 인증을 받을 수 있었던 것도 이런 물리적 보안 구조 덕분이다. CSAP 인증은 14개 분야 116개 통제항목을 평가받아야 하는데, 물리적 보안이 핵심 평가 요소 중 하나다. CSAP IaaS 인증은 AI 특화 인프라에 대한 보안성과 신뢰성을 공식적으로 인정받았다는 의미다. 엘리스는 CSAP IaaS 획득을 계기로 공공 클라우드 영역에서 본격적으로 입지를 확대해 나갈 것으로 보인다.

“CSAP IaaS 인증은 총 14개 분야 116개 통제항목을 평가받아야 합니다. GPU 전용으로 이 인증을 받은 건 엘리스뿐이에요. 인증 덕분에 AI 디지털교과서를 비롯한 다양한 국가 사업에 참여할 수 있게 됐습니다.”

현재 중학교 정보 교과의 AI 디지털교과서에서 엘리스의 AI ‘헬피’ 챗봇도 이런 보안 구조 위에서 운영되고 있다. 학생들의 학습 데이터와 개인정보가 물리적으로 격리된 환경에서 안전하게 처리되고 있다.

폭발적 성장세, 6개월 만에 9배 증가

엘리스클라우드의 성장세가 가파르다. 지난해 11월부터 올해 5월까지 6개월 만에 이용 기관 수가 9배 이상 증가했다. 이용자 수는 서비스 초기인 2023년 6월 대비 21개월 만에 약 74배 늘었다.

“올해 이용기관 월평균 성장률이 50%를 넘고 있어요. 국내외 대학들의 AI 연구에 필수적인 GPU를 가장 저렴하고 빠르게 제공하다 보니 수요가 폭발적으로 늘고 있습니다.”

실제로 서울대, 카이스트, 고려대 등 국내 주요 대학뿐만 아니라 미국 미네소타 대학교까지 엘리스클라우드를 활용해 AI 연구를 진행하고 있다. 미네소타 대학교 박사과정 연구원은 엘리스클라우드를 이용해 세계 최고 권위의 AI 학회인 NeurIPS에 논문을 제출하기도 했다.

교육과 클라우드 간의 시너지

엘리스의 장점은 AI 교육과 AI 클라우드 간의 시너지다. ‘엘리스LXP'(Learning Experience Platform)는 학습자 중심의 개인화된 교육 경험을 제공하는 차세대 교육 플랫폼으로 엘리스LXP에서 제공하는 모든 AI 실습 환경은 엘리스클라우드를 기반으로 구축된다. 이를 통해 학습자들은 최신 GPU 환경에서 실습할 수 있으며, 교육기관은 별도의 하드웨어 투자 없이도 고품질 AI 교육을 제공할 수 있다.

공교육 혁신의 선두주자 엘리스스쿨

엘리스스쿨은 현재 중학교 정보 교과 AI 디지털교과서를 공급하고 있다. 학생들이 질문하면 자체 개발한 AI 헬피(Helpy) 챗봇이 답변하는데, 이 챗봇은 욕설 필터, 할루시네이션 억제, 교육편찬위 가이드라인 준수 등 교육 환경에 특화된 기능들을 탑재했다. “독도가 분쟁지역인가?”와 같은 질문에 외국 AI는 우리가 원하지 않는 답변을 할 수 있지만, 엘리스의 AI는 한국의 역사관과 가치관에 맞는 답변을 제공한다. 이는 교육 분야에서 AI 주권이 왜 중요한지를 보여주는 실증적 사례다.

취업 시장 변화에 대응하는 엘리스트랙

엘리스트랙은 AI 시대에 새로 생겨나는 직업들을 중심으로 커리큘럼을 구성한다. 자율주행 엔지니어, 로보틱스 전문가, AI 사업개발자, 데이터센터 운영 전문가 등 AI와 결합된 신산업 분야의 교육 과정을 제공한다. 엘리스클라우드를 활용해 최신 GPU 환경에서 AI 모델을 직접 학습시켜보고, 실제 산업 현장에서 마주칠 수 있는 문제들을 해결하는 경험을 제공한다.

기업 재직자를 위한 엘리스엔터프라이즈

엘리스엔터프라이즈는 SK, LG, 현대자동차 등 대기업부터 중소기업까지 7,100여 곳에서 활용하고 있으며, 각 기업의 업무 특성에 맞춘 맞춤형 교육을 제공한다. 예를 들어 제조업체에는 AI를 활용한 품질 관리나 예측 정비 교육을, 금융회사에는 AI 기반 리스크 관리나 고객 분석 교육을 제공하는 식이다.

“대규모 투자와 인력 양성을 위한 환경 구축 필요”

김 대표는 “클라우드는 단순한 인프라가 아닌 소프트웨어 산업으로 접근해야 한다”고 강조하며, “고부가가치 클라우드 산업을 육성하려면 소프트웨어 산업 발전이 필수적”이라고 말했다. 그러면서 클라우드에 과감한 투자가 필요하다고 덧붙였다.

“클라우드는 자본집약적 산업입니다. 미국과 중국은 정부와 투자자들이 혁신적인 AI 클라우드 스타트업에 과감하게 투자했습니다. 하지만 국내에서는 이와 같은 혁신적인 사업에 대한 도입이 쉽지 않습니다.“

김 대표는 한국 AI 생태계 발전을 위해서는 정부의 역할이 중요하다고 강조했다. 특히 혁신 기업에 대한 지원 확대가 필요하다고 봤다. “혁신 기업들이 참여해야 진정한 기술 혁신과 비용 혁신이 가능합니다.“

또한 AI 산업 발전의 핵심을 인재로 지목했다. ”AI 산업은 다양한 분야의 복합적 지원이 필요한데, 그 중 하나가 인재입니다. AI 노동환경은 제조업과 다른데, 이에 맞는 법과 제도가 필요합니다. 국내 인재들이 미국으로 가지 않도록 하는 혁신적인 환경 조성이 시급합니다.”

엘리스, AI 강국을 꿈꾸다

엘리스는 CSAP IaaS 인증을 바탕으로 교육, 의료, 제조 등 다양한 국가 산업 영역에서 AI 전환(AX)을 실현할 수 있도록 데이터센터 사업을 점차 확대해 나갈 계획이다. 궁극적으로는 국산 NPU 지원 확대와 국산 AI 반도체 기업들과의 협력을 통해 완전한 국산 AI 인프라 생태계 구축을 목표로 하고 있다.

AI 교육 분야에서도 현재 10만 명에서 500만 명까지 확대하는 것이 목표다. 중학교 정보 교과에서 시작해 초등학교, 고등학교까지 확장하고, 나아가 대학교와 평생교육 영역까지 아우르는 전 국민 AI 교육 플랫폼을 구축하겠다는 비전이다.

엘리스는 이를 위해 투자 유치도 검토하고 있다.

“AI 시대에 맞춰 우리나라가 번영했으면 좋겠어요. 그게 엘리스의 미션이고 비전입니다.”

김 대표는 우리나라가 AI 강국이 되는 것을 꿈꾸고 있다. 우리나라가 AI 강국으로 인정받을 때 엘리스가 그 중심에 있기를 바란다.

Ellis Group Innovates AI Ecosystem with Modular Data Center

-Overcoming the limitations of existing data centers with mobile modular data centers (AI PMDC)

-Shortening time and reducing costs with 10 years of accumulated technology… First CSAP IaaS certification in Korea

-Ellis Group, AI ecosystem innovation from AI education platform to AI cloud

Celebrating its 10th anniversary, Ellis Group (hereinafter referred to as Ellis) is standing out in the AI cloud field based on the technological prowess it has accumulated in its AI education practice platform. In particular, it is achieving innovative results, such as building the first portable modular data center (PMDC) equipped with NVIDIA B200 in Korea.

'Ellis Cloud', which provides the latest GPU performance, can be built in just 3 months and, in particular, can reduce costs by more than 77% compared to global clouds. With these advantages, Ellis Cloud recorded a 9-fold increase in the number of user organizations in just 6 months.

Ellis was the first in Korea to obtain CSAP IaaS certification for AI PMDC in March of this year. This has enabled it to expand its presence in the public sector, where physical security is important. The AI chatbot 'Helpi', an AI digital textbook for middle school information classes, is also operating on Ellis' security structure.

CEO Kim Jae-won emphasized, “In an era where AI has become a social necessity, it is important to localize the cloud and expand AI education for technological security.”

We met with CEO Jaewon Kim at the Ellis office in Gangnam-gu, Seoul, and talked about AI data centers and AI education necessary for building an AI ecosystem.

In the AI era, existing data centers have limitations

AI and data centers are like cars and roads. As AI develops, more powerful and specialized infrastructure is needed, but existing data centers are not able to meet the requirements of the AI environment, which is hindering the development of the AI ecosystem.

First, the power issue must be resolved. Since existing data centers have relatively low power consumption and manageable heat generation for CPU-based servers, air-cooling systems and standard power supply facilities were sufficient. However, GPUs, which have become essential in the AI era, consume 10 to 100 times more power than existing servers. Therefore, everything from power supply substations to distribution panels and cabling must be newly built. Cooling system construction is a critical task, as cooling costs alone account for 30-40% of total operating costs.

In particular, high-performance GPUs such as the H100 generate a lot of heat. It is difficult for the existing air-cooling system of the data center to handle this. Even if you try to convert to water cooling, the existing building structure often cannot withstand the load. Large-scale structural changes are required for the installation of piping, so construction at the level of new construction is inevitable.

AI learning requires real-time data exchange between thousands of GPUs. For this, ultra-fast network technology such as NVIDIA InfiniBand is essential, but to apply this, a network structure completely different from that of a general data center must be designed. In addition, since AI learning data often contains national secrets or personal information, physical security and data sovereignty are emerging as important considerations.

All of these problems combined to significantly delay the construction of Korea’s AI infrastructure and cause Korea to lag behind in the global AI competition. Ellis’ modular data center is considered an innovative alternative to solve these problems.

Mobile modular data center… Shortened construction time and reduced construction and operating costs

Ellis' core technology is AI PMDC. This technology, called the mobile modular data center, is evaluated as an innovative solution that overcomes the limitations of existing data centers.

“It takes 3-5 years to build an AI-specific data center using conventional methods. However, Ellis’ modular method can be built in just 3 months. This is possible because the equipment is installed inside a container and multiple modules can be flexibly combined.”

To build an AI-specific data center using the existing method, it takes a long time from site selection to design, construction, and equipment installation. On top of that, it has to go through a complicated permitting process. In a situation where time is competitiveness, you can't invest a lot of time in building a data center. Ellis' modular method is to load the necessary equipment into a pre-fabricated container, move the container to the desired location, install it, and connect the power and network to start operating immediately. It only takes three months to build and operate.

It greatly reduces the initial investment burden. Existing data center construction requires huge initial investments in land purchase, building construction, and cooling facility construction, but standardized containers allow for gradual expansion as needed. Modules can be added or rearranged according to changes in demand during operation, optimizing operating costs. Costs can be reduced by more than 77% under the same conditions as global clouds. What is the secret behind this groundbreaking price competitiveness?

“That’s because Ellis developed everything from A to Z in-house. We achieved cost optimization by independently developing cloud software, dynamic allocation technology (technology that allocates computing resources in real time as much as the user needs and returns them immediately when finished), and clustering technology for four years.”

In particular, clustering technology is key. Developing a large-scale language model (LLM) requires connecting thousands of GPUs, not just one or two. Ellis has built the largest clustering environment in Korea using NVIDIA’s InfiniBand technology. By bundling GPUs in units of 10, 100, and 1,000 through InfiniBand, it can meet the demands of various large-scale AI projects.

“Existing data centers are designed to meet the standards of general computer servers. However, AI data centers require 10 to 100 times more power per server than existing ones. A water cooling system is needed to efficiently cool this high power, but existing domestic data centers cannot withstand this load.”

Ellis' PMDC is equipped with a water-cooling system optimized for such high-power, high-heat environments. It efficiently handles heat that cannot be handled by existing data centers' air cooling while minimizing power consumption. In particular, it achieved a PUE (Power Usage Effectiveness Index) of 1.27, showing efficiency that is about half that of the domestic data center average of 2.3.

Another advantage of modularity is security. The container itself is a solid steel structure, making physical intrusion very difficult. Each container is an independent physical space, and since a completely separate container is provided for each customer, the servers and data inside are completely isolated. It is similar to the concept of having multiple separate safes. Thanks to the physical isolation space, it naturally meets the high level of security required by public institutions and financial companies that handle sensitive data or top secrets. This is a particularly strong competitive edge in the domestic environment where concerns about cloud security are high. CEO Kim emphasized, “The first reason for building a modular data center was security.”

Establishing a bridgehead for entering the public market with Korea's first CSAP IaaS certification

It is also thanks to this physical security structure that Ellis was able to receive the CSAP (Cloud Service Assurance Program, cloud service security certification) IaaS certification as the first domestic AI PMDC. CSAP certification requires evaluation of 116 control items in 14 fields, and physical security is one of the key evaluation factors. CSAP IaaS certification means that the security and reliability of AI-specific infrastructure have been officially recognized. With the acquisition of CSAP IaaS, Ellis is expected to expand its position in the public cloud sector in earnest.

“CSAP IaaS certification requires evaluation of 116 control items in 14 areas. Ellis is the only company to receive this certification exclusively for GPUs. Thanks to the certification, we can now participate in various national projects, including AI digital textbooks.”

Currently, Ellis' AI 'Helpi' chatbot in the AI digital textbook for middle school information classes is also operating on this security structure. Students' learning data and personal information are safely processed in a physically isolated environment.

Explosive growth, 9x increase in 6 months

Alice Cloud is growing rapidly. The number of user organizations increased more than ninefold in just six months from November last year to May this year. The number of users increased approximately 74-fold in just 21 months compared to June 2023, when the service was first launched.

“This year, the average monthly growth rate of user institutions is over 50%. As we provide GPUs, which are essential for AI research at domestic and international universities, at the lowest price and fastest, demand is increasing explosively.”

In fact, not only major domestic universities such as Seoul National University, KAIST, and Korea University, but also the University of Minnesota in the United States are conducting AI research using Alicecloud. A doctoral researcher at the University of Minnesota even used Alicecloud to submit a paper to NeurIPS, the world's most prestigious AI conference.

Synergy between education and cloud

The advantage of Ellis is the synergy between AI education and AI cloud. 'Ellis LXP' (Learning Experience Platform) is a next-generation education platform that provides learner-centered personalized education experiences, and all AI practice environments provided by Ellis LXP are built based on Ellis Cloud. This allows learners to practice in the latest GPU environment, and educational institutions can provide high-quality AI education without separate hardware investment.

' Ellis School ' , a leader in public education innovation

Ellis School currently supplies AI digital textbooks for middle school information classes. When students ask questions, the self-developed AI Helpy chatbot answers, and this chatbot is equipped with functions specialized for educational environments such as profanity filtering, hallucination suppression, and compliance with the guidelines of the Korean Educational Compilation Committee. For questions such as “Is Dokdo a disputed territory?”, foreign AI may give answers we do not want, but Ellis’ AI provides answers that fit Korea’s view of history and values. This is an empirical case that shows why AI sovereignty is important in the field of education.

' Ellistrack ' responds to changes in the job market

Ellistrack organizes its curriculum around new jobs emerging in the AI era. It provides training courses in new industries combined with AI, such as autonomous driving engineers, robotics experts, AI business developers, and data center operation experts. It provides experience in directly training AI models in the latest GPU environment using Elliscloud and solving problems that can be encountered in actual industrial sites.

' Ellis Enterprise ' for corporate employees

Ellis Enterprise is being used by over 7,100 companies, from large corporations such as SK, LG, and Hyundai Motors to small and medium-sized enterprises, and provides customized education tailored to the characteristics of each company's work. For example, it provides AI-based quality management or predictive maintenance education to manufacturers, and AI-based risk management or customer analysis education to financial companies.

“Need to create an environment for large-scale investment and human resource development”

CEO Kim emphasized that “cloud should be approached as a software industry, not as simple infrastructure,” and that “development of the software industry is essential to fostering a high value-added cloud industry.” He added that bold investment in the cloud is necessary.

“The cloud is a capital-intensive industry. The US and China have made bold investments in innovative AI cloud startups by governments and investors. However, it is not easy to introduce such innovative businesses in Korea.”

CEO Kim emphasized that the government’s role is important for the development of the Korean AI ecosystem. In particular, he saw the need for expanded support for innovative companies. “True technological innovation and cost innovation are possible only when innovative companies participate.”

He also pointed out that talent is the key to the development of the AI industry. “The AI industry requires complex support from various fields, and talent is one of them. The AI work environment is different from the manufacturing industry, so laws and systems that fit this are needed. It is urgent to create an innovative environment that prevents domestic talent from going to the United States.”

Ellis, Dreaming of an AI Powerhouse

Based on CSAP IaaS certification, Ellis plans to gradually expand its data center business to realize AI transformation (AX) in various national industrial fields such as education, healthcare, and manufacturing. Ultimately, the goal is to build a complete domestic AI infrastructure ecosystem by expanding domestic NPU support and cooperation with domestic AI semiconductor companies.

In the field of AI education, the goal is to expand from the current 100,000 people to 5 million people. The vision is to build a national AI education platform that starts with middle school information classes and expands to elementary and high schools, and further encompasses universities and lifelong education.

Ellis is also considering attracting investment for this purpose.

“I hope our country prospers in the AI era. That is Ellis’ mission and vision.”

President Kim dreams of our country becoming an AI powerhouse. He hopes that when our country is recognized as an AI powerhouse, Ellis will be at the center of it.

エリスグループ、モジュラーデータセンターでAIエコシステムを革新

– 移動型モジュラーデータセンター(AI PMDC)で既存のデータセンター限界を克服

-10年間積み重ねた技術力で時間短縮とコスト削減…国内初のCSAP IaaS認証

-エリスグループ、AI教育プラットフォームからスタートし、AIクラウドまでAIエコシステム革新

創立10周年を迎えたエリスグループ(以下エリス)がAI教育実習プラットフォームで積み上げた技術力を基にAIクラウド分野で頭角を現している。特に国内初のNVIDIA B200を搭載した移動型モジュラーデータセンター(PMDC, Portable Modular Data Center)を構築するなど革新的な成果を収めている。

最新のGPU性能を提供する「エリスクラウド」は3ヶ月で構築が可能で、特にグローバルクラウドに比べ77%以上のコストを削減することができる。この利点により、エリスクラウドは6ヶ月ぶりに利用機関数が9倍増加する成長を記録した。

エリスは今年3月に韓国で初めてAI PMDCのCSAP IaaS認証を獲得した。これにより、物理的セキュリティが重要な公共部門の進出を拡大できるようになった。中学校情報教科AIデジタル教科書AIチャットボット「ヘルピー」もエリスのこのようなセキュリティ構造の上で運営されている。

キム・ジェウォン代表は「AIが社会的必須財になった時代に技術安全保障のためのクラウド国産化とAI教育の拡散が重要だ」と強調した。

ソウル江南区エリス事務所でキム・ジェウォン代表に会ってAIエコシステム構築に必要なAIデータセンターとAI教育について話を交わした。

AI時代、既存のデータセンターでは限界

AIとデータセンターは自動車と道路のような関係だ。 AIが発展するにつれて、より強力で特化したインフラが必要だが、既存のデータセンターではAI環境の要求事項を満たすことが難しく、AIエコシステム発展の障害となっている。

まず電力問題から解決しなければならない。従来のデータセンターは、CPUベースのサーバーは比較的消費電力が少なく、発熱も管理可能なレベルであったため、空冷式冷却システムと標準的な電力供給設備で十分であった。しかし、AI時代に必須となったGPUは、従来のサーバーに比べ10倍から100倍まで多くの電力を消費する。したがって、電力供給のための変電設備から配電盤、ケーブルリングまですべてを新たに構築しなければならない。冷却コストだけでも全体運営費の30~40%を占めるほど、冷却システムの構築が重要な課題だ。

特にH100のような高性能GPUは膨大な熱を発生させます。既存のデータセンターの空冷式システムではこれを余儀なくされる。水冷式に切り替えようとしても、既存の建物構造では荷重に耐えられない場合が多い。配管設置のための大規模な構造変更が必要で、事実上伸縮水準の工事が避けられない。

AI学習のためには、何千ものGPU間のリアルタイムデータ交換が必要です。これにはNVIDIA Infinebandのような超高速ネットワーク技術が不可欠です。また、AI学習データに国家の機密や個人情報が含まれることが多く、物理的なセキュリティとデータ主権が重要な考慮事項となっている。

これらすべての問題が複合的に作用し、韓国のAIインフラ構築が大幅に遅れ、グローバルAI競争で遅れるしかなかった。エリスのモジュラーデータセンターは、まさにこの問題を解決するための革新的な代替手段として挙げられています。

モバイル型モジュラーデータセンター…

エリスの核心技術はAI PMDCだ。モバイルモジュラーデータセンターと呼ばれるこの技術は、既存のデータセンターの限界を克服した革新的なソリューションとして評価されています。

「既存の方式ではAI特化データセンターを構築するのに3~5年かかりますが、エリスのモジュール型方式は3ヶ月で構築できます。コンテナ内部に設備を搭載し、複数のモジュールを柔軟に組み合わせる方式なので可能です。」

既存の方法でAI特化データセンターを構築するには、敷地選定から設計、建設、機器設置まで長い時間が必要だ。ここに複雑な許可の手続きを経なければならない。時間がすぐに競争力のある状況では、データセンターの構築に多くの時間を投資することができない。エリスのモジュール型方式は、あらかじめ製作されたコンテナに必要な設備を搭載した後、コンテナを所望の位置に移動して設置し、電力とネットワークだけを接続すれば直ちに運営が可能だ。構築して運営するまで3ヶ月で十分だ。

初期投資負担を大きく減らす。既存のデータセンターの建設には土地購入、建物の新築、冷却施設の構築などに莫大な初期投資が必要だが、標準化されたコンテナを活用すれば必要に応じて徐々に拡張が可能だ。運用中も需要の変化に合わせてモジュールを追加または再配置することができ、運営費を最適化することができる。グローバルクラウドと同じ条件で77%以上のコストを削減できます。このような破格的な価格競争力の秘訣は何だろうか?

「エリスがA to Zまですべてを自己開発したからです。クラウドソフトウェア、動的割当技術(ユーザーが必要なだけのコンピューティングリソースをリアルタイムで割り当てられ、使用が終わればすぐに返す技術)、クラスタリング技術まで4年間独自に開発してコスト最適化を達成しました。」

特にクラスタリング技術が重要です。巨大言語モデル(LLM)の開発には、GPUの1~2枚ではなく、数千枚を一つのように接続しなければならない。エリスはNVIDIAのインフィニバンド技術を活用して国内最大規模のクラスタリング環境を構築した。インフィニバンドを通じて10個、100個、1000個単位でGPUをまとめて提供することで、多様な巨大AIプロジェクトの需要まで満たすことができる。

「既存のデータセンターは一般のコンピュータサーバー規格に合わせてありますが、AIデータセンターはサーバー1台あたりの従来比10倍から100倍まで電力が必要です。このような高電力を効率的に冷却するには水冷式システムが必要ですが、国内の既存データセンターはこのような負荷に耐えられません。」

エリスのPMDCは、このような高電力、高発熱環境に最適化された水冷式冷却システムを搭載した。既存のデータセンターの空冷式では、余裕のない熱を効率的に処理しながらも消費電力を最小化する。特にPUE(電力効率指数)1.27を達成し、国内データセンター平均2.3比約半分程度の効率性を示す。

モジュラーのもう一つの利点はセキュリティです。コンテナ自体が堅牢な鉄製構造であるため、物理的侵入は非常に困難です。各コンテナは独立した物理空間で、顧客ごとに完全に別々のコンテナを提供するため、内部にサーバーとデータが完全に分離されています。まるで金庫を複数個分離しておいたのと同じ概念だ。物理的隔離空間のおかげで、敏感なデータや1級秘密を扱う公共機関、金融会社などが求める高いセキュリティレベルを自然に満たしている。これはクラウドセキュリティに対する懸念の高い国内環境で特に強力な競争力である。キム代表は「元々モジュール型データセンターを構築しようとする最初の理由はセキュリティのためだった」と強調した。

国内初のCSAP IaaS認証で公共市場進出の橋頭梁を設ける

エリスが国内AI PMDCで初めてCSAP(Cloud Service Assurance Program、クラウドサービスセキュリティ認証)IaaS認証を受けられたのもこのような物理セキュリティ構造のおかげだ。 CSAP認証は、14の分野と116の制御項目を評価する必要があり、物理的なセキュリティが重要な評価要素の1つです。 CSAP IaaS認証は、AI特化インフラに対するセキュリティ性と信頼性が正式に認められたという意味だ。エリスはCSAP IaaS獲得を機に公共クラウド領域で本格的に立地を拡大していくものと見られる。

「CSAP IaaS認証は合計14分野116統制項目を評価されなければなりません。GPU専用でこの認証を受けたのはエリスだけです。認証のおかげでAIデジタル教科書をはじめとする多様な国家事業に参加できるようになりました。」

現在、中学校情報教科のAIデジタル教科書で、エリスのAI「ヘルピー」チャットボットもこのようなセキュリティ構造の上で運営されている。学生の学習データと個人情報が物理的に隔離された環境で安全に処理されている。

爆発的な成長傾向、6ヶ月で9倍増加

エリスクラウドの成長傾向が急である。昨年11月から今年5月まで6ヶ月ぶりに利用機関数が9倍以上増加した。利用者数はサービス初期の2023年6月比21ヶ月ぶりに約74倍増えた。

「今年の利用機関の月平均成長率が50%を超えています。国内外の大学のAI研究に不可欠なGPUを最も安くて迅速に提供しているため、需要が爆発的に増えています。」

実際にソウル大学、カイスト、高麗大学など国内主要大学だけでなく、米国ミネソタ大学までエリスクラウドを活用してAI研究を進めている。ミネソタ大学博士課程研究員はエリスクラウドを利用して世界最高権威のAI学会であるNeurIPSに論文を提出した。

教育とクラウド間の相乗効果

エリスの利点は、AI教育とAIクラウドの間の相乗効果です。 「エリスLXP」(Learning Experience Platform)は、学習者中心の個人化された教育経験を提供する次世代教育プラットフォームで、エリスLXPが提供するすべてのAI実践環境はエリスクラウドに基づいて構築される。これにより、学習者は最新のGPU環境で実践することができ、教育機関は別途のハードウェア投資なしで高品質のAI教育を提供することができる。

公教育革新のリーダーエリススクール

エリススクールは現在中学校情報教科AIデジタル教科書を供給している。学生たちが質問すると自ら開発したAIヘルピーチャットボットが答えるが、このチャットボットは、悪口フィルタ、ハルシネーション抑制、教育編纂委ガイドライン遵守など教育環境に特化した機能を搭載した。 「独島が紛争地域か?」のような質問に外国AIは私たちが望まない答えをすることができるが、エリスのAIは韓国の歴史観と価値観に合った答えを提供する。これは教育分野でAI主権がなぜ重要なのかを示す実証的な事例だ。

雇用市場の変化に対応するエリストラック

エリストラックはAI時代に新たに生み出される職業を中心にカリキュラムを構成する。自律走行エンジニア、ロボティクス専門家、AI事業開発者、データセンター運営専門家などAIと結合された新産業分野の教育過程を提供する。エリスクラウドを活用して最新のGPU環境でAIモデルを直接学習させ、実際の産業現場で遭遇する問題を解決する経験を提供する。

企業在職者のためのエリスエンタープライズ

エリスエンタープライズはSK、LG、現代自動車など大企業から中小企業まで7,100社余りで活用しており、各企業の業務特性に合わせたカスタマイズされた教育を提供する。例えばメーカーにはAIを活用した品質管理や予測整備教育を、金融会社にはAIベースのリスク管理や顧客分析教育を提供する方式だ。

「大規模投資と人材養成のための環境構築が必要」

キム代表は「クラウドは単純なインフラではなくソフトウェア産業に接近しなければならない」と強調し、「高付加価値クラウド産業を育成するにはソフトウェア産業の発展が必須」と話した。それと共にクラウドに果敢な投資が必要だと付け加えた。

「クラウドは資本集約型産業です。米国と中国は、政府と投資家が革新的なAIクラウドスタートアップに大胆に投資しました。

キム代表は韓国AI生態系発展のためには政府の役割が重要だと強調した。特にイノベーション企業への支援拡大が必要だと見た。 「革新企業が参加しなければ、真の技術革新とコスト革新が可能です。」

また、AI産業発展の核心を人材として指摘した。 「AI産業は多様な分野の複合的支援が必要ですが、その一つが人材です。AI労働環境は製造業とは異なり、これに合った法と制度が必要です。

エリス、AI強国を夢見る

エリスはCSAP IaaS認証を基に教育、医療、製造など多様な国家産業領域でAI転換(AX)を実現できるようにデータセンター事業を徐々に拡大していく計画だ。最終的には国産NPU支援の拡大と国産AI半導体企業との協力を通じて、完全な国産AIインフラエコシステム構築を目指している。

AI教育分野でも現在10万人から500万人まで拡大することが目標だ。中学校情報教科から始まり、小学校、高校まで拡張し、さらに大学と生涯教育領域まで合わせる全国民AI教育プラットフォームを構築するというビジョンだ。

エリスはこのために投資誘致も検討している。

「AI時代に合わせて我が国が繁栄してほしい。それがエリスのミッションでありビジョンです」

キム代表は韓国がAI強国になることを夢見ている。我が国がAI強国と認められた時、エリスがその中心にいることを願う。

埃利斯集团利用模块化数据中心创新人工智能生态系统

-通过移动模块化数据中心(AI PMDC)克服现有数据中心的局限性

-凭借10年积累的技术,缩短时间并降低成本…韩国首个CSAP IaaS认证

-Ellis Group,从AI教育平台到AI云的AI生态系统创新

迎来成立十周年的Ellis集团(以下简称Ellis)凭借在AI教育实践平台领域积累的技术实力,在AI云领域脱颖而出。尤其在韩国国内率先建成搭载NVIDIA B200的便携式模块化数据中心(PMDC)等,取得了诸多创新成果。

提供最新GPU性能的“Ellis Cloud”仅需3个月即可搭建完成,尤其与全球云相比,成本可降低77%以上。凭借这些优势,Ellis Cloud在短短6个月内就实现了用户机构数量增长9倍。

今年3月,Ellis在韩国率先获得AI PMDC的CSAP IaaS认证。这使其能够拓展在重视物理安全的公共领域的业务。面向中学信息课程的AI数字教科书AI聊天机器人“Helpi”也在Ellis的安全架构上运行。

金载源代表强调,“在人工智能成为社会必需品的时代,为了技术安全,实现云端本地化、扩大人工智能教育至关重要。”

我们在首尔江南区的 Ellis 办公室与首席执行官 Jaewon Kim 会面,讨论了构建 AI 生态系统所必需的 AI 数据中心和 AI 教育。

AI时代,现有数据中心存在局限性

人工智能与数据中心就像汽车与道路。随着人工智能的发展,需要更强大、更专业化的基础设施,但现有的数据中心无法满足人工智能环境的要求,阻碍了人工智能生态系统的发展。

首先,必须解决电力问题。由于现有数据中心的功耗相对较低,且基于CPU的服务器的发热量也较为可控,因此风冷系统和标准供电设施已足够。然而,在AI时代至关重要的GPU,其功耗是现有服务器的10到100倍。因此,从变电站到配电盘和布线,所有设施都必须新建。冷却系统的建设至关重要,因为仅冷却成本一项就占到总运营成本的30%到40%。

尤其是像H100这样的高性能GPU,会产生大量的热量。数据中心现有的风冷系统难以应对这种热量。即使尝试改用水冷,现有的建筑结构通常也无法承受如此大的负荷。管道的安装需要进行大规模的结构改造,因此新建工程不可避免。

AI 学习需要在数千个 GPU 之间进行实时数据交换。为此,NVIDIA InfiniBand 等超高速网络技术至关重要,但要应用该技术,必须设计与一般数据中心完全不同的网络结构。此外,由于 AI 学习数据通常包含国家机密或个人信息,因此物理安全和数据主权正成为重要的考虑因素。

所有这些问题加在一起,严重阻碍了韩国人工智能基础设施的建设,并导致韩国在全球人工智能竞争中落后。Ellis的模块化数据中心被认为是解决这些问题的创新方案。

移动模块化数据中心……缩短建设时间,降低建设和运营成本

Ellis的核心技术是AI PMDC。这项被称为移动模块化数据中心的技术被评价为克服现有数据中心局限性的创新解决方案。

“使用传统方法构建一个人工智能专用数据中心需要3到5年的时间。然而,Ellis的模块化方法只需3个月即可完成。这是因为设备安装在集装箱内,并且可以灵活组合多个模块。”

要使用现有方法构建人工智能专用数据中心,从选址到设计、施工和设备安装都需要很长时间。此外,还必须经过复杂的许可流程。在时间就是竞争力的时代,您无法在数据中心的建设上投入大量时间。Ellis 的模块化方法是将必要的设备装入预制集装箱,将集装箱运送到所需位置,进行安装,然后连接电源和网络即可立即投入运营。从建设到投入运营仅需 3 个月。

大幅降低初期投资负担。现有数据中心建设需要在土地购置、建筑施工和制冷设施建设等方面投入巨额初期投资,而标准化集装箱式数据中心则可根据需要逐步扩容。在运营过程中,可根据需求变化添加或重新排列模块,从而优化运营成本。在与全球云同等条件下,成本可降低77%以上。这种突破性的价格竞争力背后的秘诀是什么?

“这是因为Ellis从头到尾都是内部开发的。我们通过四年时间独立开发云软件、动态分配技术(根据用户需求实时分配计算资源,并在完成后立即归还的技术)和集群技术,实现了成本优化。”

其中,集群技术尤为关键。开发大规模语言模型 (LLM) 需要连接数千个 GPU,而非仅仅一两个。Ellis 利用 NVIDIA 的 InfiniBand 技术构建了韩国最大的集群环境。通过 InfiniBand 将 GPU 以 10、100 和 1,000 为单位进行捆绑,可以满足各种大型 AI 项目的需求。

现有的数据中心设计符合通用计算机服务器的标准。然而,人工智能数据中心每台服务器所需的功率是现有服务器的10到100倍。需要水冷系统来有效地冷却这种高功率,但现有的国内数据中心无法承受这种负荷。

Ellis 的 PMDC 配备了针对此类高功率、高热量环境优化的水冷系统。它能够有效处理现有数据中心风冷系统无法处理的热量,同时最大限度地降低功耗。尤其是,它的 PUE(电源使用效率指数)达到了 1.27,约为国内数据中心平均水平 2.3 的一半。

模块化的另一个优势是安全性。集装箱本身是坚固的钢结构,物理入侵非常困难。每个集装箱都是一个独立的物理空间,并且由于为每个客户提供一个完全独立的集装箱,因此内部的服务器和数据完全隔离。这类似于拥有多个独立保险箱的概念。由于物理隔离空间,它自然满足了处理敏感数据或最高机密的公共机构和金融公司所需的高安全级别。这在高度关注云安全的韩国环境下尤其具有竞争力。金代表强调:“构建模块化数据中心的首要原因是安全性。”

韩国首个CSAP IaaS认证,构建进军公开市场的桥头堡

正是得益于这一物理安全架构,Ellis 才得以作为国内首家 AI PMDC 获得 CSAP(云服务保障计划,云服务安全认证)IaaS 认证。CSAP 认证需要评估 14 个领域中的 116 个控制项目,而物理安全是关键评估因素之一。CSAP IaaS 认证意味着 AI 专用基础设施的安全性和可靠性已获得官方认可。此次收购 CSAP IaaS 认证后,Ellis 有望进一步巩固其在公共云领域的地位。

CSAP IaaS 认证需要评估 14 个领域中的 116 个控制项。Ellis 是唯一一家专门针对 GPU 获得此认证的公司。凭借这项认证,我们现在可以参与包括 AI 数字教科书在内的各种国家项目。

目前,Ellis中学信息课AI数字教科书中的AI聊天机器人“Helpi”也在该安全架构下运行。学生的学习数据和个人信息在物理隔离的环境中得到安全处理。

爆炸式增长,6 个月内增长 9 倍

Alice Cloud 正在快速发展。从去年 11 月到今年 5 月,短短六个月内,用户机构数量增长了 9 倍多。与服务首次上线的 2023 年 6 月相比,短短 21 个月内,用户数量增长了约 74 倍。

“今年,用户机构的月均增长率超过50%。由于我们以最低的价格和最快的速度提供对国内外大学人工智能研究至关重要的GPU,需求正在呈爆炸式增长。”

事实上,不仅首尔大学、韩国科学技术院、高丽大学等韩国主要大学,美国明尼苏达大学也在使用Alicecloud进行AI研究。明尼苏达大学的一位博士研究员甚至利用Alicecloud向全球最负盛名的AI会议NeurIPS提交了论文。

教育与云的协同

Ellis 的优势在于 AI 教育与 AI 云的协同作用。“Ellis LXP”(学习体验平台)是新一代教育平台,提供以学习者为中心的个性化教育体验,其提供的所有 AI 实践环境均基于 Ellis 云构建。由此,学习者可以在最新的 GPU 环境中进行练习,教育机构无需单独投资硬件即可提供高质量的 AI 教育。

埃利斯学校公共教育创新的领导者

埃利斯学校目前为中学信息课程提供人工智能数字教科书。当学生提问时,自主研发的人工智能聊天机器人“Helpy”会进行解答。该聊天机器人配备了脏话过滤、幻觉抑制以及遵守韩国教育编纂委员会的指导方针等专门针对教育环境的功能。对于“独岛是否属于争议领土?”这样的问题,外国人工智能可能会给出我们不希望的答案,但埃利斯的人工智能却能提供符合韩国历史观和价值观的答案。这是一个实证案例,展现了人工智能主权在教育领域的重要性。

Ellistrack 响应就业市场的变化

Ellistrack 的课程设置围绕 AI 时代涌现的新兴职业。它提供与 AI 相结合的新兴行业的培训课程,例如自动驾驶工程师、机器人专家、AI 业务开发人员以及数据中心运营专家。课程内容包括使用 Elliscloud 在最新的 GPU 环境中直接训练 AI 模型,以及解决实际工业现场可能遇到的问题。

面向企业员工的 Ellis Enterprise

Ellis Enterprise 已被超过 7,100 家公司采用,涵盖 SK、LG、现代汽车等大型企业以及中小型企业,并提供根据每家公司业务特点量身定制的培训。例如,它为制造商提供基于 AI 的质量管理或预测性维护培训,为金融公司提供基于 AI 的风险管理或客户分析培训。

“需要创造大规模投资和人力资源开发的环境”

金墉首席执行官强调,“云计算应该被视为一个软件产业,而不是简单的基础设施”,并且“软件产业的发展对于培育高附加值的云计算产业至关重要”。他还补充说,对云计算进行大胆的投资是必要的。

云计算是一个资本密集型行业。美国和中国的政府和投资者对创新型人工智能云计算初创企业进行了大胆投资。然而,在韩国引入这样的创新型企业并不容易。

金正恩首席执行官强调,政府在韩国人工智能生态系统发展中发挥着至关重要的作用。他尤其认为有必要加大对创新型企业的支持力度。“只有创新型企业参与,才能实现真正的技术创新和成本创新。”

他还指出,人才是人工智能产业发展的关键。“人工智能产业需要各领域的复杂支持,人才是其中之一。人工智能的工作环境与制造业不同,因此需要与之相适应的法律和制度。亟需打造一个防止国内人才流向美国的创新环境。”

埃利斯,梦想成为人工智能强国

基于CSAP IaaS认证,Ellis计划逐步扩展其数据中心业务,以实现教育、医疗、制造等国家各产业领域的AI转型(AX)。最终目标是通过扩大对国产NPU的支持以及与国产AI半导体公司的合作,构建完整的国产AI基础设施生态系统。

在人工智能教育领域,目标是从目前的10万人扩展到500万人,愿景是建成一个以中学信息化课堂为起点,向小学、高中、大学及终身教育体系延伸的全国性人工智能教育平台。

埃利斯还正在考虑为此吸引投资。

“我希望我们的国家在人工智能时代繁荣昌盛。这就是埃利斯的使命和愿景。”

金正恩总统梦想着韩国成为人工智能强国。他希望,当韩国被认可为人工智能强国时,埃利斯能够成为其中心人物。

Ellis Group innove dans son écosystème d'IA avec un centre de données modulaire

-Surmonter les limites des centres de données existants avec des centres de données modulaires mobiles (AI PMDC)

-Réduction des délais et des coûts grâce à 10 ans de technologie accumulée… Première certification CSAP IaaS en Corée

-Ellis Group, innovation de l'écosystème de l'IA, de la plateforme d'éducation à l'IA au cloud de l'IA

Célébrant son 10e anniversaire, Ellis Group (ci-après dénommé « Ellis ») se distingue dans le domaine du cloud d'IA grâce aux prouesses technologiques accumulées sur sa plateforme de formation en IA. Il obtient notamment des résultats innovants, comme la construction du premier centre de données modulaire portable (PMDC) équipé de la technologie NVIDIA B200 en Corée.

« Ellis Cloud », qui offre les performances GPU les plus récentes, peut être déployé en seulement 3 mois et, notamment, permet de réduire les coûts de plus de 77 % par rapport aux clouds mondiaux. Grâce à ces avantages, Ellis Cloud a multiplié par neuf le nombre d'organisations utilisatrices en seulement 6 mois.

Ellis a été la première entreprise coréenne à obtenir la certification CSAP IaaS pour son PMDC IA en mars dernier. Cela lui a permis d'étendre sa présence dans le secteur public, où la sécurité physique est primordiale. Le chatbot IA « Helpi », un manuel numérique IA destiné aux cours d'information au collège, est également intégré à la structure de sécurité d'Ellis.

Le PDG Kim Jae-won a souligné : « À une époque où l'IA est devenue une nécessité sociale, il est important de localiser le cloud et d'étendre l'éducation à l'IA pour la sécurité technologique. »

Nous avons rencontré le PDG Jaewon Kim au bureau d'Ellis à Gangnam-gu, Séoul, et avons parlé des centres de données d'IA et de l'éducation à l'IA nécessaire à la construction d'un écosystème d'IA.

À l’ère de l’IA, les centres de données existants ont des limites

L'IA et les centres de données sont comparables aux voitures et aux routes. Le développement de l'IA nécessite des infrastructures plus performantes et plus spécialisées, mais les centres de données existants ne sont pas en mesure de répondre aux exigences de l'environnement de l'IA, ce qui freine le développement de l'écosystème de l'IA.

Tout d'abord, il faut résoudre le problème de l'alimentation électrique. Les centres de données existants ayant une consommation électrique relativement faible et une production de chaleur maîtrisable pour les serveurs équipés de processeurs, les systèmes de refroidissement par air et les alimentations électriques standard étaient suffisants. Cependant, les GPU, devenus essentiels à l'ère de l'IA, consomment 10 à 100 fois plus d'énergie que les serveurs existants. Par conséquent, tout, des sous-stations d'alimentation aux panneaux de distribution en passant par le câblage, doit être reconstruit. La construction des systèmes de refroidissement est une tâche cruciale, car les coûts de refroidissement représentent à eux seuls 30 à 40 % des coûts d'exploitation totaux.

Les GPU hautes performances comme le H100 génèrent notamment beaucoup de chaleur. Le système de refroidissement par air existant du centre de données a du mal à gérer cette chaleur. Même en adoptant un refroidissement par eau, la structure du bâtiment existant ne peut souvent pas supporter la charge. L'installation de la tuyauterie nécessite des modifications structurelles importantes, ce qui rend inévitable la construction d'un nouveau bâtiment.

L'apprentissage de l'IA nécessite un échange de données en temps réel entre des milliers de GPU. Pour cela, une technologie réseau ultra-rapide comme NVIDIA InfiniBand est essentielle, mais sa mise en œuvre nécessite la conception d'une structure réseau totalement différente de celle d'un centre de données classique. De plus, les données d'apprentissage de l'IA contenant souvent des secrets nationaux ou des informations personnelles, la sécurité physique et la souveraineté des données deviennent des considérations importantes.

Tous ces problèmes combinés ont considérablement retardé la construction de l'infrastructure d'IA coréenne et ont laissé le pays à la traîne dans la compétition mondiale en la matière. Le centre de données modulaire d'Ellis est considéré comme une solution innovante pour résoudre ces problèmes.

Centre de données modulaire mobile… Temps de construction raccourci et coûts de construction et d'exploitation réduits

La technologie principale d'Ellis est l'IA PMDC. Cette technologie, appelée centre de données modulaire mobile, est considérée comme une solution innovante qui surmonte les limites des centres de données existants.

« Il faut de 3 à 5 ans pour construire un centre de données dédié à l'IA avec les méthodes conventionnelles. Cependant, la méthode modulaire d'Ellis permet de le construire en seulement 3 mois. Cela est rendu possible grâce à l'installation des équipements dans un conteneur et à la possibilité de combiner plusieurs modules de manière flexible. »

Construire un centre de données dédié à l'IA selon la méthode existante prend beaucoup de temps, du choix du site à la conception, en passant par la construction et l'installation des équipements. À cela s'ajoute une procédure d'autorisation complexe. Dans un contexte où le temps est un facteur clé, il est difficile d'investir beaucoup de temps dans la construction d'un centre de données. La méthode modulaire d'Ellis consiste à charger les équipements nécessaires dans un conteneur préfabriqué, à le déplacer à l'emplacement souhaité, à l'installer, puis à connecter l'électricité et le réseau pour une mise en service immédiate. Il ne faut que trois mois entre la construction et l'exploitation.

Cela réduit considérablement l'investissement initial. La construction d'un centre de données existant nécessite des investissements initiaux considérables pour l'achat du terrain, la construction du bâtiment et la mise en place d'installations de refroidissement, mais les conteneurs standardisés permettent une expansion progressive selon les besoins. Les modules peuvent être ajoutés ou réorganisés en fonction de l'évolution de la demande en cours d'exploitation, optimisant ainsi les coûts d'exploitation. Les coûts peuvent être réduits de plus de 77 % dans les mêmes conditions que les clouds mondiaux. Quel est le secret de cette compétitivité tarifaire révolutionnaire ?

« C'est parce qu'Ellis a tout développé en interne, de A à Z. Nous avons optimisé les coûts en développant indépendamment des logiciels cloud, une technologie d'allocation dynamique (qui alloue les ressources informatiques en temps réel selon les besoins de l'utilisateur et les restitue immédiatement après l'exécution) et une technologie de clustering pendant quatre ans. »

La technologie de clustering est particulièrement essentielle. Développer un modèle de langage à grande échelle (LLM) nécessite la connexion de milliers de GPU, et non d'un ou deux seulement. Ellis a créé le plus grand environnement de clustering de Corée grâce à la technologie InfiniBand de NVIDIA. En regroupant les GPU par unités de 10, 100 et 1 000 via InfiniBand, il peut répondre aux exigences de divers projets d'IA de grande envergure.

Les centres de données existants sont conçus pour répondre aux normes des serveurs informatiques classiques. Cependant, les centres de données dédiés à l'IA nécessitent 10 à 100 fois plus d'énergie par serveur que les centres existants. Un système de refroidissement par eau est nécessaire pour refroidir efficacement cette puissance élevée, mais les centres de données domestiques existants ne peuvent pas supporter une telle charge.

Le PMDC d'Ellis est équipé d'un système de refroidissement par eau optimisé pour ces environnements à forte puissance et à forte chaleur. Il gère efficacement la chaleur, impossible à gérer par le refroidissement par air des centres de données existants, tout en minimisant la consommation d'énergie. Il a notamment atteint un indice d'efficacité énergétique (PUE) de 1,27, soit une efficacité environ deux fois inférieure à la moyenne des centres de données nationaux (2,3).

Un autre avantage de la modularité est la sécurité. Le conteneur lui-même est constitué d'une structure en acier robuste, ce qui rend toute intrusion physique très difficile. Chaque conteneur constitue un espace physique indépendant, et comme un conteneur entièrement distinct est fourni à chaque client, les serveurs et les données qu'il contient sont totalement isolés. Ce concept est comparable à celui de plusieurs coffres-forts distincts. Grâce à l'espace d'isolation physique, il répond naturellement au niveau de sécurité élevé exigé par les institutions publiques et les sociétés financières qui traitent des données sensibles ou ultra-secrètes. Il s'agit d'un avantage concurrentiel particulièrement important dans un environnement national où les préoccupations en matière de sécurité du cloud sont élevées. Le PDG Kim a souligné : « La sécurité était la première raison de la construction d'un centre de données modulaire. »

Établir une tête de pont pour entrer sur le marché public avec la première certification CSAP IaaS de Corée

C'est également grâce à cette structure de sécurité physique qu'Ellis a pu obtenir la certification IaaS CSAP (Cloud Service Assurance Program, certification de sécurité des services cloud), premier PMDC national dédié à l'IA. La certification CSAP exige l'évaluation de 116 éléments de contrôle dans 14 domaines, et la sécurité physique est l'un des principaux critères d'évaluation. La certification IaaS CSAP signifie que la sécurité et la fiabilité de l'infrastructure dédiée à l'IA sont officiellement reconnues. Avec l'acquisition de CSAP IaaS, Ellis devrait renforcer considérablement sa position dans le secteur du cloud public.

La certification CSAP IaaS requiert l'évaluation de 116 éléments de contrôle dans 14 domaines. Ellis est la seule entreprise à obtenir cette certification exclusivement pour les GPU. Grâce à cette certification, nous pouvons désormais participer à divers projets nationaux, notamment aux manuels numériques d'IA.

Actuellement, le chatbot « Helpi » d'Ellis, intégré au manuel numérique IA pour les cours d'information du collège, fonctionne également sur cette structure sécurisée. Les données d'apprentissage et les informations personnelles des élèves sont traitées en toute sécurité dans un environnement physiquement isolé.

Croissance explosive, multiplication par 9 en 6 mois

Alice Cloud connaît une croissance rapide. Le nombre d'organisations utilisatrices a été multiplié par plus de neuf en seulement six mois, de novembre 2019 à mai 2020. Le nombre d'utilisateurs a été multiplié par environ 74 en seulement 21 mois, par rapport à juin 2023, date de lancement du service.

Cette année, le taux de croissance mensuel moyen des institutions utilisatrices dépasse 50 %. Comme nous fournissons des GPU, essentiels à la recherche en IA dans les universités nationales et internationales, au prix le plus bas et à la vitesse la plus rapide, la demande connaît une croissance fulgurante.

En fait, non seulement de grandes universités nationales comme l'Université nationale de Séoul, le KAIST et l'Université de Corée, mais aussi l'Université du Minnesota aux États-Unis mènent des recherches en IA avec Alicecloud. Un doctorant de l'Université du Minnesota a même utilisé Alicecloud pour soumettre un article à NeurIPS, la plus prestigieuse conférence mondiale sur l'IA.

Synergie entre l'éducation et le cloud

L'avantage d'Ellis réside dans la synergie entre l'enseignement de l'IA et le cloud de l'IA. « Ellis LXP » (Learning Experience Platform) est une plateforme éducative de nouvelle génération qui offre des expériences pédagogiques personnalisées centrées sur l'apprenant. Tous les environnements de pratique de l'IA fournis par Ellis LXP sont basés sur Ellis Cloud. Grâce à cela, les apprenants peuvent s'entraîner dans un environnement GPU de pointe, et les établissements d'enseignement peuvent dispenser un enseignement de haute qualité en IA sans investissement matériel supplémentaire.

« Ellis School » , un leader de l'innovation dans l'éducation publique

L'école Ellis fournit actuellement des manuels numériques IA pour les cours d'information du collège. Lorsque les élèves posent des questions, le chatbot Helpy, développé en interne, répond. Ce chatbot est doté de fonctionnalités spécifiques aux environnements éducatifs, telles que le filtrage des jurons, la suppression des hallucinations et le respect des directives du Comité coréen de compilation pédagogique. Pour des questions telles que « Dokdo est-il un territoire contesté ? », l'IA étrangère peut donner des réponses que nous ne souhaitons pas, mais l'IA d'Ellis fournit des réponses qui correspondent à la vision de l'histoire et des valeurs coréennes. Cet exemple empirique illustre l'importance de la souveraineté de l'IA dans le domaine de l'éducation.

« Ellistrack » répond aux changements du marché du travail

Ellistrack structure son programme autour des nouveaux métiers émergents à l'ère de l'IA. L'entreprise propose des formations dans de nouveaux secteurs d'activité liés à l'IA, tels que les ingénieurs en conduite autonome, les experts en robotique, les développeurs commerciaux en IA et les experts en exploitation de centres de données. Elle offre une expérience de formation directe de modèles d'IA dans les environnements GPU les plus récents grâce à Elliscloud et à la résolution de problèmes rencontrés sur des sites industriels réels.

« Ellis Enterprise » pour les employés d'entreprise

Ellis Enterprise est utilisé par plus de 7 100 entreprises, des grandes entreprises comme SK, LG et Hyundai Motors aux PME, et propose des formations personnalisées adaptées aux spécificités de chaque activité. Par exemple, elle propose des formations sur la gestion de la qualité ou la maintenance prédictive basées sur l'IA aux fabricants, et des formations sur la gestion des risques ou l'analyse client basées sur l'IA aux sociétés financières.

« Il faut créer un environnement propice aux investissements à grande échelle et au développement des ressources humaines »

Le PDG Kim a souligné que « le cloud doit être abordé comme une industrie du logiciel, et non comme une simple infrastructure », et que « le développement de l'industrie du logiciel est essentiel pour favoriser une industrie du cloud à forte valeur ajoutée ». Il a ajouté qu'un investissement audacieux dans le cloud est nécessaire.

Le cloud est un secteur à forte intensité de capital. Les États-Unis et la Chine ont réalisé des investissements ambitieux dans des startups innovantes du cloud IA, financés par leurs gouvernements et leurs investisseurs. Cependant, il est difficile d'implanter de telles entreprises innovantes en Corée.

Le PDG Kim a souligné l'importance du rôle du gouvernement dans le développement de l'écosystème coréen de l'IA. Il a notamment souligné la nécessité d'un soutien accru aux entreprises innovantes. « La véritable innovation technologique et l'innovation en matière de coûts ne sont possibles qu'avec la participation des entreprises innovantes. »

Il a également souligné que le talent est la clé du développement du secteur de l'IA. « Le secteur de l'IA nécessite un soutien complexe de la part de divers secteurs, et le talent en fait partie. L'environnement de travail de l'IA est différent de celui de l'industrie manufacturière ; des lois et des systèmes adaptés sont donc nécessaires. Il est urgent de créer un environnement innovant qui empêche les talents nationaux de partir aux États-Unis. »

Ellis, rêve d'une puissance de l'IA

Fort de sa certification CSAP IaaS, Ellis prévoit de développer progressivement son activité de centres de données afin de concrétiser la transformation de l'IA (AX) dans divers secteurs industriels nationaux tels que l'éducation, la santé et l'industrie manufacturière. L'objectif final est de bâtir un écosystème national complet d'infrastructures d'IA en renforçant le soutien aux NPU et la coopération avec les entreprises nationales de semi-conducteurs IA.

Dans le domaine de l'éducation à l'IA, l'objectif est de passer de 100 000 personnes actuellement à 5 millions. La vision est de créer une plateforme nationale d'éducation à l'IA, qui débuterait par des cours d'information au collège, s'étendrait aux écoles primaires et secondaires, puis engloberait les universités et la formation continue.

Ellis envisage également d’attirer des investissements à cette fin.

« J'espère que notre pays prospérera à l'ère de l'IA. Telles sont la mission et la vision d'Ellis. »

Le président Kim rêve de voir notre pays devenir un pôle d'excellence en matière d'IA. Il espère que lorsque notre pays sera reconnu comme tel, Ellis en sera le pivot.

%d bloggers like this: