최근 중국의 주요 테크 기업들과 AI 스타트업들이 설 연휴 기간을 기해 거의 동시에 최첨단 모델들을 대거 공개했다.
알리바바, 바이두, 바이트댄스, 텐센트와 Moonshot AI, MiniMax 같은 스타트업들이 며칠 사이에 주요 업데이트를 쏟아냈다.
스케일이 상당하다. 바이두 ERNIE 5.0은 2.4조 파라미터, Moonshot의 Kimi K2.5는 1.04조 파라미터로 완전 오픈소스화되었다고 한다. 상업적으로 배포된 생성형 AI 서비스는 700개가 넘고, 바이두만 AI 플랫폼 월활성 사용자 2억 명 이상을 기록했다.
가격 책정이 핵심이다. API 요금이 백만 토큰당 0.05달러에서 0.15달러 정도로 책정되어 서구 대비 약 1/20 수준이라는 보도가 나온다. 알리바바 Qwen 3.5는 희소 활성화(sparse activation)를 통해 추론 시 파라미터의 4%만 작동시켜 이런 가격을 맞추면서도 품질을 유지한다고 주장한다.
미국의 반도체 수출 규제는 성능 저하로 이어지지 않았고, 오히려 알고리즘적 혁신을 촉발했다는 해석이 있다. 엔비디아 GPU 접근이 제한되자 아키텍처 최적화와 국내 하드웨어로 학습하는 시도가 늘어났다. 예컨대 iFlytek의 Spark X2는 국내 칩만으로 학습을 마쳤다고 전해진다.
바이트댄스의 Seedance 2.0 영상 생성기는 중국의 춘완(춘절 갈라)에서 방송에 투입되었고, 할리우드 측의 IP 이슈 제기가 있었다는 소식도 있다. 데모 수준을 넘어 상용·프로덕션 규모로 보이는 사례들이 나오고 있다.
인프라 관점에서 보면 모든 모델은 결국 컴퓨트 수요를 만든다. Cambricon 등 국내 AI 칩과 CNQQ 같은 관련 홀딩스가 이 구축의 도구(picks and shovels)가 될 가능성이 있다. DeepSeek V4는 3월 초 출시 예상이며, 소문대로 트릴리언급 파라미터급 멀티모달이면 국내 칩 수급 압박을 더할 수 있다.
내 관점은 단순하다: 모델 공개 자체보다 가격·성능의 실사용 검증과 국내 칩·인프라에 대한 실수요 증발 여부를 주시해야 한다.
🧐 배경 설명 및 요약
왜 이 글이 나왔나: 글쓴이는 최근 중국의 대형 기업들과 스타트업들이 짧은 기간에 여러 최첨단 AI 모델을 공개한 사실이 시장에서 충분히 반영되지 않는다고 보고 투자자들에게 주목을 촉구하려는 의도로 이 글을 올렸습니다. 특히 '가격 경쟁력'과 '국내 컴퓨트(칩·서버) 수요'가 향후 수혜주를 가릴 핵심 변수라는 점을 강조합니다.
작성자가 실제로 묻고 걱정하는 것은 무엇인가: 작성자는 이 공개들이 단순한 홍보성 발표인지, 아니면 실제로 비용·성능 측면에서 서구 경쟁사들을 추격하거나 압박할 수준인지 알고 싶어 합니다. 또한 이런 변화가 반도체·서버·클라우드 관련 기업들의 실수요로 연결되어 투자 기회를 만들지 여부를 궁금해합니다.
어려운 개념들 간단 정리:
- 파라미터(parameter): 모델의 '규모'를 나타내는 숫자입니다. 숫자가 크다고 무조건 더 좋은 것은 아니며, 효율적 아키텍처나 데이터, 튜닝도 중요합니다.
- 토큰(token)과 요금: 텍스트 처리 단위인 '토큰'당 과금 모델이 많습니다. 백만 토큰당 요금이 낮으면 단기적으로 API 사용 비용이 줄어들 수 있습니다.
- 희소 활성화(sparse activation): 추론 시 전체 파라미터 중 일부만 활성화해 연산 비용을 줄이는 기법입니다. 이론상 비용 절감과 품질 간 트레이드오프가 있습니다.
- 국내 컴퓨트: 모델 학습·추론에 필요한 GPU/ASIC 같은 하드웨어를 국내 공급으로 해결하면 수입 규제 리스크를 줄일 수 있지만, 성능·생태계 측면의 검증이 필요합니다.
요약하면: 발표된 수치와 가격은 흥미롭지만, 실제 성능 검증과 상용화 사례(생산 환경에서의 안정성, 기업 도입 사례 등)를 확인해야 투자 판단이 가능합니다. 당장 주시할 포인트는 모델의 실사용 성능, 가격 경쟁력의 지속성, 그리고 국내 AI 칩·서버 인프라에 대한 실수요입니다.
댓글 (0)
로그인하고 댓글을 작성하세요.
아직 댓글이 없습니다.