
【台北、2026年2月24日】
生成AI、リアルタイム推論、高性能計算(HPC)応用の急速な拡大に伴い、企業におけるGPU計算力需要は継続的に増加している。一方で、実運用の現場では高価なGPUリソースの利用率が十分に高まらず、投資効果を最大化できないという課題が長年指摘されてきた。
AIインフラソフトウェアのリーディングカンパニーであるINFINITIXは本日、同社のAI-Stack CTAs(Core Type Aware Scheduler)技術により、GPUコアのミスマッチに起因する計算力の遊休問題を効果的に解決できると発表した。また、産業用コンピュータおよびエッジコンピューティング大手のAdvantech社と連携し、高性能かつ高い安定性を兼ね備えたエンタープライズおよびエッジ向けAIインフラソリューションを共同で提供する。
INFINITIX AI-Stack CTAsがGPUの実効性能を倍増
現在のGPUアーキテクチャは、従来型計算を担うCUDA Coresと、AI行列演算向けのTensor Coresを同時に搭載している。しかし、多くの企業環境では異なるタイプのワークロードが同一GPUを時間差で利用するため、一部のコアが長時間遊休状態となり、GPU全体の利用率は実質的に約40%程度にとどまるケースも少なくない。
AI-Stack CTAs(Core Type Aware Scheduler)は、業界で初めてソフトウェア層でGPUコア種類を識別・制御できるインテリジェントなスケジューリング仕組みである。Kubernetesネイティブ統合とランタイムインターセプト技術を活用することで、CUDA集約型ワークロードとTensor集約型ワークロードを同一GPU上で並列実行可能とし、アプリケーションを改修することなく GPU利用率を80%以上へと引き上げる。これにより、実質的に約2倍の計算力効果を引き出すことが可能になる。
AI-StackはINFINITIXが提供する企業向けAIインフラ管理プラットフォームであり、CTAsによるコア制御に加え、GPUリソース管理、マルチテナント統制、モデル学習および推論デプロイ機能を含める。企業は計算リソース資産をプラットフォーム化して管理し、AIを実験段階からスケール展開へと移行させることができる。
Advantechと連携し、ソフト・ハード統合でAI計算力価値を再定義
GPU利用率が大幅に向上した後、次に重要となるのはシステムの安定性と信頼性である。Advantechは厳格な産業グレード検証を経たGPUサーバープラットフォームを提供しており、エッジ用途向けのSKY-602E3タワー型GPU サーバー もその一例である。GPUが長時間高負荷で稼働する環境下でも安定した性能を維持し、ミッションクリティカルな24時間365日の運用を支える。GPU利用率が80%を超える状態が継続する場合、真の課題はむしろそこから始まる。解放された計算力を実際の産業現場で安定的に稼働させるため、INFINITIXとAdvantechは戦略的提携を深化させ、AI-Stack CTAsをAdvantechの産業向けエッジおよびデータセンターサーバー製品へ統合した。特にSKY-602E3は、高負荷Edge AIアプリケーションに適した基盤として位置付けられている。
SKY-602E3は複数GPUの拡張性と強化された冷却設計を備え、厳格な産業規格試験をクリアしている。GPUが長時間フル稼働してもサーマルスロットリングや予期せぬ停止を回避でき、通信、製造、医療など「停止が許されない」分野のニーズに応える。AI-StackとAdvantechのサーバー製品ラインを統合することで、企業はデータセンターおよびエッジの特性に応じた高効率かつ高信頼なAIインフラを柔軟に展開できる。
INFINITIXのCBO、Allen Chen氏は次のように述べている。「AI-Stack CTAsの本質的な価値は、GPU内のCUDAコアとTensorコアをそれぞれ最大限に活用し、同時に動作させることで計算力利用効率を本質的に高める点にあります。Advantechの産業グレードハードウェアが持つ安定性と耐久性と組み合わせることで、企業は性能と信頼性の最適なバランスを実現できます。これによりAI導入のハードルを下げ、スマートアプリケーションの実装を加速させます。」
INFINITIX × Phison 次世代AI基盤の高性能アーキテクチャを共同構築
INFINITIXのAI PaaS製品「AI-Stack」がNVIDIA GPUの最適な計算効率を提供