3 月 6 日、Alibaba の Tongyi Qianwen は、数学、コーディング、および一般的な機能で飛躍的な進歩を遂げた最新の推論モデル QwQ-32B を発表しました。全体的なパフォーマンスは DeepSeek-R1 に匹敵し、自社製の大規模言語モデルに対する市場の熱意が再燃しました。
SophNet プラットフォームは期待どおりに機能し、QwQ-32B 大規模モデルを迅速にリリースしました。Sophgo が独自に開発した TPU の強力なコンピューティング機能を活用した QwQ-32B は、最大 75 トークン/秒の推論速度を実現します。これは、超高速でパフォーマンスがより安定しています。
今後も、SophNet は安定した高速推論サービスを提供するという使命を継続し、クラウド コンピューティング エクスペリエンスを継続的に最適化し、企業や開発者が世界トップクラスの AI モデルに簡単にアクセスできるようにすることで、人類のための AI コンピューティングの普遍的な採用を加速します。
プラットフォームの紹介
SophNet | クラウド コンピューティング プラットフォーム (Web サイト: sophnet.com) – Sophgo が独自に開発した TPU プロセッサの強力なコンピューティング機能を活用して、より高速で、より安定し、コスト効率の高いワンストップ モデル サービス プラットフォームの構築に取り組んでいます。
わずか数行のコードで、ユーザーは世界をリードする AI 大規模モデルにアクセスできます。シンプルな API サービスから複雑なエージェントベースのインテリジェント システムまで、アプリケーションのニーズに合わせてさまざまなワークフロー トポロジを作成できます。
現在、このプラットフォームは、DeepSeek R1 フル バージョン、QwQ-32B、DeepSeek V3、Qwen2.5 などの主流のオープンソース大規模モデルを統合し、プライベート モデル ホスティングをサポートしています。ワンクリック展開により、企業と開発者は超低コストで強力なコンピューティング リソースを活用でき、真のモデルとコンピューティング パワーの自由を実現し、すべての人にとって AI コンピューティングの民主化を加速できます。