SophNet クラウド コンピューティング プラットフォームが、推論速度が 75 TPS に達する QwQ-32B モデルを正式にリリース

3 月 6 日、Alibaba の Tongyi Qianwen は、数学、コーディング、および一般的な機能で飛躍的な進歩を遂げた最新の推論モデル QwQ-32B を発表しました。全体的なパフォーマンスは DeepSeek-R1 に匹敵し、自社製の大規模言語モデルに対する市場の熱意が再燃しました。

SophNet プラットフォームは期待どおりに機能し、QwQ-32B 大規模モデルを迅速にリリースしました。Sophgo が独自に開発した TPU の強力なコンピューティング機能を活用した QwQ-32B は、最大 75 トークン/秒の推論速度を実現します。これは、超高速でパフォーマンスがより安定しています。

今後も、SophNet は安定した高速推論サービスを提供するという使命を継続し、クラウド コンピューティング エクスペリエンスを継続的に最適化し、企業や開発者が世界トップクラスの AI モデルに簡単にアクセスできるようにすることで、人類のための AI コンピューティングの普遍的な採用を加速します。

プラットフォームの紹介

SophNet | クラウド コンピューティング プラットフォーム (Web サイト: sophnet.com) – Sophgo が独自に開発した TPU プロセッサの強力なコンピューティング機能を活用して、より高速で、より安定し、コスト効率の高いワンストップ モデル サービス プラットフォームの構築に取り組んでいます。

わずか数行のコードで、ユーザーは世界をリードする AI 大規模モデルにアクセスできます。シンプルな API サービスから複雑なエージェントベースのインテリジェント システムまで、アプリケーションのニーズに合わせてさまざまなワークフロー トポロジを作成できます。

現在、このプラットフォームは、DeepSeek R1 フル バージョン、QwQ-32B、DeepSeek V3、Qwen2.5 などの主流のオープンソース大規模モデルを統合し、プライベート モデル ホスティングをサポートしています。ワンクリック展開により、企業と開発者は超低コストで強力なコンピューティング リソースを活用でき、真のモデルとコンピューティング パワーの自由を実現し、すべての人にとって AI コンピューティングの民主化を加速できます。

Subscribe to BitCap
Receive the latest updates directly to your inbox.
Mint this entry as an NFT to add it to your collection.
Verification
This entry has been permanently stored onchain and signed by its creator.