SophNet クラウドコンピューティングプラットフォームが、推論速度が 75 TPS に達する QwQ-32B モデルを正…

SophNet クラウドコンピューティングプラットフォームが、推論速度が 75 TPS に達する QwQ-32B モデルを正式にリリース

March 29th, 2025

3 月 6 日、Alibaba の Tongyi Qianwen は、数学、コーディング、および一般的な機能で飛躍的な進歩を遂げた最新の推論モデル QwQ-32B を発表しました。全体的なパフォーマンスは DeepSeek-R1 に匹敵し、自社製の大規模言語モデルに対する市場の熱意が再燃しました。

SophNet プラットフォームは期待どおりに機能し、QwQ-32B 大規模モデルを迅速にリリースしました。Sophgo が独自に開発した TPU の強力なコンピューティング機能を活用した QwQ-32B は、最大 75 トークン/秒の推論速度を実現します。これは、超高速でパフォーマンスがより安定しています。

今後も、SophNet は安定した高速推論サービスを提供するという使命を継続し、クラウドコンピューティングエクスペリエンスを継続的に最適化し、企業や開発者が世界トップクラスの AI モデルに簡単にアクセスできるようにすることで、人類のための AI コンピューティングの普遍的な採用を加速します。

プラットフォームの紹介

SophNet | クラウドコンピューティングプラットフォーム (Web サイト: sophnet.com) – Sophgo が独自に開発した TPU プロセッサの強力なコンピューティング機能を活用して、より高速で、より安定し、コスト効率の高いワンストップモデルサービスプラットフォームの構築に取り組んでいます。

わずか数行のコードで、ユーザーは世界をリードする AI 大規模モデルにアクセスできます。シンプルな API サービスから複雑なエージェントベースのインテリジェントシステムまで、アプリケーションのニーズに合わせてさまざまなワークフロートポロジを作成できます。

現在、このプラットフォームは、DeepSeek R1 フルバージョン、QwQ-32B、DeepSeek V3、Qwen2.5 などの主流のオープンソース大規模モデルを統合し、プライベートモデルホスティングをサポートしています。ワンクリック展開により、企業と開発者は超低コストで強力なコンピューティングリソースを活用でき、真のモデルとコンピューティングパワーの自由を実現し、すべての人にとって AI コンピューティングの民主化を加速できます。

Subscribe to BitCap

Receive the latest updates directly to your inbox.

Mint this entry as an NFT to add it to your collection.

Verification

This entry has been permanently stored onchain and signed by its creator.

Arweave Transaction

z4a90R6pOQQU-V_…1Rh2gLa3EanpfbE

Author Address

0x4d9EBf1c94951CC…779B07417bA5cF7

Content Digest

fCBnzehJtl7PZXl…EmEfS7BXyHDvePc