OpenAIは火曜日、同社史上最も先進的な動画生成モデル「Sora 2.0」を発表し、同時にスタンドアロンのiOSアプリケーションもリリースしました。ユーザーはAI動画を生成、閲覧、共有できるだけでなく、バーチャルアバターを使って他のユーザーの作品にカメオ出演することも可能です。OpenAIは、新バージョンのSoraは物理的なリアリティ、音声と動画の同期、マルチカメラによるストーリーテリングの面で大幅に向上したと述べ、「動画生成におけるChatGPTの瞬間」と呼んでいます。
OpenAIは火曜日、最先端の動画生成モデル「Sora 2.0」を正式にリリースし、同時にAI動画作成を一般向けに提供することを目的とした新しいiOSアプリケーションをリリースしました。ユーザーはAI生成動画を作成し、友人と共有することができます。
メディアの報道によると、今回のリリースは、3年前にChatGPTがチャットボットの爆発的な普及を促したのと同様に、同社による新興技術の普及を促進するための重要な動きとみられている。
Sora 2.0は、今年初めにリリースされた研究プレビュー版から大幅にアップグレードされています。OpenAIは、新バージョンは物理的なリアリズム、オーディオとビジュアルの同期、そしてマルチカメラによるストーリーテリングにおいて大きな進歩を遂げたと述べています。
Soraアプリは現在招待制の無料アプリケーションで、同名の動画生成ソフトウェアの最新バージョンで動作します。昨年12月にリリースされた最初のバージョンと同様に、ユーザーはテキストプロンプトに基づいてショートビデオを生成できます。しかし、新バージョンではソーシャル機能が追加されています。ユーザーは他のユーザーが作成した動画を閲覧できるだけでなく、リアルなAIアバターと音声を作成し、許可を得た上で、自分や友人が作成した動画に埋め込むことができます。
メディア報道によると、ChatGPTは週7億人以上のユーザーを獲得しているにもかかわらず、OpenAIはSoraをまだ世間に知らしめていない。同社は、Meta Platforms、Runway AI、Midjourneyの親会社であるAlphabet-A (GOOGL.US)$ Alphabetをはじめとする競合他社との激しい競争に直面している。これらの企業も、短編動画を迅速に生成するAIツールを提供しており、中には最初から制作するよりも安価なものもある。
アナリストは、今回のローンチはOpenAIにとってソーシャルメディア分野への最大の一歩であり、TikTokやMeta Platforms (META.US)と並ぶ位置づけになると指摘している。サービスと直接競合する立場に立つと指摘しています。Metaが最近ローンチしたAI動画配信サービス「Vibes」も同様の試みです。業界関係者はメディアに対し、今回のローンチはOpenAIにとって新たな広告収入源となり、同時に同社の技術の認知度向上につながると指摘しています。
「ビデオ生成におけるChatGPTの瞬間」 OpenAIのエンジニア、トーマス・ディムソン氏は記者会見で、社内では当初、AIが生成する動画配信というアイデアに懐疑的な人が多かったと述べた。しかし、「カメオ機能」によって、ユーザーが友人の動画に登場できるようになり、その価値が実証された。ディムソン氏は、多くのソーシャルプラットフォームが「友人と繋がり」という概念から徐々に離れつつあるが、Soraがそれを復活させる可能性があると指摘した。
Soraのアップデート版では、AI動画生成における長年の欠陥もいくつか改善されています。OpenAIは、新しいソフトウェアは物理法則に沿った動画生成能力が向上し、特にマルチショット連続動画においてユーザーからの指示をより効果的に実行できると述べています。Soraチームの責任者であるビル・ピーブルズ氏は、「これは動画生成分野におけるChatGPTの成功例となる可能性が高いと考えています」と述べています。
ピーブルズ氏は、Soraの新バージョンでは、水中でパドルボードの上でバックフリップをする人物など、より複雑な視覚効果を生成でき、リアルな流体力学と浮力効果も備えていると付け加えた。また、ユーザーによる手作業での編集を必要とせずに、複数のシーンをシームレスにつなぎ合わせることも可能だ。さらに、新しいSoraは、バックグラウンドノイズ、セリフ、多言語吹き替えなどのサウンド効果の生成と同期もサポートしており、OpenAIがこれまで映画・テレビ業界に参入した際の成功と失敗は混在していたものの、ハリウッドにとってより魅力的なものとなっている。
プレゼンテーション中、同社はディムソンがマクドナルドのソースディスペンサーからケチャップを飲む様子を映した模擬ニュース映像を流した。別の動画では、香水の広告を模倣し、「ソラの新しい香り ― フレッシュでピュア、そして妥協のない、なりたい自分へ。」というキャッチフレーズを掲げた。
著作権をめぐる論争は続いている。 しかし、メディアは機能強化に伴い懸念が高まっていると指摘している。批評家は、これが映画業界の雇用を阻害し、判別不能なオンラインコンテンツの蔓延を悪化させる可能性があると主張している。OpenAIは、このアプリケーションでは著名人を起用した動画の作成は許可されないと強調した。ただし、著名人が自ら「カメオ出演」することは可能である。同様に、写真に基づいて動画を生成することも禁止されている。
このリリースはすでに知的財産権に関する懸念を引き起こしている。以前の報道によると、OpenAIは複数の映画・テレビ会社、タレント事務所に対し、明示的にオプトアウトしない限り、著作権で保護された素材がSoraで生成されたコンテンツに登場する可能性があると通知していた。
OpenAIは、このアプローチは同社の画像生成ツールのコンテンツポリシーに基づいていると述べています。同社は、AI作品において馴染みのある架空の世界を融合させたり参照したりすることを、ファンの表現や創造的なインタラクションの一形態と捉えています。幹部らは、ユーザーの間でAIを通して愛する物語やキャラクターと関わりたいという強い欲求が見受けられると述べ、Soraは人々が参加できる新たな方法を提供するとしています。
同時に、OpenAIは著作権と個人の肖像の境界を明確に定義しています。人気フランチャイズのキャラクターやビジュアルスタイルは(著作権者によってブロックされない限り)動画に登場できますが、人物の肖像を生成することは、本人確認を自発的に提出・完了し、「カメオ出演」として動画に登場しない限り、完全に禁止されています。OpenAIは、このポリシーの目的は、AI生成コンテンツへの登場の有無や方法に関して、個人が完全なコントロールを行えるようにすることだと述べています。
Soraアプリ内のすべての動画には透かしが入り、エクスポートされた動画にも同様に透かしが入り、視聴者がAI生成動画であることを確実に認識できるようにしています。また、動画の外部への配信を制限するため、画面録画機能も無効化されています。
SoraはまずAppleのiOSプラットフォームでリリースされ、将来的にはAndroidにも展開される予定です。Soraソフトウェアの新バージョン(Sora 2)は、sora.comウェブサイトでも公開されます。