Google IO 2024のハイライト: 新たなAI技術とそのインパクト

 今回はGoogleの生成AIに関する最新アップデートについて詳しく解説します。

 特に注目すべき点をまとめましたので、ぜひ最後までご覧ください。

Google Gemini 1.5 Proのトークン数が2倍に

 Google IO 2024では、Google Gemini 1.5 Proのトークン数が100万から200万に増加したことが発表されました。

 これは、OpenAIのGPT-4の20万トークンと比較しても圧倒的な量です。

 この増加により、長い動画や複雑なデータの解析能力が大幅に向上すると期待されています。

 動画解析能力が特に強化され、スマートフォンやパソコンで撮影された映像を詳細に解析する機能が追加されました。

 例えば、スマートフォンで撮影した動画をGoogle Gemini 1.5 Proに投入すると、映像の内容や登場人物の動作を詳細に解析し、テキスト化することが可能です。

 さらに、長文の本や論文、データ分析にも対応できるようになり、Google Gemini 1.5 Proは多様な情報を処理する強力なツールとして進化しました。

Project Astra: ビジョン機能の進化

 次に注目すべきは、「Project Astra」です。

 この新機能では、スマートフォンで撮影したビデオに対して指で矢印や丸を描きながら質問することができ、より詳細な情報を得ることが可能になります。

 これは、OpenAIの発表したビデオを撮影しながらAIと対話する機能に似ていますが、さらに直感的に操作できる点が特徴です。

 例えば、スマートフォンでプログラミングのソースコードを撮影し、そのコードについてのレビューを受けることができます。

 また、ホワイトボードに書かれた内容をリアルタイムでレビューすることも可能です。

 これにより、ARグラスを装着しながらAIアシスタントと視覚的に対話する未来が現実のものとなりつつあります。

Veo: テキストから動画を生成するAI

 個人的に最も楽しみにしているのが、動画生成AI「Veo」です。

 テキストを入力すると、その内容に基づいた動画を生成することができます。

 例えば、「アルパカがサングラスをかけているシーン」と入力すると、実際にアルパカがサングラスをかけたリアルな動画が生成されます。

 このVeoは、最大1分間の動画を生成することができ、Googleの公式サイトから順番待ちリストに登録することで利用できるようになります。

 現時点ではまだ利用できませんが、今後の展開に期待が高まります。

画像生成AIの進化: Imagic

 Google IO 2024では、画像生成AIのクオリティも大幅に向上したことが発表されました。

 特に、狼の画像やアニメ風の画像など、非常にリアルで高品質な画像を生成することが可能です。

 これは、GoogleのImagine2モデルを使用しており、近日中にバージョン3がリリースされる予定です。

 ver3ではさらにクオリティが向上し、よりリアルな画像生成が期待されます。

Google SGEがAIオーバービューに改名

 以前から話題になっていたGoogle検索にAIが組み込まれる仕組み「SGE(Search Generative Engine)」が、「AI overview」に改名されました。

 この名前の変更により、Google検索の中でAIを使った機能がより分かりやすくなります。

Google PhotosにGemini搭載

 Google PhotosにもGeminiが搭載され、画像検索がさらに進化します。

 例えば、「なんちゃらって書いてあるパソコンの画像を見つけて」といった自然言語での検索が可能になります。

 これにより、膨大な写真の中から目的の画像を瞬時に見つけ出すことができるようになります。

Gemini Advancedの強化

 Google Geminiの有料版「Gemini Advanced」も強化され、最大100万トークンまで処理可能になりました。

 これは、約1500ページ相当の情報を一度に処理できることを意味し、非常に強力なツールとなります。さらに、Gemini AdvancedにはGoogle Gemini 1.5 Proが搭載されており、従来のジェミニ1.5 Proの機能をフルに活用することができます。

MusicAI Sambo: 音楽生成AI

 最後に、音楽生成AI「MusicAI Sambo」も発表されました。

 これは、音楽の生成や編集を行うことができるツールであり、今後の音楽制作に革新をもたらす可能性があります。

まとめ

 Google IO 2024では、多くの新技術とアップデートが発表されました。

 特に注目すべきは、トークン数が倍増したGoogle Gemini 1.5 Pro、ビジョン機能が進化したProject Astra、そしてテキストから動画を生成するVeoです。

 これらの技術は、私たちの生活をより便利に、そして創造的にするポテンシャルを秘めています。

最新情報をチェックしよう!