Googleは、テキストとマルチメディアデータを統合処理できる新しい埋め込みモデルであるGemini Embedding 2をGoogle AI Studioを通じて公開した。このアップデートは、テキスト、画像、ビデオ、オーディオ、PDFなど、さまざまな形式のデータを単一の統合埋め込みスペースにマッピングする機能を提供します。
従来は各データタイプごとに別々のモデルを使用しなければならなかったが、今回のモデルは単一モデル内でマルチモーダルコンテンツを処理でき、技術スタックを簡素化する。特に、マルチモーダルRAG(検索拡張生成)システム構築時に、さまざまなファイルタイプから情報を同時に検索して検索精度と性能を高めることができる。また、テキストクエリを通じて関連画像やオーディオ、ビデオクリップを見つけるクロスモーダル検索機能を単一のインデックスでサポートする。
開発者はGemini APIの 'embed_content'メソッドを介してそのモデルをすぐに呼び出すことができます。 Googleは、生成された高次元埋め込みデータを効率的に保存してインデックス化するために、Vertex AI 、 Weaviate 、 Qdrant 、 ChromaDBなどの主要なベクトルデータベースとの連携を推奨しています。
今回のモデルは現在プレビュー版で提供されており、詳細な技術仕様と使い方は公式文書で確認することができる。
- 関連記事をもっと見る
🏷️[AIおすすめタグ]: Google、Gemini Embedding 2、マルチモーダル、RAG、セマンティック検索、AIモデル、埋め込み、データ処理、Gemini API、ベクターデータベース、人工知能、機械学習、自然言語処理