ベクトル検索
ベクトル検索は、正確な単語ではなく意味でコンテンツを見つけます。テキストは高次元の埋め込みへ変換され、コサイン距離のような類似度メトリックが、保存されたベクトルをクエリベクトルにどれだけ近いかでランク付けし、キーワードが一致しない場合でも概念的に関連する一節を返します。
同義語: semantic search, similarity search, nearest-neighbor search, embedding search
ベクトル検索は意味的検索を支えます。文字列を照合するのではなく、意味を照合します。クエリは索引付けされたコンテンツと同じベクトル空間へ埋め込まれ、インデックスは距離メトリックによって最も近いベクトルを返します。大規模でも高速を保つため、本番システムは近似最近傍インデックスを用い、ごくわずかな精度のトレードオフと引き換えに大きなレイテンシの利得を得ます。ベクトル検索は、ハイブリッド検索器の中でキーワード検索と組み合わせたときに最も効果的であり、正確な識別子が純粋に意味的な照合に取りこぼされないようにします。
よくある質問
ベクトル検索における埋め込みとは何ですか?
埋め込みは、テキストの一片の意味を表現する数値ベクトルで、埋め込みモデルによって生成されます。意味が近いテキストはベクトル空間で互いに近接します。
近似最近傍 (ANN) 検索とは何ですか?
ANN 検索はわずかな精度を大きな速度向上と引き換えにし、インデックス構造を用いて、保存されたベクトルの数が数百万に増えても類似度の探索を高速に保ちます。