人間の視覚的識別は、
画像を見て13ミリ秒以下で見ているものを正確に把握することができるという。
テクノロジーの世界で人間と同じくらい迅速かつ効果的に画像を理解するには、
画像内の特定のオブジェクトを識別し、すばやく処理できる機械学習ツールが必要なことから、
今までビジュアル検索は困難であった。
しかし、この数年非常にゆっくりとした進歩ながらも、
GoogleやEコマースでビジュアル検索が現実化してきている。
検索で単語を入力し、検索エンジンが関連する画像を提示する画像検索と異なり、
テキストの代わりに画像をクエリーとして使用するビジュアル検索では、
機械学習テクノロジーを用いた視覚処理エンジンの
ニューラルネットワークの活性化による画像処理が行われている。
スマートフォンでのビジュアル検索エンジンアプリとして
2017年に発表されたGoogle Lensは、現在Googleアプリに組み込まれ、
その一機能となっている。
アプリを使って撮影した写真を分析し、アプリ内のニューラルネットワークに組み込まれている
Googleの膨大なデータやアルゴリズムやナレッジグラフに基づき、
その画像に関する情報やEコマースでの購入へのリンクを表示する。
さらに、ビジュアル検索では、ニューラルネットワークの理解以上の
認知心理学に基づく複雑な検索エンジンプログラムも必要とされ、
Googleが2014年に買収した人工知能研究の第一人者のDeepMindのテクノロジーも生かされている。
Pinterestは独自のビジュアル検索により、2017年3月からアプリを介して
人物、商品、食事などの写真を撮影し、その写真を分析して洋服や家庭用品やレシピの表示をし、
Eコマースとの連携もはかっている。
実際、Pinterestでは、毎月6億件以上のビジュアル検索が行われているという。
さらに、写真の検索に加えてテキストも追加できる機能も提供されており、
特定のアイテムを探している場合に、より絞り込まれたより求めている結果に近づくことができる。
(例:コーヒーテーブルに合った新しいソファを探している場合、
コーヒーテーブルの写真にソファというテキストを入力)
同様に、ファッション小売業のASOSも、
2017年8月にビジュアル検索ツールをリリースしている。
ユーザーはASOSアプリにて写真を撮ったり、あるいは撮影した写真、スクリーンショット、
雑誌などからの画像をアップロードし、その画像内の商品、
もしくは類似した商品をASOSサイトで検索できる。
当初はイギリスに限定されたサービスであったが、今では他の国でも利用可能となっている。
3社とも2017年にサービスを開始していることから、
2017年はビジュアル検索元年とでも呼べそうである。
ところで、Eコマースサイトでは選択肢が非常に多いことから途中で買い物をやめる、
いわゆる”Discovery Problem -発見の問題”があった。
が、ビジュアル検索が可能となると、選択肢の数を絞り込み、買い物客が望むものを
より効果的に見つけることができるようになり、この発見の問題の解決ともなる。
ビジュアル検索が可能になってきたことにより、
検索手段は、テキスト、音声、イメージと豊富になる。
特に、若い世代では69パーセントがビジュアル指向の
検索だけに基づく購入に関心を示しているという調査機関のデータもあり、
ビジュアル検索はEコマース業者にとって重要な位置付けになると予測される。