Selective Search(1/4)発明の概要Ⅰ

はぐれ弁理士 PA Tora-O です。今回のテーマとして、物体検出時の前処理とも言うべき「領域提案」の一手法である ”Selective Search” を題材に取り上げていきます。

本検討の目的

この ”Selective Search” は、R-CNN3兄弟の事例検討の中でも何度か登場した手法です。”Faster R-CNN” の記事で解説した通り、領域提案(Region Proposals)も最終的にはニューラルネットワークにより実装可能であり、これによって演算の高速化が実現されています。今回、AI技術から少々逸脱して ”Selective Search” の事例検討を行う目的は、従来型のルールベース手法を把握することで、ニューラルネットワークとの相違点を感覚的に理解することにあります。

全体像の把握

この ”Selective Search”(選択的な検索)は、おそらく、”Exhaustive Search”(徹底的な検索)との対比を念頭に命名されたと考えます。ここで、”Exhaustive Search” とは、ROIウィンドウを2次元的に走査する「スライディングウィンドウ」方式と同義と考えても結構です。この用語の違いから、前者の方は、より効率的でかつ演算量が少ない探索方法であろうことが想像できます。

続いて、”Selective Search” のアルゴリズムを詳しく追っていきます。この手法は、既存のセグメンテーション手法(あるいは、領域分割手法)に若干の工夫を加えた上で、領域提案に適用したものと言えます。次の図1は、”Selective Search” 論文に記載された階層的グループ化アルゴリズムの抜粋です。

【図1】アルゴリズムの概要

出展:Selective Search for Object Recognition

全体的な流れを理解しやすいように、図1に対応するフローチャートを自作してみます。図2に示すように、”Selective Search” は、ざっくり5つのステップから構成されます。これから、フローチャートの各ステップを詳細に説明しながら、この手法の全容を把握していきます。

【図2】自作フローチャート

S1:初期領域の取得

まず、ステップS1では、物体検出の対象である元の画像に対して領域分割処理を施すことで、複数の初期領域(Initial Regions)を取得します。本論文では、“Felzenszwalb et.al.” によるグラフベースの領域分割手法が用いられます。その結果、図3で色分けした複数の初期領域が得られます。ここでは、物体輪郭の有無などを特に意識せず、隣接する領域間の輝度の違いを局所的に検出・区画していると捉えればOKです。

【図3】初期領域の設定例

出展:Efficient Graph-Based Image Segmentation

 

ちょっと早いですが、今回(第1回)はこれで終了とし、次回(第2回)は色特徴量の計算(図2のステップS2)以降について説明します。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村