SPPnet(2/4)実施例の検討1

はぐれ弁理士 PA Tora-O です。前回(第1回)では、SPPnetの概要について説明しました。改めて復習されたい方は、こちらのリンクから確認をお願いします。

今回(第2回)は、SPPnetの実施例を具体的に検討したいと思います。この技術の本質は、プーリング演算の実行前における特徴マップのサイズによらず、一定サイズの特徴ピラミッドを生成することである、と考えられます。これを実現するためには、プーリングの演算条件を動的に設定する必要がありそうです。

プーリングの演算条件には、[1]カーネルサイズ、[2]ストライド、[3]パディングの有無、があります。この3つの制御変数のうち、演算後のマップサイズを定めるのはストライドです。具体的な例を挙げると、ストライドの値を(H/2,V/2)に設定することで、(H×V)→(2×2)のマップサイズに変換することができます。以下、動的に定められた演算条件に従って実行するプーリングを「可変プーリング」(VP;Variable Pooling)と命名します。一方、固定された演算条件に従って実行するプーリングを「固定プーリング」(FP;Fixed Pooling)と命名します。

さて、本来の話に戻しますが、SPPnetの実施例として、概ね以下の2類型を挙げることができます。

第1実施例:直列接続

第1に、複数のプーリング層を直列的に接続するネットワーク構成が考えられます。層数をN(≧2)とする場合、後段層群(第1回参照)は、1層のVP型プーリング層と、(N-1)層のFP型プーリング層から構成されます。

【図1】直接接続の構成例

第2実施例:並列接続

第2に、複数のプーリング層を並列的に接続するネットワーク構成が考えられます。層数をN(≧2)とする場合、後段層群(第1回参照)は、N層のVP型プーリング層から構成されます。

【図2】並列接続の構成例

第3実施例?

あと、第1,第2実施例の合わせ技(直列+並列の組み合わせ)というのもあり得るでしょう。ところで、次の実施例はどうでしょうか?

【図3】単体の可変プーリング

図3の実施例は、果たして、SPPnetの類型と呼ぶことができるのでしょうか?

これまで、SPP(空間ピラミッドプーリング)の名称に拘って、複数の特徴マップを生成することを前提に話を進めました。ところが、後段層群から出力される特徴量の個数を一定にするためには、多重解像度マップ(Multi-Resolution Map)に限られず、一重解像度マップ(Single-Resolution Map)を生成しても良さそうです。

図3の取り扱いについてちょっと混乱してきましたので、今回(第2回)の検討はここまでとします。次回(第3回)は、SPPnetの技術的本質をもう少し深堀りして検討してみます。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村