Fast R-CNN(3/3)総括

はぐれ弁理士 PA Tora-O です。前回(第2回)では、”Fast R-CNN”の実施例について具体的に説明しました。改めて復習されたい方は、こちらのリンクから確認をお願いします。

今回(第3回)は、これまでの検討を踏まえて、クレームを含む発明ストーリーを完成させます。発明の対比を視覚的に行えるように、本発明(Fast R-CNN)と従来技術(R-CNN)の機能ブロック図を並べてみます。

発明の対比

【参考図】機能ブロック図の比較

発明ストーリー

【従来技術】
畳み込みニューラルネットワーク(CNN)を導入した物体検出手法の一例として、R-CNN(Regions with CNN features)が挙げられる。このR-CNNでは、[1]対象物を含む全体画像の中から部分画像を抽出し、[2]抽出された部分画像のサイズを調整し、[3]調整済みの部分画像をCNNに投入する。この類の物体検出では、対象物を含み得る関心領域の候補を多数設定した後、CNNの側でより高精度な検出を行っている。

【問題点と課題】
問題点は、設定された関心領域毎に特徴マップを生成する場合、関心領域の個数が増加するにつれて、すべての検出結果を得るまでの時間が掛かること。
課題は、関心領域内の部分画像を抽出する度に、部分画像毎に特徴マップを生成する場合と比べて、すべての検出結果を得るまでの演算時間を削減すること。

【クレーム】(Fast R-CNN)
 対象物を含む画像の全体領域の中から複数の関心領域を設定する設定部と、
 ニューラルネットワークからなり、またはニューラルネットワークを含んで構成され、かつ、関心領域内の対象物を検出する検出部と、
 を備え、
 前記検出部は、
 画像を入力とし、該画像の全体特徴マップを出力とする前段演算部と、
 設定された関心領域に対応する部分特徴マップを全体特徴マップの中から抽出して出力する特徴抽出部と、
 部分特徴マップから生成した特徴量を入力とし、関心領域内の検出結果を出力とする後段演算部と、
 から構成され、設定された関心領域毎に、部分特徴マップおよび検出結果の出力を順次行う、
 ことを特徴とする対象物検出装置。(289文字)

(注)R-CNN仮想クレームとの相違箇所を太字で示しています。

【作用と効果】
設定された関心領域に対応する部分特徴マップを全体特徴マップの中から抽出して出力する特徴抽出部を設けることで、関心領域の設定数にかかわらず全体特徴マップの生成回数が1回で済む。これにより、関心領域内の部分画像を抽出する度に、部分画像毎に特徴マップを生成する場合と比べて、すべての検出結果を得るまでの演算時間を削減することができる。

以上をもちまして、”Fast R-CNN” の事例検討を終了します。次回から、また別のテーマに移ります。”Fast” の次は、やはり、あのテーマです。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村