Faster R-CNN(1/5)発明の概要

はぐれ弁理士 PA Tora-O です。今回のテーマとして、物体検出の一手法である ”Faster R-CNN” を題材に取り上げていきます。

背景

畳み込みニューラルネットワーク(CNN)を導入した物体検出手法の一例として、R-CNN(Regions with CNN features)が挙げられます。このR-CNNでは、[1]全体画像の中から物体を含み得る関心領域(ROI)を提案して部分画像を抽出し、[2]抽出された部分画像のサイズを調整し、[3]調整済みの部分画像をCNNに投入します。ここで、[2]画像サイズの調整は、別の記事(SPPnet)で説明した通り、必須の構成ではありません。

【図1】R-CNNの機能ブロック図(自作)

問題の所在

ところが、上記したR-CNNの構成では、抽出した関心領域毎に特徴マップを生成する必要があります。特に、この類の物体検出では、対象物を含み得る関心領域の候補を多数(R-CNN論文の例では、約2000個!)設定した後、CNNの側でより高精度な検出を行っています。そのため、ROIの個数が増加するにつれて、すべての検出結果を得るまでの時間が掛かるという問題が生じます。

解決手段

そこで、上記した問題を解決すべく、”Faster R-CNN” という技術が提案されました。これにより、特徴マップの生成回数が削減されるため、“Faster” の文字通り、物体検出に要する演算時間がさらに短縮されます。

【図2】Faster R-CNNの概念図

出展:“Faster R-CNN : Towards Real-Time Object Detection with Region Proposal Networks”

この概念図でも実際の処理流れを十分に理解できるとは思いますが、過去の例にならって機能ブロック図を自作してみました。なお、「特徴抽出部」の機能に関しては、別の記事(Fast R-CNN)に載せた通りですので、そちらを参照してください。

【図3】Faster R-CNNの概念図(自作)

 

以上、今回(第1回)は、”Faster R-CNN”の概要について、実施例の機能ブロック図を用いて説明しました。次回(第2回)は、今回の検討結果を踏まえ、クレーム骨子を含む発明ストーリーを作成してみます。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村