Selective Search(4/4)総括

はぐれ弁理士 PA Tora-O です。ここまで、”Selective Search” の実施例について詳しく説明しつつ、境界ボックスの設定(ステップS5)に主要な特徴事項があることを確認しました。前回(第3回)の復習を行う際は、こちらのリンクからお願いします。

今回は、”Selective Search” に関する発明ストーリーの一例を提示します。仕事ではないのでやや雑に書きますがご了承ください。

発明ストーリー

【従来技術】
画像領域分割の一手法として、1枚の画像をN個の領域に分割した後、類似度が高く互いに隣接する領域同士を順次併合する併合処理を通じて、画像中の1つの物体を示す領域(セグメント)を推定する「階層的グループ化」が知られている。例えば、この階層的グループ化を物体検出タスクにおける領域提案(Region Proposals)に適用することが考えられる。

【問題点と課題】
問題点は、併合処理の過程で生成される各々の領域を囲む関心領域を設定する場合、初期の分割数(N)が多くなるほど、同一の物体に対して互いに類似する複数の関心領域が不必要に設定されること。
課題は、同一の物体に対して互いに類似する複数の関心領域を不必要に設定するのを抑制すること。

【クレーム】(Selective Search)
 画像に対して階層的グループ化を施すことで、領域の分割数がそれぞれ異なる複数の領域マップを生成するステップと、
 領域の分割数が少ないほど階層が上位であり、多いほど階層が下位であると定義する場合、
 上位の階層であるほど分割数に対する割合が高くなり、下位の階層であるほど分割数に対する割合が低くなるように、各々の領域マップの中から領域を選択するステップと、
 複数の領域マップの中から選択された各々の領域を囲む矩形状の関心領域を、画像上の対応する位置に設定するステップと、
 を実行することを特徴とする領域設定方法。(249文字)

【作用と効果】
一般的に言えば、画像の全体領域に占める領域が小さいほど、当該領域が物体のセグメントである可能性が低くなる。そこで、下位の階層であるほど分割数に対する割合が低くなるように、各々の階層マップの中から1つ以上の領域を選択することで、物体のセグメントに該当しない可能性が高い領域を除外することができる。これにより、同一の物体に対して互いに類似する複数の関心領域を不必要に設定することが抑制される

作者コメント

実際の特許出願では、「階層的グループ化を用いて関心領域を設定する」という上位レベルからクレームを作った方がよいでしょう。あと、「階層的グループ化」の表現に対して36条違反の指摘を受ける可能性を考慮して、用語の定義を明細書に書き込んでおきます。

さて、画像に対して物体候補の領域を設定するというタスクは、ニューラルネットワークによっても実現することができます。例えば、RPN(Region Proposal Network)のクレームの表現は、以下の通りになります。

Faster R-CNN(3/5)RPNの実施例<前半>
Faster R-CNN(4/5)RPNの実施例<後半>
Faster R-CNN(5/5)総括

【クレーム】(RPN)
 画像の全体領域内に境界ボックスを設定し、該境界ボックス内における対象物の存在の確度を示す得点を求め、該得点が相対的に高い境界ボックスを関心領域として提案する方法であって、
(1)全体領域内の指定位置を基準として、サイズ又は形状が互いに異なる複数の境界ボックスを設定するステップと、
(2)複数の境界ボックスに応じた画像特徴量の集合をニューラルネットワークに入力し、指定位置毎の得点の集合を出力するステップと、
 を指定位置を変更しながら順次実行する、ことを特徴とする関心領域提案方法。

Faster R-CNN(5/5)総括 より一部抜粋

つまり、ニューラルネットワークを用いた探索方法は、”Exhaustive Search”(徹底的探索)そのものと言ってもよいでしょう。このように、画像認識の研究分野におけるROI設定方法という単なる一手法においても、“AlexNet” の登場から僅か3、4年の間で、「スマート」から「力尽く」へのパラダイムシフトが起きたことが見て取れます。只々、驚くばかりですね。

 

以上をもちまして、”Selective Search” の事例検討を終了します。次回から、また別のテーマに移ります。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村