FCN (3/4) U-Netの紹介

はぐれ弁理士 PA Tora-O です。前回(第2回)では、FCNの実施例について説明しました。改めて復習されたい方は、こちらのリンクから確認をお願いします。今回(第3回)は、FCNの類似技術であるU-Netについて紹介します。

U-Netの特徴

まず、U-Netのネットワーク構造は、次に示す図1の通りです。

【図1】U-Netのネットワーク構造

出展:U-Net: Convolutional Networks for Biomedical Image Segmentation

水色又は白色の矩形が特徴マップに相当しており、マップサイズが大きいほど(マップ解像度が高いほど)図面の上側に、マップサイズが小さいほど(マップ解像度が低いほど)図面の下側に配置されています。この図から理解されるように、名称(=U-Net)の由来は、このU字状のネットワーク構造にあります。

【図2】U-Netの部分拡大図

図2は、U字底の部分拡大図になります。細かい説明を省略しますが、ダウンコンバート中に生成された特徴マップを[1]複製し(Copy)、[2]切り出し(Crop)、そして[3]連結する(Concatenate)ことで、アップコンバート時に再利用します。当然ながら、特徴マップの位置情報を維持するため、解像度がそれぞれ一致する特徴マップ同士を合成する必要があります。この特徴マップの合成構造は、一般的には、スキップ接続(Skip Connection)と呼ばれています。

【図3】セグメンテーションの結果(一部加工あり)

出展:U-Net: Convolutional Networks for Biomedical Image Segmentation

この手法を用いることで、画像中にある細胞の領域を高精度に特定することができます。

FCNとの比較

続いて、FCN(Fully Convolutional Networks)とU-Netとの相違点について整理します。両モデルの違いは、[1]スキップ接続、[2]マップ合成方法、であると考えます。ちょっと厳密さに欠けますが、U-NetはFCNの上位互換モデルである、と理解してもよさそうです。

【図4】FCNとU-Netの比較

 

以上、今回(第3回)は、U-Netについて説明しました。テーマ最終回(第4回)は、過去3回分の検討結果を踏まえ、クレーム骨子を含む発明ストーリーを作成してみます。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村