Word2Vec（4/4）クレーム骨子の作成

2020年2月9日

はぐれ弁理士 PA Tora-O です。前回（第３回）では、“Skip-gram” モデルの概要について説明しました。改めて復習されたい方は、こちらのリンクから確認をお願いします。今回（第４回）は、これまでの検討を踏まえ、クレーム骨子を作成してみます。

技術的特徴の認定

クレームの作成に先立ち、本発明に相応しい先行技術を認定することが必要になります。しかし、色々と調べてみたのですが、実際の先行技術がどれであるか特定できませんでした。そこで、今回は、先行技術との相違点の有無に拘らず、ワンホット表現から分散表現に変換する方法について、２種類のモデルを包含するクレームを作ってお茶を濁そうと思います。

分散表現（Distributed Representation）とは、複数の連続値成分を組み合わせたベクトルを用いて単語を定量化する手法です。この表現により、単語群を構成する単語数に依存しない表現ができること、単語の一致性のみならず単語同士の関係性を定量化できること、などのメリットが生じます。それでは、“Word2Vec”（分散表現）のクレーム骨子は、以下の通りです。

クレーム骨子

【クレーム】（Word2Vec）
　Ｎ個の単語からなる単語群の分散表現を行う方法であって、
［１］単語のラベル集合を入力するＮ個の演算ユニットからなるｍ層の入力層、
［２］１≦Ｌ＜Ｎの関係を満たすＬ個の演算ユニットからなる１層の中間層、及び
［３］単語のラベル集合を出力するＮ個の演算ユニットからなる（Ｍ－ｍ）層の出力層
が全結合により順次接続されたニューラルネットワークを用いて、Ｍ個の連続する単語同士の関係性を学習するステップと、
　学習を通じて決定された入力層または出力層と中間層との間の結合重み行列から、連続値の成分を有するＬ次元のベクトルを単語毎に求めるステップと、
　を備えることを特徴とする分散表現方法。（２８３文字）