局所回帰

局所回帰(きょくしょかいき、英語: local regression)または局所多項式回帰(きょくしょたこうしきかいい、英語: local polynomial regression)は、移動回帰(いどうかいき、英語: moving regression)とも呼ばれ、移動平均や多項式回帰を一般化したものである。

局所回帰
LOESS curve fitted to a population sampled from a sine wave with uniform noise added. The LOESS curve approximates the original sine wave.

概要

局所回帰の最も一般的な方法がLOESS (locally estimated scatterplot smoothing) およびLOWESS (locally weighted scatterplot smoothing) であり、いずれも [ˈlɛs] と発音される。いずれもノンパラメトリック回帰の手法であり、多数の回帰モデルをK近傍法に基づくメタモデルで組み合わせる。

LOESSは、線形最小二乗回帰の単純さと非線形回帰の柔軟性の多くを兼ね備えている。グローバルな関数を指定する必要はなく、データの局所的部分集合localized subsets of dataに単純なモデルを当てはめればよい。最小二乗回帰と比較すると計算量は膨大である。この統計手法で得られる滑らかな曲線は、loess曲線ないしlowess曲線と呼ばれる。

モデルの定義

1964年、SavitskyとGolayがLOESSと等価な手法を提案し、Savitzky–Golayフィルタと呼ばれるようになった。1979年、William S. Clevelandがこの手法を再発見し、別の名前を付けた。1988年、ClevelandとSusan J. Devlinが、この手法をさらに発展させた。

データセットの範囲内の各ポイントで、低次の局所多項式がデータの部分集合にフィットされる。多項式は、応答が推定されるポイントに近くのポイントに重みを与える、重み付き最小二乗法を用いてフィットされる。各データ点のそれぞれについて回帰関数の値が計算されたところで、LOESSのフィットが完了する。

データの局所的部分集合

LOESSの重み付き最小二乗法によるフィッティングに使用されるデータの部分集合は最近傍アルゴリズムによって決定される。平滑化パラメータ局所回帰 は、各局所多項式を適合させるために、どのくらいの割合のデータを使用するかを決定する。

k次の多項式のフィッティングにはk + 1 以上のポイントが必要であるため、平滑化パラメータ局所回帰 は、局所回帰 と1の間にある必要がある。ここで、局所回帰 は局所多項式の次数を示す。局所回帰 が小さいほど回帰関数がデータに近くなるが、データの変動に伴うブレが大きくなる。

局所多項式の次数

局所多項式は、ほとんどの場合、1次か2次である。より高次の多項式は理論的には有効であるが、「どんな関数も局所では低次の多項式で近似できる」というLOESS の精神にはそぐわないし、過剰適合のリスクがある。

重み関数

重み関数は、説明変数空間において推定点に近いデータ点に最も大きな重みを与え、最も遠いデータ点に最も小さな重みを与える。

伝統的には三次元重み関数が用いられる。

    局所回帰 

ここで、dはデータポイント間の距離で、0から1の範囲にスケーリングされる。

ターゲット空間局所回帰 上の計量局所回帰  局所回帰 による線形回帰の一般化を考える。局所回帰  により 局所回帰 個の入力パラメータを局所回帰 に埋め込んで、次の損失関数を考える。

    局所回帰 

ここで、局所回帰 局所回帰  の実行列であり、局所回帰 と定義される。添え字iは訓練データの入出力のベクトルを示す。局所回帰 は計量なので対称な正定値行列であり、局所回帰 を満たす対称行列局所回帰 が存在する。損失関数は次のように変形できる。

局所回帰 
ベクトル局所回帰 局所回帰 型の行列局所回帰 、ベクトル局所回帰  局所回帰 型の行列局所回帰 とすることで、損失関数は次のように変形できる。
    局所回帰 

ここで、局所回帰 局所回帰 対角行列であり、 その成分は局所回帰 である。局所回帰 に関して微分した値をゼロとすることで

    局所回帰 

さらに、正方行列局所回帰 可逆行列であるとき、損失関数局所回帰 は下記で最小値を取る。

    局所回帰 

局所回帰 として、主にガウス関数が選択される。

    局所回帰 

利点

平滑化パラメータと局所多項式の次数を与えるだけで、モデルをサンプルデータに柔軟に適合させることができる。

欠点

局所的なデータ構造に基づいてフィッティングするため、充分な大きさの標本が必要である。また、数式で簡単に表現できる回帰関数を生成しないため、分析結果を他者に伝えることが困難である。また、他の最小二乗法と同様に、外れ値の影響を受けやすい。

脚注

出典

関連項目

外部リンク

実装

局所回帰  この記事にはパブリックドメインである、アメリカ合衆国連邦政府が作成した次の文書本文を含む。アメリカ国立標準技術研究所.

Tags:

局所回帰 概要局所回帰 モデルの定義局所回帰 利点局所回帰 欠点局所回帰 脚注局所回帰 関連項目局所回帰 外部リンク局所回帰多項式回帰移動平均英語

🔥 Trending searches on Wiki 日本語:

弱虫ペダルユ・アインロングバケーション (テレビドラマ)男闘呼組君と世界が終わる日に永瀬廉築山殿粗品 (お笑い芸人)ギムリー・グライダーグレゴリー・ペック北海道日本ハムファイターズ谷まりあ綾瀬はるか坂口涼太郎魔入りました!入間くん田中将大牧秀悟コロラド気球事件PSYCHO-PASS王柏融ロサンゼルス・ドジャース黒木華名探偵コナンの登場人物千賀滉大藤井風水瀬いのり星獣戦隊ギンガマン日本のアナウンサー平野紫耀日覺昭廣水卜日本動物園水族館協会川上量生Little Glee Monster霧島一博小倉昭和館千眼美子まんこおかあさんといっしょ足立梨花団時朗大塚芳忠ドバイワールドカップ大谷翔平佳久創茂野吾郎堀田真由心霊内科医 稲生知性牧原大成メジャーリーグベースボール3年B組金八先生日本歴代興行成績上位の映画一覧スッキリ (テレビ番組)機動戦士ガンダム油彩葵わかな岩本乃蒼石川ひとみピッチクロックSixTONESラーズ・ヌートバー前田耕陽タモリアイナ・ジ・エンドアナルセックスきただにひろしBUMP OF CHICKEN吉田正尚佐藤かよ雨宮天松岡茉優菊地姫奈宮崎勤転生王女と天才令嬢の魔法革命2006 ワールド・ベースボール・クラシック日本代表中村扇雀 (3代目)鈴木誠也🡆 More