とてもつらい

プログラミングと本のメモ

3D ShapeNets: Adeep Representation for Volumetric Shapes

研究で読んだので適当にまとめ。

目的

あるオブジェクトの深度画像を入力として、オブジェクトの分類と、オブジェクトの形の推定をConvolutional Deep Belief Network(CDBN)を使って行う。

CDBN

有向グラフを持ったグラフグラフ確率モデルを何層か重ねたもので、RBMを何層か重ねたものを初期値として学習し、その後教師データを使って逆伝播で学習するモデル。

概要

見えてる範囲で、ボクセル表現のオブジェクトを作り、不明な部分をネットワークによって獲得する。わからなかった場合も考えて、次にこの視点があったらいいってのを得ることもできる。

感想

ボクセル表現で3Dの扱うってことが面白そうだったので、アイディアとして使って行きたい。メモリが足りれば。