画像処理分野

http://d.hatena.ne.jp/yaneurao/20040709

やねう先生のはてなダイアリは興味深い内容だった。顔パーツ抽出の方針だ。

顔のパーツのマスク(領域)とパーツごとのu,v座標系を得るためには、画像をRGBからFarnsworthの均等知覚色空間にマップしたあと、顔部品をクラスター分析なりほにゃららエネルギー関数なりで位置決めして、パーツに対してスネーク(動的輪郭モデル)を適用するわけだ。ここまではまあ誰でも出来るだろう。(?)

問題は、そこから先の作業で、マスクを正確に取得するためにスネークを改良したり、ポテンシャルネットでオプティカルフローを求めてマスク範囲をより厳密にしたり、u,v座標系を確定させる。まあ、これも画像処理の基礎だから、知ってる人には別にそんなに難しくはないと思う。

正直p*1にはチンプンカンプンだ。チンプンカンプンのクセに、上では「興味深い」とか書いちゃってます。スミマセン。とりあえず判らない用語を調べる所からはじめよう。

u,v座標系
顔の領域に正規化した座標系と言うことだろうか。基本の基本っぽい感じがするが、この部分ですら自分にとってはアヤフヤ。orz。
Farnsworthの均等知覚色空間
Labと同様に場所場所によって色差に差がない色空間の事だと思う。自信ないけど。Farnsworthはテレビの発明者との記述もあった。
クラスター分析
http://aoki2.si.gunma-u.ac.jp/lecture/misc/clustan.html 似通った個体あるいは変数のグループ化を行うための分析手法である、とのこと。顔表面上のピクセルを目鼻眉などにグループ分けするのに使うという理解でよいのだろうか。
エネルギー関数
http://mars.elcom.nitech.ac.jp/java-cai/neuro/hop3.html 入力する変数が正解に近ければ小さい値をとる関数という理解でよいのだろうか。
スネーク(動的輪郭モデル)
Snakes。エネルギー最小化原理を用いた動的輪郭モデル。具体的にどのような処理になるかは調査中、orz。
ポテンシャルネット
「ポテンシャルネットとK-L展開を用いた表情認識」松野勝弘 李 七雨  三郎。「イメージを介した人と機械のコミュニケーション」 http://www.image-lab.or.jp/kansai/4groups/yachida.pdf。別所弘彰,岩井儀雄,谷内田正彦 “ポテンシャルネットを用いた顔領域の推定と表情認識”,画像の認識・理解シンポジウム(MIRU2000),II61-II66, 長野, July 2000. (DID. 438)
オプティカルフロー
動画像中の運動物体の見かけの速度場のこと。(´_`)?。(※ コメントでやねう先生ご本人にフォローを頂いています)

新しい言葉や概念に触れられてタメになったが、自分の分野の狭さが浮き彫りになった形だ。
精進したい。

*1:筆者