FC2ブログ

3Dデプスマップの張り合わせの件 (74)

最近多いのが、3次元で複数個所から一か所に向けて撮った映像を張り合わせて360度ぐるっと見て回れる3D映像に作り替えられないかという相談が多いです。

半年前から急増していて、毎回同じことを回答するのも面倒なので、ここで全て回答しておきます。

一見技術的に難しくないように見えるこの作業ですが、コンピューター的には難しい計算です。

何故なら、人間は計算するのに完全なデータは必要とせずに、データ自身に欠損があっても、これまで蓄積された映像データを利用して欠損を補うことができます。それが『盲点』ですね。本当は見えていないんですが、映像を脳で合成して補っています。

そうやって、欠損データを補って、『恒常性』を利用して、その物が「何か?」を判断して、人間の脳で立体視できても、コンピューターはそうはいかないのです。

こういうのが理解しにくいのって、3次元映像の創世記に人間の脳を利用した『立体錯視』を『立体視』であるかのように売り出したからです。これって、『運転支援システム』を『自動運転』とマーケティング上呼んで、事故を引き起こしたようなものですね。

固定した複数台の3Dカメラから撮ったデータのXYZの座標軸があっていればできますが、キャリブレーションは難しいです。

複数視点からの映像→カメラ・キャリブレーション→エピポラー幾何補正→ホモグラフ計算→ポイントクラウドレジストレーション→ポリメッシュ生成

という手順をふまえます。

例えば、四角い箱を撮影して、特徴のある部分である箱のエッジ部分を合わせれば、三次元合成できるかもと思っても、自動的にそのエッジが「同じ」と認識できないのがコンピューター。人間は恒常性があって、「これは箱」だと思って見ているから、手作業だと張り合わせられるけど、自動ではなかなか認識できないんです。(箱は単なる事例で、実際はもうすこし滑らかな形状のものを撮るので、張り合わせる目印になる特徴点的な部分が少ない)

キャリブレーションがずれていると、XYZ情報がズレるので、「XYZ情報だけで張り合わせられる」と考えるのは、早急です。

XYZがズレたままだと、マトリックスで計算しようとしても対象物が一つにまとめきれずに『映像が割れる』というのはよくあることです。

宜しくお願いします(^▽^)/


スポンサーサイト



自動運転の未来『トロッコ問題』と顔認識による『年収判断』 (60)

セミナーで数分話そうと思っているんだけど。
自動運転の未来に付きまとう「トロッコ問題」。

自動運転で無人運転になった時、AIは誰を轢き殺して誰を轢き殺さないかという判断を迫られるけど、その設計をしないといけないんですよね。

その時にヒューマンエラーはないので、最初から設計しないといけないという残酷な話が、自動運転のエンジニアの間で時々テーマに上がります。

きゃー、いやな計算ね。


toroko.png
(引用 モラルマシーンより ⇒ http://moralmachine.mit.edu/hl/ja)

エンジニアの間で、冗談で上がってきたのは、「これからは、車が事故に遭う時に歩行者の顔を認識して、『人物Aは年収200万円』、『人物Bは年収2億円』、『人物Cは年収0だけど平均余命が70年』、『人物Dは年収5000万円だが平均余命5年』などという、顔認識で人物の背景を分析し事故後の訴訟を含めえた被害額算定を行なったうえで事故を起こすという計算が保険会社から求められるようになるだろうということだ。

しかし、笑ってはいられないね。

保険会社は、既に本気でそういうことを考えているんじゃないのかな。

サイドミラーレスのクルマなんて、保険会社が自動車業界に受け入れさせるために長年ロビー活動をしている。

金融の世界は、人の命に値段を付けてきたので、この問題はプライスレスとはならない。

エンジニア達が、
「無人運転の時代には金稼いでおかないと、車に轢かれて死ぬ確率が高くなるから頑張ろう」
と、自嘲的に笑ったけど、これは笑いごとでも何でもない、あり得る未来なのだ。




3Dマシンラーニングとシンギュラリティの未来 (59)

今月6日は国際画像機器展で深田の中の人浅田麻衣子さんが、昼からセミナーなので、スライドの準備をしていました。

一時間のセミナーに60枚のスライドなので、1分一枚くらいのセミナーですね。盛りだくさん。昔、早大のミクロ経済学で清野先生のスライドが一時間に120枚くらいで、メモを取ろうとしたら二枚くらい進んでいるので「サブリミナル授業」と呼ばれていたことを思い出しますw

自動運転のセンサーフュージョンでLidarと画像の統合で苦労するなら、最初から一つのものを作ればいいということ。画像で測距して3次元映像でピクセルごとに距離情報があれば、ポリゴン化や3Dモデリング化もLidarのポイントクラウドよりは作りやすいので推奨してます。

ポイントは、何故認識に3次元が必要なのか。

⇒ それは人間の認識が基本3次元であるということと、時間の認識があるので、当然必要な情報だからです。

⇒ 基本二眼以上のカメラで作るデプスをいかに単眼で合成するかというのも、今回のセミナーのポイント。

⇒ そして、AIへのサイバー攻撃の脅威も触れておきます。
米国政府が自動運転車に今後課題として、AIへの攻撃脆弱性は必ず突っ込んでくるからです。

⇒ それをいかにリアルタイム処理するのかという部分から、少しだけチップ設計のアーキテクチャについて話します。

今回は、席数が余っていたら告知しようかと思っていたのですが、100席の予定だと思っていたら、既に160席申し込みで満席。残りは、当日キャンセル待ちの申し込みになってしまいます。
(そして、お席の確約できません。ごめんなさい!)

空港自動ゲートの危機;米国防高等研究計画局が恐れるAIへの攻撃

先日、雑誌の記事で人工知能への攻撃について書いたらボツになったので残念と思っていたけど、DARPA(米国防高等研究計画局)のカンファレンスで最もホットな話題となっていた。

日本も空港の顔認証システムが始まったところなので、開発者は知っていると思うけど我が国の政府がどこまで認識しているかは不明なので心配です。

人工知能への攻撃がかなり多岐に渡っていて、まあまあ驚きましたね。
人工知能がオープンソースだと、すぐにアルゴリズムが分かるので、認識を騙すAI攻撃ツールも官単位作れてしまいます。

下記は「顔認証攻撃眼鏡」です。

顔認証システムで写真を撮るときに、こういうサイケな眼鏡を乗せると上の写真の人が下の人に見えちゃうらしいです。
カーネギーメロン大学のAI攻撃システム カーネギーメロン大学より

Dは理解できるけど、bとcはもはや性別すら認識できていない。

こんな人間の目なら簡単に分かってしまうことが、AIには完全な目くらましとなって認識機能が著しく落ちてしまうということです。

こういうAI攻撃ツールの開発に力を入れているのは、もちろん人民解放軍。

これで、空港の顔認証ゲートとか、大丈夫なんですかね。


プロフィール

fukadamoe

Author:fukadamoe
深田萌絵(41歳)本名 浅田麻衣子
IT企業経営の傍ら、ITビジネスアナリストとして雑誌へ寄稿。

チップソリューション、自動車向けLidar代替ソリューション、3D認識システム、リアルタイムAIソリューション提供。
深田萌絵取材・講演依頼→moe.fukadaあっとまーくyahoo.com
開発・技術相談→infoあっとまーくrevatron.com


美術短大現代絵画科準学士、早稲田大学u政治経済学部国際政治経済学科卒。

TOEIC890、HSK5級、証券外務員一級、内部監査員、陸上特殊無線技士2級、航空特殊無線技士、マイクロソルダリング講習受講(資格未取得)。

最新記事
月別アーカイブ
カテゴリ
アクセスランキング
[ジャンルランキング]
政治・経済
19位
アクセスランキングを見る>>

[サブジャンルランキング]
政治活動
8位
アクセスランキングを見る>>