「画像認識(MLP)」 読みました

仕事では画像認識が専門になりつつあるので、基礎固めのために購入しました。目次を眺めてみたところ、エッジ抽出などの基礎から深層学習を使った応用まで取り扱われていたので丁度いいんじゃないかな、と思います。

機械学習プロフェッショナルシリーズ(MLP)は、入門を終えた方にオススメのシリーズです。扱っているトピックは画像や自然言語やwebデータ、生命情報なんてのもあるくらいで、かなり広い領域をカバーしてます。レベルも基礎理論の解説もあれば、応用に注力している本もあります。

機械学習を仕事や研究で扱うなら、MLPの中の関連するトピックの本を一通り読んでおくとスムーズに論文に入れるんじゃないかと思います。

本の目次

1章 画像認識の概要

2章 局所特徴

3章 統計的特徴抽出

4章 コーディングとプーリング

5章 分類

6章 畳み込みニューラルネットワーク

7章 物体検出

8章 インスタンス認識と画像検索

感想

この本は決して優しくはありません。ですが、それは扱っている内容のレベルからして仕方のないことだとは思います。機械学習理論を押さえた上での画像認識入門書、ということであれば現時点での決定版ではないかと思います。

画像認識の視点からの機械学習

そもそも画像認識の手法は、機械学習の手法と大きな違いがあるわけではありません。学習の対象が画像というだけで、そこで使われている理論や手法は共通なことが多いです。この本では機械学習を理解していることを前提に、それを画像認識の方向から解説するようになっている印象を受けました。なので、機械学習理論を理解した方にとってはとてもいい入門書であると思います。

基本から先端の手法まで

この本はフィルターを使用した特徴抽出から始まり、統計的画像認識に発展させています。そこから深層学習が導入され、現在第一線で使用されている学習モデルの解説へと続きます。私は今まで深層学習を利用した画像認識、あるいは統計的画像認識のみを扱った本しか読んでいなかったので、その隙間を埋めることができたと思います。

サンプルコードは皆無

MLP全般に言えることですが、サンプルコードは基本的に載っていません。ですので、プログラムで理解したい方には不向きかと思います。個人的にはサンプルコードはググれば大体見つかるので、手法の解説に集中する姿勢は共感できます。

関連図書

1.「実践 コンピュータビジョン」 Jan Erik Solem 著、相川 愛三 訳

Pythonを使用した画像認識の解説書です。OpenCVに関するところなど一部内容が古くなっているところもありますが、調べれば何とかなるレベルだと思います。いつでも深層学習が使えるわけではないので、手札を増やしておくのは重要。

2.「ゼロから作るDeep Learning 斎藤 康毅 著

Pythonでニューラルネットワークを記述しながら解説してくれる本です。最終的には、画像認識でよく使われている畳み込みニューラルネットワークまで解説されます。この本のコードが実作業でそのまま使えるわけではありませんが、ライブラリを使う時に原理が分かっているか、そうでないかでは全然違うのでこういう本も重要だと思っています。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする