「データ集計・分析のためのSQL入門」 読みました

実は今まで機会が無くSQLを使ったことがありませんでした。しかし大量のデータを扱うことを前提にしているAIの世界で生きていくなら、知識がないままでは不便だろうと考えて読んでみることにしました。

本の目次

Chapter 1 データ集計の基礎知識
1-1 集計は分析のための大切な土台作り
1-2 集計レポートとは
1-3 集計レポートの種類
1-4 代表的な集計方法
1-5 データの読み方
1-6 グラフの使い分け
Chapter 2 SQLの基礎
2-1 SQLとは
2-2 テーブル設計とデータ操作
2-3 データ型
Chapter 3 分析への活用1 ~基本統計量と偏差値の算出など
3-1 集計関数・分析関数
3-2 基本統計量と偏差値の算出
Chapter 4 分析への活用2 ~デシル分析、RFM 分析など
4-1 分析の基礎 ~クロス集計~
4-2 デシル分析
4-3 RFM分析
Chapter 5 分析への活用3 ~アソシエーション分析、時系列分析、アトリビューション分析など
5-1 アソシエーション分析
5-2 デシジョンツリー
5-3 時系列分析
5-4 アトリビューション分析(均等配分モデル)

感想

SQL入門書としてこの本を選んだのは失敗でした

いや、本の内容自体は素晴らしいですよ?SQLとは何か、から入って、データ分析の実務で得た知見を紹介しながら段々と高度な分析へと発展させていっています。データ分析の現場で活躍されている著者なので、現場の知見は参考になるところが多くありました。

SQLのみではなく、データの基礎解析やExcel等のツールにも触れていて、データ分析全般の解説がされています。

では何が失敗だったのか?ということになりますが、この本は別にSQL自体の入門書ではなかったのです。そういえばタイトルにも「データ集計・分析のための」と書いてありましたしね。

SQLへの入門を既に別のところで済ませていて、データをSQLで分析する必要が出てきた人が対象読者なのでしょう。なので、入門書でもネットのコンテンツでもいいのでSQLの基礎は別で学んでおいた方がいいでしょう。

とはいえこの本が面白いことは確かで、後半のRFM分析やデシジョンツリー、時系列分析なんかはSQLでここまで出来るのか!と思わされました。

たぶんSQLは、Excelで分析できるほど小さくはなく、でもHadoopなどの分散処理を活用しないと扱えないほど大きくもない、中間くらいの大きさのデータセットの分析で効果的なんではないかと思います。そして現在の、大量のデータを収集してきた訳じゃないけどデータを活用したい、と思っている企業が持っているデータは、この中間くらいの大きさなデータが多いんじゃないでしょうか?

加えて、この本はエンジニア向けの解説書ではありません。なので、効率よくデータ分析を行えるデータベースの設計だったり、コンピュータの性能を限界まで引き出せるSQLの紹介などは皆無です

まとめるとこの本は、「SQLの入門書を読んだけど実データにどう使っていいか分からない」、「SQLであの分析ってどうやるんだろう?」などと考えている方にお勧めです。

自分が探している分析手法の解説が無かったとしても、基礎統計量を算出するSQLなどから載っているので、この本の内容を発展させれば様々な手法に応用できると思います。

関連図書

自分がSQLに詳しくないので、今回は無しで…

シェアする

  • このエントリーをはてなブックマークに追加

フォローする