kaggleとはデータサイエンティスト向けの世界で最も有名なコンペです。
アメリカ合衆国国土安全保障省、GE、グーグル、インテル、メルカリなど有名な組織がコンペを公募することもあります。
分析データはテーブルデータが対象です。画像、音声、自然言語などのデータは対象外です。
「Kaggleで勝つデータ分析の技術」ではデータ分析の実践的なアプローチを学びたい人やKaggleで応募したい人に向いている本です。
内容
本書を読む上で以下の知識が必要です。
- Pythonとそのパッケージの使い方
- 機械学習の基本
- 微分や行列の基本
本書の構成は次のようになっています。
第1章 分析コンペとは?
第2章 タスクと評価指標
第3章 特徴量の作成
第4章 モデルの作成
第5章 モデルの評価
第6章 モデルのチューニング
第7章 アンサンブル
第1,2章はKaggleの基礎知識について書かれています。
第3章以降では精度の高いモデルを作成するためのテクニックが多く紹介されています。
例えば”第3章 特徴量の作成”では前処理で大切な数値変数、カテゴリ変数、日時・時刻の変数の変換方法を詳しく解説しています。
人工知能の教本では理論や構築方法がメインで前処理やチューニングについては書かれていないことが多いですが、本書は一通り書かれています。
前処理は精度の高いモデルの作成に欠かせない処理です。
まとめ
“Kaggleで勝つデータ分析の技術”は実際のデータを使って精度の高いモデルを構築する方法を学ぶのに最適な本です。
人工知能系のコンペに応募して良い成績を残したい人や、実業務レベルのスキルを習得したい人におすすめです。
リンク
コメントを残す