AI(機械学習)エンジニアやデータ分析エンジニアを目指していたり統計学に興味がある方なら、時系列分析という言葉を聞いたことがありますよね。秒や月、日などの一定の間隔で取られた一連のデータを時系列データと呼び、この時系列データを取り扱う分析手法が時系列分析です。
僕自身、最近時系列分析に触れる機会が出てきたので意気込んで入門書をいくつか手にとって学びを進めてみたのですが、時系列データならではの前提やデータの扱い方、理論などに圧倒されて返り討ちに遭いました。
そして現在も勉強中なわけですが、入門書いくつかに目を通して色々思うことがあったので今回は忘れないうちに時系列分析の入門書に取り組んで感じたことを整理してみました。
今回取り組んだ書籍となぜこれらを選んだのか
今回取り組んだのは以下の3冊です。
書籍①『現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~』
書籍②『時系列解析: 自己回帰型モデル・状態空間モデル・異常検知 (Advancd Python)』
書籍③『時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装』
大前提として僕自身が、
・時系列分析はしたことがない
・数学・統計学の基本的なことはわかる(難しい内容はお手上げ)
・機械学習を学んできていてPythonだけ書ける
という状態でした。。。
そこで今回は
「時系列データの扱い方を優しく学べる」&「Pythonによる時系列分析の仕方がわかる」
という2点で書籍を探していたところこの3冊にいきあたりました(残念ながら僕のニーズを一冊で満たしてくれる本は見つからず・・・ 泣)。
念の為補足ですが、書籍を選ぶに当たってはアマゾンレビューを参考にしたのはもちろん、本屋で実物の内容を確認した上で自分のレベルに合っていそうかどうかを判断しました。途中で挫折してしまうのはしんどいですから。前述した通り数学は全然得意ではないので数式がたくさん登場するような書籍や、時系列分析の前提知識を必要とするような本は除外しています。
以降では書籍について感じたことをまとめていきます。
書籍①『現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~』
この書籍『現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~』は一言でいうと「時系列初めの一冊としてすごく良かった」です。時系列データが他のデータとどう違うか、前提として何が違うかから始まり、時系列データを扱う際の基本的な考え方、どういう手順を踏んで分析を進めていったら良いかという内容が順を追って非常に丁寧に解説されています。
正規分布や検定などの説明にも触れられているので、統計に詳しくなかったりデータ分析にほとんど馴染みがない読者に向けての配慮もあります。また、実際にデータを見ていきながら、これこれこういう結果が出たから次はこういう点を考慮しないといけないよね、それにはこんな方法があるんだよ〜というように手順を踏んで丁寧に解説されています。
時系列データ分析を取り扱ったことがない、何から始めていいのかわからない、という僕にはめちゃ勉強になりました。ただし、入門書と言っても1回読んだだけではすんなりとは理解できなかったので何度も読み返しながら理解を積み上げていきました。前に学んだことを前提にしながら話が展開していくので、曖昧な理解なまま読み進めていくと「なんでここに注目したの?」「なんで今この点を考えるの?」みたいな?の嵐になります 汗
こちらの書籍はRで解説されていますがRを知らなくても読み進められますし、時系列分析の考え方や基礎知識を身につける意味で大変勉強になりました。
書籍②『時系列解析: 自己回帰型モデル・状態空間モデル・異常検知 (Advanced Python)』
こちらの書籍②『時系列解析: 自己回帰型モデル・状態空間モデル・異常検知 (Advanced Python)』は、Pythonによる時系列データ分析について詳しく書かれている数少ない貴重な書籍です!!大変ありがたく、発売日も2019年9月7日と新しいですね(執筆現在)。
読み進めていると序盤の内容については、先に紹介した書籍①と非常に似ていた(内容構成と展開、文章が)ので、書籍①とセットで読み進めると理解しやすい印象がありました。時系列分析をPythonで解説されている点は非常に参考になりますし、書籍①では掲載がなかった状態空間モデルや異常検知についても触れられています!
Pythonのコードが充実している点は最高にありがたいのですが、数学や統計学にそれほど自信がない僕みたいな人間が、時系列分析入門の1冊目として選ぶと挫折する可能性が高いのは間違いありません。なぜなら書籍①に比べて数式、専門用語が多く出てくるので、書籍①よりは明らかに難易度が高いです。
数学や統計学に抵抗のない人なら、こちらの書籍から入門するのはありだと思います。
書籍③『時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装』
こちらの書籍③『時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装』は時系列分析について非常に丁寧に解説をしてくださっている書籍で、前述した僕のような前提がある人にとってはこの書籍③か、書籍①のどちらかが時系列分析の入門に良いと感じました。書籍③は、書籍①よりも内容が充実しており全体のページ数も多く、統計やデータ分析の基本を終えている人は書籍③がハマるはずです。
僕の場合は書籍①を読んで曖昧な理解だった内容が、この本(書籍③)を読むと理解が進むということがよく起こりましたしその逆ももちろんありました。
「こっちの書籍では理解できなかったけどこっちの書籍では理解できたよ」という現象はマジでよく起こるので書籍は複数買って損はありません(と個人的に思ってます)
また、理論の説明のための数式が書いてある一方で、数式を日本語に置き換えて表現してくださっていたり数式を読み飛ばしても内容がわかるように一冊を通じて配慮されているので何度も助けられました。
ちなみに、この書籍③の著者は非常に熱心でご自身のブログでも時系列分析に関する情報発信されています。Pythonによる時系列分析に関する内容も投稿してくださっているので、Rで書かれている本書と合わせて眼を通してかなり勉強になりました。興味のある方はこちらもどうぞ。
また、この書籍が他の時系列分析の入門書と比べた時にどのような立ち位置にあるのかについてもかなり詳細に説明してくださっているので、必要な方はこちらもご参考ください。
まとめ
さて、今回は時系列分析の入門書3冊に取り組んで感じたことをまとめてきました。改めて各書籍について見てみると、
- 統計の基本やデータ分析に自信がなかったりより平易さを重視
→『現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~』 - 数学に抵抗がなくてPythonによる時系列分析を学びたい
→『時系列解析: 自己回帰型モデル・状態空間モデル・異常検知 (Advanced Python)』 - 統計やデータ分析の基礎があって時系列分析を専門的に学んでいきたい
→『時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装』
ということでした。なお、ここまで記してきたことはあくまで僕個人の感想ですので、実際に書籍を読んでみて違う印象を持つ方もいらっしゃるかもしれません。なので必要に応じて本記事の情報を参考にしていただきながら、ご自身に合った時系列分析入門のやり方を見つけるのが良さそうです。
何事も楽しんで学べなければ苦しいばかりですので、自分ぴったりの教材が見つかるといいですよね!
P.S.
Pythonを用いた時系列データ分析の方法について、丁寧にまとめてくれているサイトがあります(英語)。こちらはとてもオススメです。
<参考>
・横内 大介 (著), 青木 義充 (著). (2014).『現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~』株式会社技術評論社
・島田 直希 (著). (2019).『時系列解析: 自己回帰型モデル・状態空間モデル・異常検知 (Advanced Python)』共立出版株式会社
・馬場 真哉 (著). (2018).『時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装』有限会社プレアデス出版
AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(実話)。
コメントをどうぞ
× 返り討ちに合う
○ 返り討ちに遭う
です。
通りがかりさん、修正しました。ありがとうございます。