データサイエンスと新しい金融工学
論文2018年春号
野村證券金融工学研究センター クオンツ・ソリューション・リサーチ部 饗場行洋、山本裕樹
目次
- I.ビッグデータの時代
- II.データサイエンスと金融工学
- III.ビッグデータとオルタナティブデータ
- IV.オルタナティブデータの活用事例
- AI 技術とSNSデータの統計への活用
- AIでテキストデータから情報抽出
- テキストから景況感を判断するAI
- AIの学習
- 学習精度の検証
- SNSテキストを指数化する
- (1)SNS × AI 景況感指数
- (2)SNS × AI 鉱工業生産予測指数
- V.おわりに
要約と結論
- 計算機科学の進展により、ビッグデータの蓄積と分析が可能になった。このことが計算機科学における、基礎理論と実装に次ぐ、第三の軸としての「経験主義(Empiricism)」の台頭、いわゆるデータサイエンスの隆盛の背景にある。
- データ分析にもとづいて仮説と検証を繰り返していくデータサイエンス研究対象は、金融経済現象にも当然のように広がっている。科学的なアプローチで経済金融現象を分析することにより、新たな金融工学の地平が切り開かれていく可能性がある。
- 伝統的に分析されてきた株価や財務情報といったデータに対して、衛星画像データやインターネット上のテキストデータなどは、非伝統的データという意味で、オルタナティブデータと呼ばれる。データ分析の落とし穴として、データサイズが大きければ大きいほど良いという錯覚があるが、重要なのはそのデータ分析によって初めて得られる知見であり、データの大きさではない。その意味で、オルタナティブデータの分析は大きな可能性を秘めている。
- 近年のディープラーニングをはじめとするAI技術の急速な発展で、従来に比べて非常に高い精度の分析が可能になってきている。本稿では野村證券が経済産業省の事業の一環として開発した「SNS × AI 景況感指数」と「SNS × AI 鉱工業生産予測指数」を例に、AI技術のオルタナティブデータへの活用例を具体的に紹介する。