データサイエンスと新しい金融工学

論文2018年春号

野村證券金融工学研究センター クオンツ・ソリューション・リサーチ部 饗場行洋、山本裕樹

目次

  1. I.ビッグデータの時代
  2. II.データサイエンスと金融工学
  3. III.ビッグデータとオルタナティブデータ
  4. IV.オルタナティブデータの活用事例
    1. AI 技術とSNSデータの統計への活用
    2. AIでテキストデータから情報抽出
    3. テキストから景況感を判断するAI
    4. AIの学習
    5. 学習精度の検証
    6. SNSテキストを指数化する
      1. (1)SNS × AI 景況感指数
      2. (2)SNS × AI 鉱工業生産予測指数
  5. V.おわりに

要約と結論

  1. 計算機科学の進展により、ビッグデータの蓄積と分析が可能になった。このことが計算機科学における、基礎理論と実装に次ぐ、第三の軸としての「経験主義(Empiricism)」の台頭、いわゆるデータサイエンスの隆盛の背景にある。
  2. データ分析にもとづいて仮説と検証を繰り返していくデータサイエンス研究対象は、金融経済現象にも当然のように広がっている。科学的なアプローチで経済金融現象を分析することにより、新たな金融工学の地平が切り開かれていく可能性がある。
  3. 伝統的に分析されてきた株価や財務情報といったデータに対して、衛星画像データやインターネット上のテキストデータなどは、非伝統的データという意味で、オルタナティブデータと呼ばれる。データ分析の落とし穴として、データサイズが大きければ大きいほど良いという錯覚があるが、重要なのはそのデータ分析によって初めて得られる知見であり、データの大きさではない。その意味で、オルタナティブデータの分析は大きな可能性を秘めている。
  4. 近年のディープラーニングをはじめとするAI技術の急速な発展で、従来に比べて非常に高い精度の分析が可能になってきている。本稿では野村證券が経済産業省の事業の一環として開発した「SNS × AI 景況感指数」と「SNS × AI 鉱工業生産予測指数」を例に、AI技術のオルタナティブデータへの活用例を具体的に紹介する。