Japan.Rに行ってきました

統計処理ソフトウェアのRの勉強会、Japan.Rに初めて参加してきました。

Rの知識はほとんどない状態で参加したのですがとても興味深かったです。

初心者なりに以下が勉強になりました。

  • RStudioという統合開発環境ツールがある
  • 予想以上にできることがたくさんあることが分かった
  • RStudio - Shiny-インタラクティブなWebアプリが作れる
  • データ解析はあくまでも手段であり、Whyが大事
  • サービスのレベルで解析手段は変わってくる

以下、各セッションのメモです。

Yahoo!ビッグデータからの景気動向指数の推測について
  • 5名でビッグデータレポートを作成している
  • 重回帰分析
  • step wise法
  • 2012年からの検索語:75億
  • 毎月使われる検索語:60万
実ビジネスデータへのRの活用とその限界

  • アドホック分析
  • 決定木
  • 地図のマッピング
  • 空間統計
  • 機械学習
  • ランダムフォレスト
  • ニューラルネットワーク
  • ロバスト回帰
  • アトリビューション分析
  • 前処理、分析、レポート
  • 情報が密(アンケート)⇒R
  • ECサイトの購買データ(スパース)⇒Rは厳しい

1.分析する対象について理解する
 - ドメイン知識はありますか?
 - なぜ分析が必要なのですか?
 - 正しい現状認識はできていますか?
 - データの意味や背景を理解していますか?
 - 問題は何ですか?

2.分析手法を適切に理解する
 1を経たうえで。。。
 - データは適切に前処理されていますか?
 - 問題を解決するに適した手法ですか?
 - パラメータ調整などは適切ですか?
 - アウトプットを理解できますか?
 - 正しく可視化できていますか?

3.分析結果に対して適切なアクションを行う
 1,2を経たうえで、、、
 - 仮説は正しく検証されましたか?
 - 適切なPDCAサイクルを構築できますか?
 - データドリブンな意思決定はできますか?
 - 組織やビジネスを変えることはできますか?

名著:人を動かすより
 1.盗人にも5分の理を認める
  避難や批判は益なしなのでやめよう
 2.重要感を持たせる
  相手を尊重しよう
 3.人の立場に身を置く
  相手の視点で考えよう

2013年のTokyo.R


その他にもRに関する資料がslidesharehttp://www.slideshare.net/にありました。

来年はTokyo.Rにも参加してみたいと思います。