2016-04-29

はじめに 昨年の秋ごろから、リクルートテクノロジーズの石川有さんらとともに共著で執筆していた「詳解 Apache Spark」 が遂に本日 4/29 に、技術評論社より発売となりました! なお、発売に先立って出版社および共著陣より献本させていただいた方々から、ありがたいことに書評や感想をいただいております。ぜひご購入の際の参考にしていただければと思います。 豊富な具体例,DataFrameの詳細な説明,Spark1.6で導入された機能の説明,統一感のある文体・構成など,データ解析者にも得るものの多い素晴らしい書籍でした!...

2016-03-08

追記: 2016-09-27 最新のビルド手順は こちら に記載しています。 いつのまにやら XGBoost のビルド手順が変更されていたので、メモしておきます (と言っても、 Installation guide に書いていることをほとんどそのまま日本語に直しただけですけどね)。 リポジトリの clone 手元に XGBoost の git リポジトリが存在しない場合は、以下のコマンドで submodule 含めて clone してしまいましょう。 git clone --recursive https://github.com/dmlc/xgboost もし手元にリポジトリが存在する場合は、 git pull したのちに git submodule init git submodule update として、submodule を手元に持ってきます。 XGBoost...

2016-02-09

2/5 (金) に開催された CROSS 2016 の「おーい、いそのー、エンジニアにとっての機械学習について考えようぜー!」というセッションにパネラーとして登壇してきました。セッションの内容はリンク先からの引用になりますが、 「機械学習は興味あるが、身に付けるためには何が必要?」 「機械学習を学ぶためにはいったい何からはじめればいい?」...

2016-01-15

僕は最近こんなお仕事をしているんですよー、という意味をこめて喋りました。 機械学習だけが「アドテク」じゃない。最適化も重要なんだよ、という気持ちで。 SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartNews Ads :...