Developers Summit 2018 Summer に行ってきたぞ!
毎回大盛況のDevelopers Summitが、7/27に東京で開催されました!
実は春も申し込んでいたのですが、運悪く社内行事と被ってしまい泣く泣くキャンセルしたのでした。
その分今回は気合いを入れて申し込……んだはいいものの、セッションが追加されるたび一瞬で満員に!
あまりの人気さに何度マウスを持つ手が震えたことか……結局事前予約取れなかった枠あるし……
そういう状況ですので、今回は畑違いの機械学習系セッションにも構わず突撃しております。
ちゃんとお話を受け止め切れているか自信がないぞ……?
参加者層は平日日中ということもあってかスーツのおじさま率が高めな印象。そして圧倒的男女比でした。
詳細についてはおそらくちゃんとしたライターさんが記事にしてくださるでしょう!(他力本願)
が、私からもいち参加者としての感想など、軽くお届けしていけたらと思います。
- ソニーが提供するディープラーニングの開発環境の紹介と活用事例
- AI時代におけるエンジニアの生存戦略
- Hashicorp Vault on Google Cloud Platform
- Alibaba Cloudで実現する、クラウド時代のデータ分析基盤の設計とその道のり
- ソーシャルゲームを分析せよ!〜社内分析チームの立ち上げから学んだデータ分析のための組織と技術
- EdTechトップランナーに学ぶ!幸せに生きるための学び方
- データと戦うエンジニアLT!
- その他
ソニーが提供するディープラーニングの開発環境の紹介と活用事例
朝イチはソニーの成平さんのセッション。こちらのツールをご紹介いただきました。
自分はAIわからないマンなので、初っ端にAIが今どういう状況なのかを説明いただいた段階でもうビックリ。画像認識の精度はとっくに人間を超えていて、今なお年率50%くらいの勢いで精度が向上しているとのこと。
昔と比べて扱いやすくもなり、ビジネス側の人がどんどんディープラーニング使い始めている状況だそうです。デモも拝見しましたが、確かにこれは非エンジニアでも余裕で触れそう!
ブログも日英両方で更新されるそうです。
日本語情報にアクセスしやすいのは、特に素人にとっては嬉しいところ。
ONNXにも対応しているそうなので、TensorFlowやらChainerやらをお使いの方も安心……かと思いきや、若干含みを持たせた口ぶりの成平さん。移行などを検討する場合は、事前にこの辺りはチェックした方が良さそうです。
個人的に気になったのは、「機械学習でモノを言うのはデータ量」「なんだかんだ力技」というポイント。
SoRの時代にどれだけのデータ資産を築いたかが、AIを使った施策に効いてくるという印象です。これは古くからきっちりIT投資して、データの蓄積を進めてきた大企業に有利なはず。
結びつけるのは乱暴かもしれませんが、昨今の銀行リストラ祭りの話が脳裏を過ぎります。安定を求めて入社した人の多い大企業ほど、AIの威力が高くてリストラが進むのでは……とか妄想していると、ちょっと皮肉な感じも。
あとソニーの人もGitHubでOSS活動とかやるんだなあ……みたいなヘンな感慨がありました。 国内のメーカー系ってその辺りなんとなく保守的な印象があったので。
AI時代におけるエンジニアの生存戦略
B会場で続けて受講。
パソナキャリアの高坂さんとDATUM STUDIOの安部さんによるセッションです。
大前提として日本のAI市場は人不足!
「Society5.0に対応するためには、AI人材の育成の抜本的な加速化が必要」
と言われているようです。
不勉強でSociety5.0はじめて知りましたが、これですかね。
とはいえ私のような門外漢からすると、「AI人材」ってどういう人材なのかがイマイチピンと来なかったりします。
Pythonで機械学習のコードを書いていて、最先端の機械学習の論文が読めて、統計の専門的な知識があって……みたいな、スーパーマンが頭に浮かびます。敷居が高い。
そこをバッチリ整理してくださったのが安部さん。
データサイエンティストに求められる要素は「ビジネス」「統計」「エンジニアリング」の3つあり、組織全体として3要素をカバーするのが基本、とのこと。
ただし専門分野が分かれると「無理解の壁」が生じがち……だとか。
従来の開発現場でも「ビジネス」と「エンジニアリング」のコミュニケーションに問題があるケースというのは多かったんじゃないかと思いますが、要素が増える分、チームビルディングには一層注意を向けていく必要がありそうです。
面白かったのが終盤の質疑応答コーナー。
高坂さんの質問に安部さんが答えていく、というスタイルで展開されたのですが、質問の内容が鋭い鋭い。
「今のAIってバブルなんじゃないの?」
「エンジニアの仕事すらAIに取って代わられるんじゃない?」
など、データサイエンティストにちょっと興味はあるけど先々続けられるか不安……という層にグッと刺さる内容でした。
Hashicorp Vault on Google Cloud Platform
ランチセッションは、クレデンシャル管理ツールVaultのお話を聴きにいきました。スピーカーはgrasysの守永さん。
正直現状のクレデンシャル管理にそこまで問題意識を持っていなくて、あんまりVaultの嬉しさが実感できてないです……
人の入れ替わりが激しい大規模プロジェクトとか、セキュリティ認証かなんかの関係でめちゃくちゃ監査が厳しいプロジェクトとかだと必要になってくるんでしょうか。
Vault関連の情報について、ブログでの発信を予定しているとのことでした。
ちらっとgrasysさんのブログ拝見した感じ、だいたい月イチ更新のようです。Vaultに限らずHashicorp製品に興味のある方は、たまにチェックしてみるといいことあるかもしれません。
サンドイッチの写真撮ったので載せときます。解像度がでかいwww
Alibaba Cloudで実現する、クラウド時代のデータ分析基盤の設計とその道のり
午後イチ……のセッションは取れなかったのでブースを冷やかしつつ休憩。
(立ち見する元気がなかった)
14:00からの枠はSBクラウドから、森さん、Haさん、井浦さんのセッションです。
気合の入った配布資料をいただいたので一瞬「会社説明会……?」とか思いましたが、ビジネス的な部分から、論文レベルの濃い技術ネタまで盛り込んだAlibaba Cloudの宣伝セッションでした。
国内大手ECサイト1年分のトランザクションを、たった1日で記録することもあるという中国のモンスターECサイト。それを支える技術ということで、分散FSの独自実装はじめ様々な工夫が凝らされている模様。
特にリソース管理とジョブスケジューリングを担当するFuxiについては詳しく説明いただきました。元論文これかな?幸い中国語ではなく英語なので、興味のある方はチャレンジしてみては。
http://www.vldb.org/pvldb/vol7/p1393-zhang.pdf
むかし社内でPaxosの話をした時にもちょっと思ったんですが、もしかして学生時代に研究室内部でやってたような論文紹介、社会人のエンジニア向けにやるのって需要ある……?
気になる性能、お値段、セキュリティですが、性能・コストパフォーマンスについては国際的なベンチマークでAWSなどの競合を差し置いてトップを叩き出しているとのこと。セキュリティ面も「マルチテナント設計思想」で、当局がデータを勝手に覗き見……なんてことはできないそうです。
出自が出自だけにビッグデータの取り扱いには特に力を入れているようで、BI・可視化ツールも提供しているとのこと。
もちろん多少のポジショントークはあると思いますが、これからクラウドの移行など検討する場合は十分候補に入ってくるのではないでしょうか。
(無料トライアルもあるそうですし)
資料は加工かかったツルツルの紙質だし、アンケートのお礼はえらいしっかりした手提げだし、さすがAlibaba儲かってんな、という下世話な感想を抱いてしまいました。
ソーシャルゲームを分析せよ!〜社内分析チームの立ち上げから学んだデータ分析のための組織と技術
続いてはgumiの今村さんのセッション。
パッと聞いてわかりやすいお話だったこともあり、内容についてはtogetterがいい感じにまとまっています。
病院の例えはいいですね。
社内分析チームと外部のデータ分析会社をどう使い分けるのか、端的に表す例えじゃないかと思います。
聞いていて感じたのは、社内分析チームが力を発揮しやすい組織とそうじゃない組織がありそうだ、ということ。
「直接的な成果になりづらく、空振りも多い」データ分析チーム。裏を返せば彼らを最大限活かすには、細かい施策を嫌がらず、失敗も許容する文化が必要なのではないでしょうか。
EdTechトップランナーに学ぶ!幸せに生きるための学び方
さて、来ました。個人的に今回、一番面白かったセッションです。
スピーカーはLoiLoの杉山さん。
「ロイロノート・スクール」というアプリを手がけていらっしゃいます。
自分はいち情弱ゆとり世代として、「アウトプットの大切さといい、積極的に仕事を取りに行く姿勢といい、社会人になる前後に学ぶべきマインドが多すぎる!」と常々頭を抱えているのですが……驚きました。
ご紹介いただいた学校の授業風景は、一目で「子供が主役」とわかる、ザ・アクティブラーニング。小学生のプレゼン動画見せてもらいましたが、信じられないくらい上手。
音楽の授業で自撮りしながら歌う風景はなかなかシュールでしたが……確かに録音してみてわかることもあるよね……
こういう教育を受けた子供達があと10年かそこらで労働市場に出てくるのかと思うと、楽しみな反面、脅威にも感じます。彼らとしっかり向き合っていけるように、自分自身も成長していきたいですね。
データと戦うエンジニアLT!
最後はLT!4名のスピーカーが登壇されました。
トップバッターは司会も務められたミーカンパニー田野口さん。
「ゴッド」っていう肩書きがずるいw
内容的にはMySQL UDFでデータを綺麗にする話。
手入力されたデータってたまにとんでもないの入ってますよね。
「MySQL UDFの裏側で普通のシステムが動く」みたいな話があり、面白かった反面、腕のいいアーキテクトがいない現場で使うとあっという間に黒魔術が生まれる気配を感じました。ご利用は計画的に。
2番手は犬塚さん。なんと学生さんです。
クックパッドで学生って聞くともうなんか凄腕っぽい気配がして震える。
クックパッドのレシピに紛れ込んだ「手順もどき」を検出した話。Deep Learningまでやらなくても、ロジスティック回帰で92%とか結果出たそうです。
「やるべきことを、やるべき順で」という言葉が印象的でした。
機材の不調で順番が入れ替わり、Reproの今井さんが次に。
機械学習の精度をビジネス的な価値にどう結びつけて行くかが重要だ、という当たり前だけど忘れやすい話をしていただきました。
AWS SageMakerはいいぞー、とのこと。
大トリはシルバーエッグ・テクノロジーから田本さん。
これ、すごかった。
単語レベルじゃなくて文字レベルのCNNを使って、誤字・脱字に強いネガポジ判定器を作った話。
何がすごいって、分かち書きの必要がないところ。
素人考えですが、漢字とか絵文字の多いデータセットではこのアプローチってすごく自然なんじゃ……?と思います。英語、日本語、中国語でどういう特徴が出るのかとか、めちゃくちゃ興味あります。
その他
嬉しかったのが、プリントオンデマンドの書籍が平積みで売ってるところ!
「ちょっとほしい……でも申込フォームとか書くほどのモチベーションは……ほら今月もう◯冊買ったしここは我慢を」
みたいな本が普通に売られているわけで、まあ買うよね。
流石に運営人数もしっかり確保されていて、ちょっとした困りごとにも丁寧に対応していただけました。
反省としては、やっぱ機械学習系のセッションは本職のデータサイエンティストの方が100倍楽しめただろうなという点。業界動向はじめ勉強になりましたが、予備知識が足りなかったのがとにかく悔やまれます。。
もし次の機会があれば、立ち見は承知で聞きたいセッションに突撃しようと思います!とりあえず前日深夜までお酒を飲むのはやめよう!!