今日(2016-02-18)はDevelopers Summit 2016 - Hack the Realに参加してきたので、参加したセッションのメモを別々のエントリで公開していこうと思う。
まず、本エントリのコンテンツね。
では、以降からがメモ。
【18-B-1】エンジニアなら使える深層学習 ~ TensorFlowやDataRobotで機械学習がもっと身近に / シバタ アキラ氏 [DataRobot, Inc]
- 自己紹介: @madyagi
- データロボット、会社紹介
- いまはまだステルス運営
- データサイエンティスト中心のメンバー構成
- トップ Kaggler が多数在籍している
- Pythian が多数
- PyData Tokyo のオーガナイザをしている
- 1,200 名ほどのメンバーが現状在籍
- 初心者向けのハッカソンも開催
- PyData Tokyo では開始当初から Deep learning を追ってきた
- 連載
- CodeZine
- CodeZine の記事がきっかけで今日のセッションをもつにいたった Google発の深層学習フレームワーク「TensorFlow」が一般エンジニアに与える可能性 (1/3):CodeZine(コードジン)
- 日経ビッグデータ
- CodeZine
- データロボット、会社紹介
- 今日お伝えしたいこと
- あなたも人工知能つかえます。つかってみてください。
- つかってみていただくことが重要
- そもそも人工知能って何?
- Deep learning アルゴリズムの画像処理の性能すごすぎ
- 機械って人間超えちゃうんじゃね?
- とりあえず、その辺の技術全般を指すパイプ言語としてバズる
- 人工知能を作ろうとする人増えてます
- もうすこしだけ正確に
- 人工知能>機械学習>深層学習
- 機械学習って何?→技術的にも mature に
- コンピュータアルゴリズムにパターンを学習させ、予測や識別などの問題を解かせること
- 種類
- 教師あり
- 教師なし
- 種類
- コンピュータアルゴリズムにパターンを学習させ、予測や識別などの問題を解かせること
- 機械学習への入力データと解ける問題
- 分類
- 2値分類
- 多値分類
- 回帰
- 連続値
- 時系列
- 数値x時間
- レコメンデーション
- 数値xアイテム
- クラスタリング
- 分類
- すでに広くのビジネスに応用されている
- 金融
- 与信
- 保険
- 事故に合う確率
- マーケティング
- クリック率
- キャンペーン効果
- 人事・採用
- マッチング
- 辞めそうか?
- スポーツ
- 打率
- ヘルスケア
- 再入院率
- 金融
- トラディッショナルな機械学習はどんどん進化している
- 研究者がアルゴリズムを書いて論文で発表
- 開発者がOSSライブラリでコーディングできるように
- エンドユーザ、ボタンを押すだけで誰でも使えるレベルへ(データロボット)
- Demo (データロボット)
- 写真は不可
- 自動的にいくつものモデルアルゴリズムを同時に実行させてデータセットに対する分析の結果を比較。
- 精度の高いモデルを自動で作成される?!
- 対象のモデルを利用するための REST の API も自動で作成される?!
- 精度の高いモデルを自動で作成される?!
- そもそも
- 深層学習ってなに?
- ニューラルネットワーク型アルゴリズムの隠れ層を多段にすることで、学習能力を高めたもの
- 学習方法
- オートエンコーダー
- Restricted Boltzmann Machine etc...
- 学習方法
- ニューラルネットワーク型アルゴリズムの隠れ層を多段にすることで、学習能力を高めたもの
- Shallow Neural Network
- Input > Linear Transformation > Hidden Representation > Linear Transformation > Hidden Representation > ... > Output
- 深層学習ってなに?
- 深層学習への入力データと解ける問題
- 入力データがより人間のそれと近いものへ
- ブーリアン
- 数値
- カテゴリ
- テキスト
- 音声
- 画像
- 解ける問題
- 分類
- 2値分類
- 多値分類
- 回帰
- 連続値
- 時系列
- 数値x時間
- レコメンデーション
- 数値xアイテム
- クラスタリング
- 分類
- 入力データがより人間のそれと近いものへ
- TensorFlow とは
- 深層学習の構築に必要な線形代数を表現し、GPUなどの分散処理技術を使って計算するためのライブラリ。
- エンジニアなら Python/C++ から「わりと」簡単に使える
- 応用例
- 手書き文字の認識
- 書いたりすることも?
- テキストのベクトル化
- 機械翻訳
- 自然言語のモデリング
- イメージ内にある物体の識別 etc....
- 手書き文字の認識
- Google の物体識別アルゴリズム Inception3 は Top5 正答率で世界最高精度、人間よりも精度が高い
- すでに TensorFlow で使える
- 深層学習の構築に必要な線形代数を表現し、GPUなどの分散処理技術を使って計算するためのライブラリ。
- Demo (TensorFlow)
- pip で TensorFlow をインストール
- Inseption3 (学習済みのモデル)をもってきて実行させてみる
- Google の TensorFlow のページにある
- GiantPanda の画像をデフォルトだと見に行くようになっていて、 GiantPanda だと答える
- 学習済みであるものについてしか答えられない
- TensorFlow もどんどん進化
- Deep Dream もちかぢか TensorFlow で使えるようになる
- 将来的にはボタン一つでポチッとレベルまでいくだろう
- 機械学習ができない人も問題を定式化できると多様なアイデアにつながる。
- ドメインナレッジを活用できるから。
- 世界の全員 x AI で膨大な問題を解決できる
- マー
- 月のクレーターから人の顔に似たものを探すとかいうネタ
- ドメインナレッジを活用できるから。
資料埋め込み
資料が公開されたらこちらに埋め込ませて頂く予定。
関連リンク
devsumi2016 でわたしがとってきた他セッションのメモ
のちほど他のエントリを書いたら更新する予定です。
garagekidztweetz.hatenablog.com
garagekidztweetz.hatenablog.com
garagekidztweetz.hatenablog.com