#garagekidztweetz

#garagekidztweetz

id:garage-kid@76whizkidz のライフログ・ブログ!

データマネジメント 2014 にいってきたメモ〜アーリーバードセッション編〜

スポンサーリンク

f:id:garage-kid:20140313200911p:plain

データマネジメント 2014 にいってきたメモ〜総括編〜 - #garagekidztweetz で書いたとおり、まずはデータマネジメント 2014 のアーリーバードセッションのメモを公開します。

このエントリでカバーするのは以下の二セッションです。

  • 08:30-09:10 B-1 『マスタデータ管理(MDM)の効果と難しさとは? 〜データを資産に変える次の一手〜』 富士通
  • 09:15-09:55 A-2 『マスターデータ管理とデータガバナンスの基本と最新事情』 伊阪コンサルティング事務所

ちなみにセッション開始前に案内があったところによると、

  • アーリーバードセッション、今日のトピックの予備知識を得るためのもの
  • 月例の JDMC のセッションから人気のものを選んでいる

とのことでした。 ※今回のデータマネジメント 2014 でまともにデータマネジメントの話をしていたのはわたしが受けた中ではこのニセッションだけでした・・・

では、以降からが各セッションのメモです。


B-1 『マスタデータ管理(MDM)の効果と難しさとは? 〜データを資産に変える次の一手〜』 富士通

  • ようするに MDM とはなんぞや?

MDM の効果と難しさ

  • 基礎:定義、用語、由来
  • 効果:ビジネス貢献とシステム貢献
  • 難しさ

基礎

  • MDM とは何か
    • システムを使って仕事をするために
    • 事前の準備→マスタデータ(ヒト・モノ・カネ)
    • 仕事の結果→トランザクションデータ
  • 正しく、明確な「よいマスタデータ」
    • 正しい→間違いがない e.g. 6桁の販売管理 ID が 4 桁になってたらそれは間違い (0パディングしてなかった)
    • 明確→ただ一箇所 e.g. マスタに対してコピー先で定義を変えたりとかはしない
  • マスタデータをよりよいものをするために
    • MDM →マスタデータマネジメント
    • 人の活動と有能なツールでできている
    • システムが高機能になることで実現されてきた

MDMの形

  • MDM とは、ようはデータをつなぐ辞書、 翻訳ツールのこと
    • リポジトリ型
    • ハブ型
    • 分析型
    • チェーン型
  • リポジトリ型
    • A システムと B システムをつなぐ
    • マイナンバー等、同じマスタ同士の読み替え表
  • ハブ型
    • 親システムから変換して配信
    • 親システムと子システム
    • 親をもとにあたらしい子をつくる
    • ERP, ERP から SCM
  • 分析型
    • DWH 用
    • MDM は共通マスタをもち、データ集約時に使用する Global 企業
    • 海外企業同士を結ぶ真ん中にシステム、そこが各国共通語
    • A, B システムのデータを X システムに集めて翻訳、 DWH に格納
  • チェーン型
    • MDM の典型例
    • MDM はゴールデンレコードをつくり、システム間の翻訳を行う
    • マスタは集中しているので、そこで入力をして配信しようという考え
    • 分析型のガバナンス強化版

MDM のできた理由

  • 3つのモノの流れ
    • ヒト・モノ・カネ
  • MDM の登場から 2002 年から
    • SAP が使い始めた言葉
  • 基本的に経理に由来する
    • お金系 ERP → MDM (PIM: モノ系のマスタ, CDI:名寄せ) → データクオリティ:データ定義に沿っているか、データモデル:依存関係、ビッグデータ、データ連携:様々なアダプタ (ETL, EAI, ESB)
  • マスタの定義はおざなりになっていることが多いのが問題
    • MDM がホットになってきたのもここ2年くらい

主な用語

  • MDM の中核
    • ゴールデンレコード:どれが本当なんだ
    • リポジトリ:マスタデータの辞書と構造
    • データマネジメント:ルールを決める
    • データスチュワード:ルールを実行する
  • MDM の周辺
    • リネージュ(血統):コピーと引用の系譜、このデータはどこからひっぱってきたものか辿れる、トラッキング、トレース
    • サバイバーシップ(生存):独立マスタ対決、名寄せをイメージするとわかりやすい

MDM とビジネス貢献

  • ビジネス全般に効くということはない
    • ようは大事なのは、バランス
  • 初期導入大変、維持労力大
    • データ品質による顧客満足度の向上
    • データ品質の向上で効率が向上すると、システム運用コストが下がる
    • その結果として、時間短縮・情報活用ができてはじめてビジネス貢献になる
  • データ定義を確認する手戻りなどがなくなることによって、

事例:商品コード統合の取り組み

  • 企業により MDM の効果はケース・バイ・ケースといった表

3つの試練

  1. 開始の試練
  2. 予算が用意できない、ビジネス貢献は?
  3. 完遂の試練
    • データサイエンスでも手がでない、生データの試練
    • このデータどうやって使うの?知ってるのは作ってる人だけ
  4. 継続の試練
    • ITIL でも見落としがちな、自然劣化の試練
    • 人はかならず怠ける
    • 設計者ほど熱心に運用者はデータをいれなかったりする
    • 誰かがうるさく言い続けないといけない
    • (ようはどれだけ自動化するか、だろう)

発想の転換

  • スモールスタート + ビジネス目的明確化
  • 土管の太さから水の味へ
    • 人=データから情報へ
  • クレーム受付からガバナンスへ(攻めへの転換)

あらためて今 MDM のススメ

  • ツール機能は成熟
    • MDM の副次効果:保守・改修の効率化
    • ビジネスとシステムとの関係性強化に
Short Summary
  • MDM の基礎的な用語をカバーする入門的なセッション。
  • MDM 導入はなかなか困難を伴うということと、導入の効果は人次第。

A-2 『マスターデータ管理とデータガバナンスの基本と最新事情』 伊阪コンサルティング事務所

  • MDM & DG Summit 2013 NYC での発表を参考に
  • isaka@isaka.com に email いただければ資料は公表する
  • 今年 6 月にも日経系のイベントに参加する
  • MDM 2.0 という概念が発表されている。それが具体性を帯びてきている
  • DG の重要性がより増してきている
  • 今日は 24p のスライド
  • 関東圏であればいつでも話をしに行きます

伊坂コンサルティング事務所の紹介

  • 情報資産管理へ視点が移ってきている

なぜ今 MDM と DG が必要なのか

  • 5点
    1. データは常に不安定: M&A
    2. 多様なデータベース
    3. 常に急激にデータ増加
    4. マスタデータはすべてのプロジェクトに影響
    5. ???

情報管理の概念規定

  • データ+処理( Pride の定義)
    • データ管理(メタデータ、データコンテンツ、データモデル)
    • 情報管理(データ管理、処理モデル管理、処理プログラム管理)

MDM と DG はどう関係しているのか?

  • すべての関係者感に DG が必然
    • MDM は DG の中のひとつのアプリケーションだったときづいた
    • 日本はアメリカの 5 年遅れ
    • DG をちゃんとやらないと企業が合併したときにかならず問題になる

DG と MDM と DQ 間の概念規定

DG/MDM/DQ 評価を活用する目的

  • 業界内でそうあ知的位置づけの把握
    • 他社に対する優位性と弱点の明確化
    • 業務部門と IT 部門による課題の把握 (ロードマップの策定)

MDM の代表的なモデル

  • 共同型
  • 参照マスター型
  • マスターハブ型 (1,2)

MDM の実務的な定義 (1)

  • MDM
    • CDI : 人系のもの
    • PIM : 製品系のもの

MDM の実務的な定義 (2)

  • 複数エンティティ MDM
    • マスター参照データ管理 (RDM) : 全社共通で同じ指標を使う

MDM 実務的な下位の定義

  • オペレーショナル MDM
    • ...

MDM 1.0 成熟モデル

  • 成熟度を評価、フォレスター・リサーチによる
    • 成熟度と、適用技術・ツール、活用シナリオ
    • 成熟度をみて、導入するツールを決めようという話。ただし MDM 1.0

MDM1.0 と MDM2.0

  • ゴールデンレコードが MDM1.0
    • ゴールデン・プロファイルが MDM2.0
  • 極めて重要なデータが業務で使える状態になっていることをゴールデンレコードという
  • MDM1.0
    • 業務縦割り
    • 矯正的 WF
    • 部門別 DB
    • 内部データ
    • 構造データ
    • レコードのシステム
    • データ統合
  • MDM2.0
    • 事業視点
    • データガバナンス
    • 部門統合 MDM
    • 多様なデータ
    • 構造化と非構造化
    • 行動システム
    • 部門プロファイル
  • 特に重要なのは、Systems of Record (どのデータがあるかで行動を決める) から Systems of Engagement (そのデータに従い行動すべきか提示するシステム)

MDM2.0 ソリューション全体的方向性

  • マスター情報管理、特化
    • 複数プラットフォーム MDM 、一般化

MDM2.0 に関する調査結果

  • 非構造データに対する真剣な取り組み
  • 多様なエンティティ間の関係性と階層に焦点をあてる
  • ビッグデータの継続的な MDM と DG の両方を必要と解釈
    • マスタ管理されていないビッグデータは砂上の楼閣
  • もうクラウドはさけて通れない(コスト的に)
  • シングルビューと顧客の把握、納入業者の把握
    • 巨大企業は CDI と PIM を前提として RDM に関心が移行
    • 大手企業は複数ドメインを想定した MDM
    • DG は MDM を伴う相乗効果と共存関係

アジア太平洋地域における MDM 導入状況

  • 日本は 7 社
  • 中国 14
  • AU 25
  • 韓国 4

マクロ視点での MDM 市場傾向

  • 主要 MDM SW ベンダの各種 SW との統合
    • IBM, Infomatica, Oracle, SAP
    • ETL の上に MDM を中心とした SW 統合
  • ビッグデータ
    • データボリューム
    • 第三者参照データ
  • SNS
    • 非構造データ
    • 位置データサービスの急増

経営を揺るがす DG の 9種類の課題

  • 業務と整合性のない DG は業務目的と情報システム間の断絶が発生
    • 他 8 つ
  • IBM が公開

DG フレームワーク

  • フィットマンという人が公開した資料
    • 企業内主要目的
    • DG と データ管理の間にはデータスチュワード
    • 方法論とソリューション

IBM データガバナンス統合プロセス・モデル

  • 日経コンピュータ、 201312 号に掲載
    • IBM のサイトからタダでダウンロードできるが、違いは 0 番目として啓蒙をいれたこと

DG 統合プロセス手順と各参画者の役割と責任

  • 表:これは資料をもらって見たい
    • スニールさんの本

DG ロードマップ事例

  • DG 能力指標
    • こういったプロジェクト、長くて1年
    • 実現可能な目標をたてよう

評価・プロジェクト計画立案・実施プロセス

  • 方法論と成熟度モデルがすべての中核になる

DG とデータスチュワード組織

  • 大企業の例
    • EMC の方からいただいた表とのこと
    • 具体的な仕事は、安定するとデータクレンジングになる
    • 基本的に外注できないもの
  • EA
    • Enterprise Architecture
    • 実践と勉強してるっていうのは月とすっぽんくらい違う

提言

  • MDM の成功事例は国内外に数多く存在
    • 数百の海外事例
    • infomatica, infoteria さんが頑張ってる
  • 社内啓蒙がまずは大事
  • 業務部門がリーダシップをとり、データ管理を推進すべき
  • ビッグデータは MDM と DG を前提とすべき
Short Summary:
  • 一番、 MDM の内容がわかったセッション
  • isaka@isaka.com にメールして資料をいただこうと思う

では、アーリーバードセッションについてのメモは以上です。 次に、基調講演のメモを公開します。

ではこんなところで。

関連記事