9
特集 30 富士ゼロックス テクニカルレポート No.22 2013 市場ビッグデータを活用したデータマイニンによる「TQMS-Uni」業務支援技術 Data Mining Technology Used for “TQMS-Uni” that Encourages Utilization of Big Data in the Market ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った 有線ブロードバンドでの高速通信から、スマートフォ ン等を使ったWi-Fi、LTEの高速無線通信に進化してい る。加えてクラウドによりリモートで大容量のデータ 蓄積が可能となった。結果、さまざまな大容量データ を取得、転送、保存できる環境が整ったが、その活用 が追い付かない状況が各企業の大きな課題になってき ている。このような背景から、現在ではビッグデータ をどのように活用していくかについて、 ICTベンダー挙ってコンサルティングを含めたソリューションを提 案している。そのビッグデータの活用において、中核 をなす技術として期待されるのがデータマイニングで ある。当社は、製品の保守におけるリモートメンテナ ンスを中心に、早々にこの分野に取り組み具現化して きた。今回は、その技術の変遷と、他社での展開トラ イアルの汎用性検証結果を説明する。 Abstract In the field of ICT, the words “big data” are being commonly mentioned these days. Communication infrastructure has diversified from wired broadband communication for desktop computers to wireless communication of high-speed data using Wi-Fi and LTE for mobile terminals. Additionally, various cloud services have enabled the storage of large quantities of data from remote locations. Although large quantities of data can now be easily retrieved, transferred, or stored, many companies are struggling to make good use of the massive amounts of data. In response to this situation, ICT vendors are offering consulting and solutions for the better use of big data, for which data mining technology is expected to be the core technology. Fuji Xerox has been working on this issue from early on, and has implemented its technology through remote maintenance. This report describes the advances made in our data mining technology and the results of a trial conducted with another company to verify the applicability of this technology to various businesses. 執筆者 高野 昌泰(Masayasu Takano研究技術開発本部マーキング技術研究所 Marking Technology Laboratory, Research & Technology Group

04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

30 富士ゼロックス テクニカルレポート No.22 2013

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術 Data Mining Technology Used for “TQMS-Uni” that Encourages Utilization of Big Data in the Market 要 旨

ICT分野を中心にビッグデータという言葉を目にす

る機会が増えてきている。通信インフラはPCを使った

有線ブロードバンドでの高速通信から、スマートフォ

ン等を使ったWi-Fi、LTEの高速無線通信に進化してい

る。加えてクラウドによりリモートで大容量のデータ

蓄積が可能となった。結果、さまざまな大容量データ

を取得、転送、保存できる環境が整ったが、その活用

が追い付かない状況が各企業の大きな課題になってき

ている。このような背景から、現在ではビッグデータ

をどのように活用していくかについて、ICTベンダーが

挙ってコンサルティングを含めたソリューションを提

案している。そのビッグデータの活用において、中核

をなす技術として期待されるのがデータマイニングで

ある。当社は、製品の保守におけるリモートメンテナ

ンスを中心に、早々にこの分野に取り組み具現化して

きた。今回は、その技術の変遷と、他社での展開トラ

イアルの汎用性検証結果を説明する。

Abstract

In the field of ICT, the words “big data” are being commonly mentioned these days. Communication infrastructure has diversified from wired broadband communication for desktop computers to wireless communication of high-speed data using Wi-Fi and LTE for mobile terminals. Additionally, various cloud services have enabled the storage of large quantities of data from remote locations. Although large quantities of data can now be easily retrieved, transferred, or stored, many companies are struggling to make good use of the massive amounts of data. In response to this situation, ICT vendors are offering consulting and solutions for the better use of big data, for which data mining technology is expected to be the core technology. Fuji Xerox has been working on this issue from early on, and has implemented its technology through remote maintenance. This report describes the advances made in our data mining technology and the results of a trial conducted with another company to verify the applicability of this technology to various businesses.

執筆者 高野 昌泰(Masayasu Takano) 研究技術開発本部マーキング技術研究所 (Marking Technology Laboratory, Research & Technology

Group)

Page 2: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術

富士ゼロックス テクニカルレポート No.22 2013 31

1. ビッグデータを使ったリモートメ

ンテナンス

1.1 ビッグデータの背景とその活用

データ通信分野における技術革新は、モデム

を使った環境からブロードバンドの環境に変わ

ることによって飛躍的に転送速度を向上させる

ことに成功した。現在は、固定された有線での

PC環境だけでなく、Wi-Fi、LTE等の技術革新

に支えられたスマートフォンやタブレット等の

パーソナルな環境においても高速の無線データ

転送が可能となり、これらの技術に支えられた

さまざまなサービスが実現されている。

データ転送に加えてデータ蓄積についても大

きな進歩があった。ハードディスクに代表され

る記録媒体は年を追うごとに大容量化、低コス

ト化が進んでいる。また、近年はクラウド技術

によってデータ蓄積を含むサービス全体につい

て外部から提供を受けることが可能となり、

データ蓄積やデータ利用のための物理的なサー

バーの運用や管理からも解放され始めている

(図1参照)。

しかしながら、このような大容量のデータが

蓄積され、高速にデータ転送できるようになっ

ても、そのビッグデータを有効に活用できる事

例はまだ少ない。1台ごとに行っていた処理を

10万台に適用できることがビッグデータの活

用ではなく、10万台なければ実現できない価値

を提供することがビッグデータの活用というこ

とができる。この活用のために注目されている

のが統計学をベースとしたデータマイニング技

術である。

1.2 リモートメンテナンスの機能分類

複写機、プリンター等にかぎらずリモートメ

ンテナンス、あるいは、リモート監視と呼ばれ

る機能は比較的古くから実現されてきた。これ

らの機能は、業務のカバー範囲の違いから図2

に示す通り大きく3つのステップに分けること

ができる。

最も基本的な機能は、「クリティカルな事象が

発生したことをリモートで伝える」というもの

である。たとえば、エレベータの非常通知ボタ

ン等が発展したものと考えればわかりやすい。

具体的には、終夜運転している発電所等の機械

の異常を24時間監視し、緊急事態の発生をその

機械メーカーに伝え、迅速に対策を取るような

ものである。この機能は、緊急事態をリモート

で監視される機械が検知できる場合には、それ

ほど難しいことはではない。

次のステップの機能は、「どこにトラブルの原

因があるのかをリモートで明確にする」つまり、

診断機能である。同一のトラブルが発生した場

合でも原因が異なる場合が存在する。複写機の

例でいえば特定の「紙詰まり」が多発した場合

に①消耗部材の摩耗、②紙搬送機構のダメージ、

③モーター、ソレノイド等のエレキパーツの故

障や断線、④制御ソフトウェアの不具合、⑤お

客様の操作間違い等、その原因は多岐にわたる

場合も多い。リモートメンテナンスとしては、

その原因を特定し適切な処置を行い、トラブル

の解消を行う必要がある。

3つ目のステップの機能は、トラブルの予兆

監視である。基本的にリモートメンテナンスで

は、機械の故障を直接防止することはできない。

サーバー

高速インフラ革新(ブロードバンド、Wi-Fi、LTE)記録装置革新(大容量メディア、クラウド技術)高速処理技術革新(高性能CPU、高速メモリー)

図1 データ活用をとりまく環境変化 Change in data usage environment

図2 リモートメンテナンス機能のステップ

Remote maintenance procedure

故障の発生を伝える

故障を予知する

故障の原因を特定する

1.基本機能

2.診断機能

3.予兆監視

Page 3: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術

32 富士ゼロックス テクニカルレポート No.22 2013

しかし、近い将来の機械の故障を予知すること

ができれば、機械の稼働時間外にメンテナンス

して未然に故障を防ぐことができる。これに

よって、機械が故障により稼働できない時間(ダ

ウンタイム)の発生を防ぐことができ、機械を

利用して頂いているお客様にとってもメリット

が得られる。また、メンテナンスする機械メー

カー側にとっても緊急対応ではなく、計画的な

メンテナンスとして実施できることで、スケ

ジュール全体としての最適化が可能となり、作

業効率が上がる。

2. ビッグデータの特徴と活用

2.1 同種類のビッグデータ活用

市場のビッグデータの特徴とその活用につい

て説明する。ビッグデータには同種類のデータ

が数多く存在する場合がある。このような場合

では、データの多さによる統計的手法での優位

さのメリットもあるが、同時にデータ収集およ

びデータ集計での煩雑さのデメリットも伴う。

消耗品の寿命予測等の精度を上げる場合に最初

に行われるのは、単回帰(図3参照)と呼ばれ

る1台の機械で自己完結する手法である。

リモート接続で複数の機械の消耗品データを

定期的に取得でき、説明変数と呼ばれる補正係

数に成り得るデータも同時に取得できるように

なると、重回帰と呼ばれる方法が適用可能とな

る。これは、複数の機械の消耗品に対して複数

の説明変数を選び出し、この複数の説明変数そ

れぞれへの補正係数を求めて補正を行い、全体

として最も誤差の少ないものを選んで補正を行

うというものである。ここで重要なのは、どう

やって全体として「最も誤差の少ないものを選

び出すか」ということである。当初は、データ

ベースからSQLにて選択取得し、CSVに加工し

た市場の消耗品データを市販のデータマイニン

グツールにて誤差との相関の高い説明変数を1

つずつ抽出して補正係数を求め、複数を組み合

わせていくという手法を用いていた。すべての

説明変数を任意の補正係数で組み合わせて、そ

の結果を確認するのは膨大な作業であり、1機

種1色の消耗品の補正に数カ月を要することも

あった。手法が複雑になればなるほど高精度に

なる可能性が上がる一方、その複雑さゆえに最

良の結果を得るために膨大な時間が掛ってしま

い、実用的でなくなってしまうというリスクが

存在する。この課題を解決するための施策とし

て、最適化についてはAIC(赤池情報量基準)

を採用した。AICは、モデルの複雑さとデータ

との適合度のバランスを取るために使用される

考え方である。重回帰分析にAICを用いること

によって、説明変数の自動選択と、選択された

説明変数の補正係数の自動算出を実現した。こ

れにより、トライ&エラーを繰り返し納期の予

測ができなかった従来の手動による最適化を自

動化することが可能となり、この種のデータマ

イニングを実用化することができた。

このように、同種類のデータを複数使用して

重回帰にて予測を行う場合に重要な項目として、

予測モデルを構築するためにどれだけのサンプ

ル数が必要なのかが挙げられる。従来は、手動

によってデータを抽出し、CSV等のファイルに

保存してデータ処理を行うことが一般的であり、

手動の制約から多くても100~200程度のサ

ンプルでモデルを構築する場合が多い。図4は、

サンプル数261で重回帰にて予測モデルを構

築し、その精度をヒストグラム化した例である。

本来は、正規分布に近い形になるのが理想であ

るが、部分的に形が崩れていることがわかる。

中央の紫の部分が目標精度範囲で全体の71%

の本数がこの範囲に入っている。

これに対して、図5は、同種類のデータのサ

ンプル数を増やし約20,000のサンプルで重回

帰の予測モデルを構築し、その精度をヒストグ

ラム化した例である。これほどのサンプル数に

なると、手動で抽出することもCSVファイルに

て管理することも難しくなり、専用のソフト 図3 単回帰による予測イメージ

Estimation based on single regression analysis

Page 4: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術

富士ゼロックス テクニカルレポート No.22 2013 33

ウェアによる処理が必要な場合が多い。

ヒストグラムを見ると、図4のサンプル数

261の場合と比較して、図5はより正規分布に

近い形となり目標精度範囲で全体の75%の本

数がこの範囲に入っており、精度がわずかに向

上していることがわかる。

このように、サンプル数261で作成した重回

帰 の 予 測 モ デ ル で あ っ て も 、 サ ン プ ル 数

20,000で作成した重回帰の予測モデルであっ

ても、サンプルデータを直接予測モデルに適用

した場合の目標精度範囲に入る割合は、71%に

対して75%と大きな差はみられない。

しかし、実際はサンプルデータを用いて作成

した重回帰の予測モデルを使って、そのサンプ

ルデータを取得した時期よりも先を予測するは

ずである。つまり、重回帰の予測モデル作成時期

より未来を予測するような使い方が想定される。

図6は、261本のサンプルデータで作成され

た重回帰の予測モデルを、それ以降の24,000

本に当てはめた場合の精度のヒストグラムであ

る。サンプル自身に適用した場合には、目標精

度範囲に71%入っていたが(図4)、それより先

の24,000本のモデルに適用すると、目標精度範

囲に入る本数は46%と大きく低下する(図6)。

それに対して、図7は、20,000本のサンプ

ルデータで作成された重回帰の予測モデルをそ

れ以降の24,000本に当てはめた場合の精度の

ヒストグラムである。サンプル自身に適用した

場合には、目標精度範囲に75%入っていたが

(図5)、それより先の24,000本のモデルに適

用したところ、目標精度範囲に入る本数は75%

とほとんど変わらない。

このように、同種類のデータによる重回帰等

での予測モデル構築について注意すべき点は、

モデル構築の際のサンプルデータ数である。説

明変数が数十個取得できるような場合に、デー

タ取得やデータハンドリングの容易性を理由に、

数百レベルのサンプル数でモデル化を行ってし

まうと、実際には予測精度が大きくばらつくこ

とになる。同種類のビッグデータを活用する場

合、統計的な精度向上のためには、重回帰モデ

ル構築に必要なサンプルデータ数を十分に確保

することが重要である。

2.2 異なる種類のビッグデータ活用

ビッグデータを活用するにあたり、異なる種

類の情報を組み合わせることで、価値を生み出

す場合がある。

たとえば、生産の出荷検査データと市場の稼

働データを組み合わせて、迅速にトラブルの原

因を解析し対応を行った事例がある。生産の出

荷検査において、ある日を境に日によっては未

発生もあるが、平均すると一日あたり数件の

フェイルが発生していた。発生の前日までに数

千台を出荷したが、そのフェイルが発生したこ

とはなかった。通常の処置としてフェイルが発

生した機械で再現実験を行ったが、このフェイ

ルは再現性がほとんどなかった。この場合、継

続監視の措置を取るのが一般的である。だが、

この機種の生産工程には、出荷検査時にすべて

図4 サンプル数261個の重回帰モデル Multiple regression analysis model for 261 samples

図5 サンプル数20000個の重回帰モデル Multiple regression analysis model for 20000 samples

図6 サンプル数261個の検証結果 Verification result for 261 samples

図7 サンプル数20000個の検証結果 Verification result for 20000 samples

Page 5: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術

34 富士ゼロックス テクニカルレポート No.22 2013

の機械のログを収集し、発生率で正規化し監視

するシステムが入っていた(図8参照)。このた

め、フェイル未発生からフェイル発生への変化

のタイミングを正確に把握することができた。

次に、フェイル発生のタイミングで変化があっ

たものを調査したところ、ソフトウェアのバー

ジョンアップを実施していたことが判明した。

そこで、同じフェイルの発生状況を、市場の稼

働情報を監視するシステムで調査したところ、

市場で数件の発生が確認されたフェイルのすべ

てが、市場で先行してソフトウェアのバージョ

ンアップを実施した機械で発生していた。フェ

イルの発生があったすべての機械について、

バージョンアップ前にはフェイルの発生はなく、

バージョンアップ後に発生していることを確認

した。この確認までをわずか数時間で行い、暫

定策を導入することができた。その後の調査で、

発生確率が低く再現性もほとんどないトラブル

の原因が特定されたため、早期の恒久対策実施

に至った。通常であれば見過ごされ経過観察と

なり、対策まで多くの日数がかかる可能性があ

るトラブルも、各種のデータを組み合わせるこ

とにより、数時間で解決した。

市場における機械の稼働情報と、市場でのお

客様の機械ごとのサービス履歴を組み合わせる

ことによって、価値を生む例もある。

市場の機械における時系列的な稼働情報は、

リモートメンテナンスのシステムにおいて毎日

取得することができる。しかし、この機械から

取得できる稼働情報には、機械が自ら認識でき

るものという制約が存在する。

機械自身が検知し、その発生を認識できる

フェイルであれば、問題なくその発生と説明変

数を送ることができる。ところが、画像の異常

や異音等のトラブルについては、その発生を検

知することができない。また、任意の機械の最

終的なフェイルの発生原因や、その対策および

効果についても直接検知することはできない。

しかしながら、まったく異なるシステムで管理

されているお客様の機械ごとのサービス履歴の

情報と組み合わせることで、トラブル全体を明

確にすることができる。

図9は、一度発生すると機械を動作不能にす

るクリティカルなトラブルではなく、紙詰まり

に代表される発生頻度によってクレームにつな

がるようなトラブルの検証例である。

横軸は、一定期間でのフェイルの発生件数で、

縦軸は、台数を示している。システム上に閾値

を持ち、一定以上のフェイルの発生でアラート

を生成するようなシステムを構築する場合に、

閾値の検証を行うことができる。この場合、実

際の棒グラフの青はフェイルの発生件数を示し、

赤はトラブルの訪問件数を表し、閾値を変えな

がら予兆の的中率等を検証することができる。

このように、従来独立して管理されていた異な

る種類の情報を同じ種類のように変換して使う

ことにより、新たな価値を生むケースがある。

異なる種類のビッグデータの活用に不可欠な

のは、データの連携である。うまく組み合わせ

て連携させるためには、データを加工して同一

のフォーマットとしてデータベース上に配置す

る必要がある。

このとき、機械から取得するログ、生産の出

荷検査データ、手入力によるサービス情報、ス

マートフォンによるトラブル音情報等多種多様

な情報をデータマイニングして価値ある情報に

変えるために、どのような共通のフォーマット

に変換しておくかが重要となる。

図8 正規化でのトラブル監視例 Data normalization for trouble monitoring

図9 機械フェイルとトラブルクレームデータの連携事例

Linkage between data on device failure and trouble complaints

Page 6: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術

富士ゼロックス テクニカルレポート No.22 2013 35

同種類のデータであれば、扱うサンプル数を

一定以上確保し、異なる種類のデータであれば

多種多様のデータを連携させる必要があること

が分かった。このような現状から、ビッグデー

タを活用するためには、この制約を満たす操作

性の良いシステムが不可欠である。

3. データマイニングプラットフォーム

3.1 データマイニング

一般的なデータマイニングの定義は、「単なる

データを、人々にとって価値があり判断の助け

になる情報に変える」というものである。図10

に示すとおり、データマイニングには、大きく

3つの技術要素が必要である。まずは、処理す

るデータあるいは処理する目的であるドメイン

知識、次に統計処理や多くのデータマイニング

手法等の統計・解析知識、そして、ビッグデー

タの時代に入り具現化に不可欠なソフトウェア

知識である。これらがバランスよく機能して、

実用的なデータマイニングを行うことができる。

また、先ほどの定義によると、異なる組織で

あれば目的も異なり同一のデータを用いても異

なるデータマイニングが必要となる。図11に、

一般的な機械メーカーの機能組織を示す。具体

的な例を挙げると、保守部門では、保守すべき

機械のシリアルナンバーやお客様名、そして、

保守すべき部品や作業内容の助けになる情報が

目的となり、全社の品質部門では、市場全台数

での時系列的な品質動向等が挙げられる。

このようなデータマイニングを行い、その結

果をタイムリーに要求部門に展開するためには、

運用のDBシステムを構築し、毎日取得される

データを特定のアルゴリズムで処理して情報を

提供しなければならない。この毎日の処理のア

ルゴリズムを構築するためには課題が存在する。

図12に運用DB上と一般的なデータマイニング

ツールの関係を示す。データマイニングは、デー

タの種類やデータ取得期間、解析手法を変えて

繰り返し実行する必要があり、処理負荷が大き

い。このため、運用DB上でデータマイニング処

理を実行することはできず、SQL等で選択的に

必要なデータを抜き出すことになる。少量の

データであれば、CSV等に変換して保持するの

が一般的であるが、ビッグデータの場合には困

難である。このデータに対して、前処理を行っ

た後に解析を実行していくのだが、通常は市販

のデータマイニングツールで解析を行うか、R

言語等のデータマイニング用のプログラム言語

で処理を行う。市販のデータマイニングツール

は、多くの解析手法を備えているが、運用DB

からのデータ選択処理の一連の作業工程の一部

しかカバーしていないため、処理の一部が手作

業となり業務効率が悪い。また、R言語等を使

用するには、統計解析とプログラミングの知見

が必要であり、誰でも簡単にできるわけではな

い。これらの知見を持たない人が、簡単にデー

タマイニングを効率的に行えるような環境が必

要である。そのためには、重回帰、AIC、クラ

スター分析、MT法、決定木等の解析手法の詳

細な知識を必要とせず、また、SQL等でプログ

ラミングすることなく、目的に応じたデータマ

ソフトウェア知識

高い演算能力を所有

ドメイン知識

対象領域のドメイン知識を所有

統計・解析知識

優れた解析技術を所有

図10 データマイニングの技術要素 Technological elements for data mining

保守品質管理

生産 評価 開発 生産

統合品質管理

図11 一般的機能組織 General functions in a company

図12 一般的なデータマイニングツールの適用範囲 Scope of application of a general data mining tool

MAIN 訪問情報

運用DB

SUB

予兆訪問

使用状況

予測日通知

パラメーター

アルゴリズム

選択 前処理 変換 解析1 解析2 検証 情報

Page 7: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術

36 富士ゼロックス テクニカルレポート No.22 2013

イニングに必要なデータを自動的に運用DBか

ら取得する機能を持たなければならない。図13

に示すように、一連のデータマイニング業務の

一部ではなく、広い範囲をカバーするような環

境が求められる。

3.2 データマイニングプラットフォーム

データマイニングの実用化における課題を解

決すべく、全体として図14に示すような運用

データベースと連動したデータマイニングプ

ラットフォームを構築した。従来は、お客様先

の機械と運用データベースで成り立っていたシ

ステムに、その検証過程および検証結果の表示

機能を含むデータマイニングプラットフォーム

を加えたものである。

データマイニングプラットフォームは、運用

データベースと独立しており、繰り返し実施さ

れるデータマイニングの処理が、運用データ

ベースに影響を与えない構成になっている。

データマイニングの実用化の課題である一連

の処理が、一部手動操作等で分断されることな

く実行できるよう、運用データベースからの選

択的なデータ抽出から解析検証までのシームレ

スな処理が連続して実施できる構成となってい

る。図15に例を示すが、重回帰、AIC、クラス

ター分析、決定木等の解析手法もR言語等のプ

ログラムではなくWebを使った対話形式で実

現できるような構成とした。

また、データ取得期間を変えて繰り返し行わ

れるデータマイニングを実施するにあたり、検

証過程や検証結果を図16に示す散布図やヒス

トグラムで表示する機能を付加している。機器

の開発者等が、このプラットフォームを使用し

てデータマイニングを実施すると想定した場合

に、このようなQC7つ道具等を使って表示す

ることによって、短時間に検証結果への理解が

深まり効率が上がった。手軽にQC7つ道具に

触れられ検証できることから、部門での問題解

決力向上のための講習にも応用されている。

データマイニングは、異なる機種や異なる機

能モジュールについて異なる種類のデータを使

い、異なる機能部門の目的のために実施される

ことになる。そのためには、それぞれのデータ

の運用データベースとは異なり、各種類のデー

タによらない汎用的なデータ構造に変換して管

理運用しなければならない。また、その目的に

応じて適用する解析手法も複数適用できる汎用

性が必要である。統計解析手法については、現

在も発展途中の分野であり、ビッグデータの普

及の影響もあって大学等での研究発表も多い。

各機能部門のワークフローに合わせた操作画面

→工数削減、新たな価値

DeliverFX-DM(データマイニングPF)

DB

予測アルゴリズム

解析手法選択

検証

解析1

前処理

予測パラメーター

解析2

Handling

Capture設計者が原因特定するための測定データ収集タイミングやアナログセンサー値にはWarningを設定

→トラブル原因の特定、予防保全の精度向上

MAIN

運用DB

SUB

使用状況

パラメーター

アルゴリズム

予兆訪問

予測日通知

選択

図14 データマイニングプラットフォーム全体構成図 Structure of the data mining platform

図15 データマイニングプラットフォーム上の決定木例

Decision trees on the data mining platform

図16 データマイニングプラットフォーム上の散布図例 Scatter diagram on the data mining platform

MAIN 訪問情報

運用DB

SUB

予兆訪問

使用状況

予測日通知

パラメーター

アルゴリズム

選択 前処理 変換 解析1 解析2 検証 情報

図13 データマイニングプラットフォームの機能図 Functions of the data mining platform

Page 8: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術

富士ゼロックス テクニカルレポート No.22 2013 37

目的に合ったよりよい精度の結果を得るため

には、この手法の部分をいかに充実させるかが

重要となる。本プラットフォームにおいても、

複数の大学の研究室や企業の研究所と情報交換

を行ったり、契約を締結し共同研究を実施した

りすることによって、この部分の充実を図って

いる。こうして構築発展させたプラットフォー

ムで事例を積み重ねていくことによって、目的

や分野ごとの標準的なデータマイニング手法を

確立していく。

4. 異業種への適用事例

社内向けのデータマイニングプラットフォー

ムを構築し運用を始めた頃に「お客さま共創ラ

ボラトリー」に出展することとなった。「お客さ

ま共創ラボラトリー」とは、「社内で実際に効果

のあったサービスを展示し、お客様の課題に対

して富士ゼロックスがお客様と共に解決してい

く」言行一致活動の1つである。みなとみらい

事業所の3Fに専用の展示ブースを設け、さま

ざまな業種のお客様とデータマイニング、リ

モートサービス、保守業務等について各企業の

抱える課題を議論することとなった。データマ

イニングの展示ブースは、製造業のお客様との

交流が多く、プラットフォームを発展させてい

くにあたり機能部門別のデータマイニングの目

的設定や検証方法を検討するのに大変役に立っ

た。共創活動は、展示ブース訪問の当日で終了

する場合もあるが、建機メーカーや自動車メー

カーの中には、半年程度の共同勉強会に発展す

る場合もあり、相互の課題や稼働情報の活用の

方法等について機密保持契約を締結して進めた

事例もある(図17)。

昨年度初め、展示ブースに「自社製品向けリ

モートサービスを導入したが、活用できていな

い」という課題を解決するために、富士ゼロッ

クスとは異なる業種のお客様が来社された。当

日のコラボレーションから非常に強い関心を示

され、その後半年程度の勉強会を両社にて実施

した。その検討の中で、製造業の機能部門別の

稼働情報活用に対する業務課題はほぼ共通であ

ることが分かった。そこで、富士ゼロックスで

運用されているデータマイニングプラット

フォームのシステムをそのまま導入する検討を

開始した。

当然ながら、そのメーカーでは運用されてい

る各種のデータは富士ゼロックスのものとは異

なるものであったが、機械から取得するトラブ

ル関係のログや保守に関する訪問内容の履歴、

生産での品質監視データ等、同種類の情報が多

いことが分かった。そこで、図18に示す通り

データ変換する仕様を決め、そのメーカー側で

この変換コンバーターを作成して頂きトライア

ルシステムの構築を行った。システムとしては、

そのメーカーの運用データベース直後でデータ

変換したことで、既存の富士ゼロックスのシス

テムを、ほぼそのままの形で流用することがで

きた。そして、2012年7月よりトライアルを

開始し、現在も継続中である。トライアルを実

施するにあたり懸念していたのは、事前の勉強

会にて業種が異なっても製造業であれば機能部

門別の稼働情報活用には大きな差がない結論で

あったものが、実際に運用してみた場合に、ユー

ザーである各機能部門に受け入れられるかどう

かであった。現在は、品質(図19参照)と保守

(図20参照)の部門にてトライアルを行ってい

るが、非常に高評価であり、細かな表示に対す

る変更要求はあるものの、システムを大きく変

更するような要求はなく、2013年度の本格稼

働にむけて対応すべき機能部門を増やしながら

活動中である。 図17 お客様共創ラボラトリー

Customer Co-creation Laboratory

:訪問情報

:診断ファイル異業種訪問履歴DB異業種機械LogDB

データマイニングPF

DB

予測アルゴリズム

解析手法選択

検証

解析1

前処理

予測パラメーター

解析2

機械Logコンバーター

訪問情報コンバーター

図18 異業種展開アーキテクチャー Architecture for application to different businesses

Page 9: 04 S4 高野 130204 K4 - Fuji Xerox...Encourages Utilization of Big Data in the Market 要 旨 ICT分野を中心にビッグデータという言葉を目にす る機会が増えてきている。通信インフラはPCを使った

特集

市場ビッグデータを活用したデータマイニングによる「TQMS-Uni」業務支援技術

38 富士ゼロックス テクニカルレポート No.22 2013

5. データマイニングプラットフォー

ムの今後の展開

クラウドやビッグデータの時代となり、大学

の研究室を含めさまざまな手法が研究され、進

化し続けているデータマイニング技術は、まだ

実用化されているとは言えない。現在は、経営

工学や品質工学の一部の研究者やデータベース

関係のソフトウェア技術者が、試験的に研究を

実施し、事例を発表している状況である。すで

に、企業が保有する運用データベースと連携し

たデータマイニングプラットフォームを構築し

てデータを一定レベルに抽象化し、シームレス

な環境を構築することでデータマイニングの解

析効率が大きく改善されることが分かった。ま

た、データを運用データベースそのままではな

く、一定レベルに抽象化してプラットフォーム

に乗せることで異なる企業で共創する場合でも、

データ作成のノウハウ等を隠ぺいすることがで

きる。このようなプラットフォームの特徴を生

かして、企業間あるいは企業と大学等の研究機

関の間で、機能部門ごとのサービスの標準的な

データマイニング手法や手法の組み合わせ手順

等を効率よく開発し、共用することができる可

能性がある。今後も共創ラボラトリーを利用し

た大学や企業との共創活動を通して、プラット

フォームをさらに発展させていきたい。

6. 商標について

TQMS-Uniは、富士ゼロックス株式会社の日

本国における登録商標です。

その他、掲載されている会社名、製品名は、

富士ゼロックス株式会社の登録商標または商

標です。

その他、掲載されている会社名、製品名は、

各社の登録商標または商標です。

7. 参考文献

1) 清嶋直樹, 川又英紀, 島田優子, “特集ス

マートな「神経」を作れ! 富士ゼロックス

のリモート監視システム「TQMS-Uni」”,

日 経 情 報 ス ト ラ テ ジ ー , No.228,

pp.32-35, (2011).

2) 鈴木和幸, 椿 広計, “次世代信頼性・安全

性情報システム(Ⅰ)-ICT活用による総合状

態監視-”, 第14回ISシンポジウム「信頼性

とシステム安全学」, (2010), pp.8-15.

3) COCN, “個人情報や企業を安全に活用す

るためのクラウドコンピューティング基盤

の整備 最終報告書”, COCN, (2011).

http://www.cocn.jp/common/pdf/th

ema30.pdf

4) 高野昌泰, 古川茂広, “TQMS-Uni による

稼働情報活用メンテナンス ”, オペレー

シ ョ ン ズ ・ リ サ ー チ , Vol.57, No.9,

(2012).

5) 内平直志, 西川武一郎, “製品安全情報共有

クラウド基盤の提案”, 第27回研究・技術

計画学会年次学術大会, (2012).

筆者紹介

高野 昌泰 研究技術開発本部 マーキング技術研究所に所属

専門分野:データマイニングアーキテクチャー開発

図19 異業種展開事例(品質部門) Example of application to different businesses(quality assurance)

図20 異業種展開事例(保守部門) Example of application to different businesses(maintenance)