プロセスマイニングの基本原理

clean eventlog sample

Very basic principle of process mining algorithm

プロセスマイニングを初めて知った方から、

「イベントログから、どうやってプロセスの流れを示すフローチャートが作成できるのですか?」

という質問をいただくことがあります。

イベントログからフローチャート、すなわち「プロセスモデル」を作成する「アルゴリズム」は極めて技術的な内容であるため、最も基本となるポイントのみを解説したいと思います。

より深く、正確に理解したい方は、Aalst先生の著作、『Process Mining: Data Science in Action』、およびeラーニング講座(Coursera)をご覧ください。

さて、プロセスマイニングツールによってプロセスモデルを作成するために必要なイベントログのデータ項目は、以下の3つです。

  • 案件ID
  • アクティビティ
  • タイムスタンプ

案件IDは、たとえば経理部門での請求書処理プロセスの場合だと、1枚1枚の請求書番号が該当します。所定のプロセスはどの請求書についてののものかを特定するために必要なので案件IDと呼ばれます。

アクティビティは、プロセスを構成する手順を示します。請求書処理であれば、たとえば、「請求書受領」を起点として、「OCR読み込み」、「OCR変換データ確認」、「会計システムへのデータ登録」、「発注金額との突合せ確認」、「上長への支払い承認依頼」といったそれぞれの手順です。

タイムスタンプは、上記各手順が実行されたタイミングを「年月日時分」などの形式で記録されたデータを会計システムから抽出します。

つまり、これら3つのデータ項目には、ある個別の案件に対して、どのようなアクティビティ(操作)がいつ行われたかという情報が含まれているわけです。

プロセスマイニングツールに投入可能な、整備済のイベントログサンプル

ここからが問題です。この3つの項目が含まれたイベントログから、どうやってプロセスの流れを再現するのでしょうか。単純化して言えば、プロセスの流れとしては、アクテイビティの時間的前後関係しか考慮していません。つまり、アクテビティ「A」と「B」の2つがあったとして、AがBよりも早い時間に行われていればA→Bと続く流れになるという、非常に明白なロジックです。

ただし、たくさんの案件を複雑な手順で行っている現実の業務においては、様々な処理のパターンが起こりえます。

わかりやすいように、タイムスタンプを省いて、以下のような4つの案件が含まれたイベントログからのフローチャート作成を考えてみましょう。

CASE_1 (A,B,C)
CASE_2 (A,B,D)
CASE_3 (A,E,C)
CASE_4 (A,B,C,B,C)

ここで、アルファベットは各アクテイビティであり、(A,B,C)のログは、A→B→Cという時間的順番で行われたことを意味します。

まず、CASE_1のログからフローチャートを描きます。

シンプルですね。

次に、CASE_1に加えてCASE_2も考慮します。

A→B→Cだけでなく、A→B→Dというパタンも存在したことがわかったので、BからCとDに分岐するフローチャートが描かれました。

さらに、CASE_1、CASE_2、CASE_3の3つの案件を考慮したフローチャートです。

Aに続くのはBだけでなく、Eが続く手順もあるのでこのようなフローになります。

最後に、CASE_1からCASE_4までのすべてを考慮したプロセスモデルは以下の通りです。

B→Cだけでなく、C→Bと戻る手順も存在していることがわかります。手戻り発生です。

以上の例では4案件だけでしたが、実際の業務プロセス分析では数万件、数十万件の案件のイベントログに基づいて、上記のようなフローチャートを再構成していくわけです。

非常に複雑なプロセスの場合、すべての案件のパリエーションを表すと、ごちゃごちゃしたスパゲッティのような図になります。

そこで、発生頻度の少ないバリエーションを非表示化していき、頻度の多いパターンだけに絞り込んでいけば、典型的な業務手順が見えてきます。

最も発生頻度の高いプロセスモデルのことを「ハッピープロセス」と呼ぶ場合があります。ただ、典型的なプロセスではあるものの、だからといって必ずしも優れた、理想的なプロセスとは限らないことを留意しておく必要があります。

以上、イベントログからプロセスモデルを作成する基本的な考え方について単純化して説明してまいりました。Aalst先生の著作やeラーニング講座によれば、ベントログからフローチャートを作成するアルゴリズムは、非常に難しい課題を抱えていることがわかります。

アルゴリズム自体、アルファ―マイナー、ヒューリスティックマイナー、インダクティブマイナーなど、何種類もあります。そして、用いるアルゴリズムによって、同じイベントログであったとしても描かれるフローチャートの形は異なってくるのです。

商用ツールでは、各社とも最も現実の手順を反映できると考える独自のアルゴリズムをそれぞれ提供していますが、仮に同じイベントログだったとしても、ツールによって提示されるプロセスモデルが異なっている場合があるということを頭に留めておく必要があるでしょう。

プロセスマイニングの不都合な真実(2)

steps from analysis to solution

Hidden truth of process mining(2)
English follows Japanese. Before proofread.

新しいITツールが登場したとき、何でも解決する万能ツールであるかのような幻想を抱く方がいらっしゃいます。

当然ながら、万能ツールは存在しませんし、そもそも、単なる道具ですから、ユーザーの使いこなしのスキルのほうがより重要なわけです。切れ味が最高に素晴らしい包丁があったとしても、包丁の扱いに慣れていなければ、食材をうまく調理できないのはおわかりになると思います。

プロセスマイニングツールも、もちろん万能ではなく単なる分析ツールです。そして極めて大事なことは、分析結果の中に「どうすればよいか」という解決策はないということです。それどころか、「なぜこんなに非効率なのか」、「なぜボトルネックが発生しているのか」という原因も、分析結果からはわかりません。

プロセスマイニングツールに限らず、BIなどの分析ツールによって発見できるのは、「問題の所在」にすぎません。イベントログから描き出されたフロー図、すなわち「as isプロセスモデル」を様々な切り口から分析することで、業務手順のどこに問題が所在するのか、容易に特定することはできます。

しかし、なぜ、そこで問題が発生しているのか、は分析結果は教えてくれないのです。問題の所在を深堀りすることで、問題を発生させている要因を絞り込んでいくことはできます。

たとえば、受注プロセス(O2C)において、受注から納期までのスループット(全体リードタイム)が期待よりも長すぎるという事実を把握し、それは「問題である」と評価したとします。そこで、プロセスマイニングツールを使って、さらに製品別、顧客別などで分析していくことで、どの製品を受注した場合に、あるいはどの顧客の場合に納期が長くなりがちなのか、といったことを突き止めることは可能です。

これは大変有益な情報ではありますが、依然として「なぜ、そうなのか」はわからないのです。「なぜ(Why)」を明らかにしたければ、いや、Whyを追及しなければ、有効な解決策は導けないのですが、現場担当者にヒアリングしたり、観察調査したりする必要があります。

プロセスマイニングを行う究極の目的は分析を行うことではなく、業務プロセスの改善やデジタルトランスフォーメーション(DX)の推進といった経営課題の解決のためでしょう。

ただ、分析手法としてのプロセスマイニングの直接的な目的は、「根本原因の解明」にあります。分析を実行し、問題個所を特定できたからといってすぐに改善施策を考えてはいけません。

たとえば、あるプロセスがやたら時間がかかりすぎている、つまり非効率だという問題が発見できたとします。じゃあ、RPAを導入して自動化すれば効率的になるよね、と安易な改善施策に飛びつく方がいらっしゃるのではないでしょうか。

そもそも、なんでそんなに時間がかかっているのか、現場担当者に聞いてみたら、RPA以前に、予定な手順を省くことで簡単に時間が短縮できた、ということがありえます。

ですから、分析ツールが答えを教えてくれる、という幻想を捨て、分析結果を得たあとは、現場に立ち戻り、泥臭く根本原因の解明に取り組まなければならないのです。根本原因がわかってこそ、対処療法ではない、有効な改善施策の立案が可能となります。

楽しておいしい果実は手に入りません。


As new IT tools emerge, some people have the illusion that they are a universal solution.

Of course, there’s no one-size-fits-all tool, and since it’s just a tool in the first place, user skills are more important. Even if you have a kitchen knife with the best sharpness, you’ll know that if you’re not used to using a kitchen knife, you can’t cook ingredients well.

Process mining tools are, of course, more than one-size-fits-all; they’re just analytical tools. Most importantly, there is no “What should I do?” solution in the analysis. In fact, the results of the analysis do not explain why “Why is it so inefficient?” or “Why bottlenecks?”.

What can be discovered not only by process mining tools, but also by analytical tools such as BI is nothing more than “location of the problem”. By analyzing the flow diagram drawn from the event log, that is, the “as is process model” from various angles, it is easy to identify where the problem lies in the business procedure.

But they don’t tell us why there’s a problem. By digging deeper into the problem, you can narrow down what is causing the problem.

For example, in the sales order process (O2C), you know that the throughput (overall lead time) from the sales order to the delivery date is longer than expected, and you rate it as “matter”. Using process mining tools, we can analyze by product, customer, etc. to find out which products or customers tend to take longer to deliver.

This is very useful information, but we still don’t know the “Why is that?”. If you don’t ask why, you won’t be able to come up with an effective solution, but you need to interview the person in charge of the site and do some observational research.

The ultimate purpose of process mining is not to conduct analysis, but to solve management issues such as improving business processes and promoting digital transformation (DX).

However, the direct purpose of process mining as an analytical method is to “elucidation of the underlying cause”. We should not immediately consider measures to improve the situation just because we have identified the problem areas through analysis.

For example, suppose you discover that a process is taking too long, or inefficient. So, I think there are people who would rush to take easy improvement measures, thinking that it would be more efficient if we introduced RPA and automated it.

In the first place, I asked a field representative why it took so long, and before the RPA, it was easy to save time by skipping the scheduled steps.

So once you get the results, you have to go back and try to figure out the root causes. Only when the root cause is known, it is possible to plan effective improvement measures, not superficial therapy.

プロセスマイニングとデジタルツイン

process mining and digital twin

Process mining can materialize a digital twin of an organization.
English follows Japanese. Before proofread.

「デジタルツイン」は、純粋なテクノロジーとしてはビジネスに適用範囲が限定されるものではありませんが、プロセスマイニングにおいては、「Digital twin of an organization」の略称です。

「Digital twin of an organization」は直訳すれば、「組織のデジタルな双子(片割れ)」となります。

一方、現実の職場、仕事は「アナログな双子(片割れ)」です。アナログな現場では、多くのスタッフが協働しながら業務を行っています。ただ、業務の多くがITシステムで遂行されるようになったことから業務内容がデジタルな足跡(Digital footprint)として残されています。

デジタルな足跡、すなわち「イベントログ」をプロセスマイニングで分析することにより、今まで見えなかった業務内容を可視化することができるようになりました。業務プロセスの流れはフローチャートとして”発見”できます。

プロセスマイニングによって、案件処理数や、アクティビティ単位の「処理時間(サービスタイム)」や前工程から次工程までの移行時間、すなわち「待ち時間(ウェイティングタイム)」なども算出可能であり、業務負荷の高い箇所、業務が滞留しているボトルネックの特定が容易になりました。

また、誰がどんな業務を担当しているのか、誰と誰が業務を通じて連携し、協働しているのかも明確に把握可能です。

重要な点は、ぼんやりとしかわかっていなかった業務の流れや処理件数、所要時間、協働関係などを事実(fact)に基づいて明確化できることです。プロセスマイニングによって見える化された各種のフローチャートや図表は、まさに、組織の在り方、業務内容をデジタルデータに基づいて再現した「デジタルツイン」だと言えます。

デジタルツインを実現するメリットは、現実をファクトベースで正確に把握できることだけではありません。デジタルツインであれば、一部の工程を削除したり変更したらどうなるか、あるいは一部のプロセスをRPAで自動化したら全体にどのような影響が起こるのか、シミュレーションが行えます。

すなわち、どのように業務プロセスを改善すれば、リードタイム短縮化、コスト削減、ボトルネックは解消できるのかを検証したうえで、アナログツイン、つまり実際の現場、現実のプロセスに展開することが可能です。

さらには、ITシステム上に記録され続けているイベントログをリアルタイムでプロセスマイニングツールに流し込めば、現場の業務遂行状況をデジタルツインにおいて監視し、問題点の即時是正が行えます。

以上でおわかりのように、プロセスマイニングは、デジタルツイン実現のために必要不可欠のツール、ソリューションです。


“Digital twin” is not limited to business as a pure technology, but in process mining, it stands for “Digital twin of an organization”.

The literal translation of “Digital twin of an organization” is “one digital half of twins of an organization “.

On the other hand, the other half is “Analog half of twins of an organization” where employees work together in the analog field. However, since much of the work is now performed by IT systems, the work remains as a digital footprints.

By analyzing digital footprints, or “Event Log” through process mining, it has become possible to visualize previously unseen business operations. The flow of business processes can be “discovered” as a flowchart.

With process mining, we can calculate the number of cases processed, the “Processing time (service time)” per activity, and the transition time from the previous process to the next process, i.e., the “Wait Time (waiting time)”, etc., making it easier to identify areas with high workload and bottlenecks with stagnant business.

In addition, it is possible to clearly understand who is in charge of what kind of work and who is collaborating and collaborating with each other through work.

It is important to be able to clarify, based on the facts, the flow of work, the number of processes, the time required, and the functions involved in collaboration that were only vaguely understood. The flow charts and diagrams visualized by process mining are truly “digital twin” that reproduce the way an organization works and the contents of business operations based on digital data.

The benefits of a digital twin are not just accurate fact-based reality. With a digital twin, you can simulate what happens if you delete or change some of the processes, or if you automate some of the processes with the RPA and see the overall impact.

In other words, after examining how to improve business processes to reduce lead time, reduce costs, and eliminate bottlenecks, it is possible to apply the method to an analog twin, that is, a real process.

In addition, by flowing the event log continuously recorded on the IT system into the process mining tool in real time, the work execution situation in the field can be monitored in the digital twin, and the problem can be corrected immediately.

As you can see, process mining is an essential tool and solution for achieving a digital twin.

プロセスマイニングの不都合な真実(1)

deta preparation overview

Hidden truth of process mining(1)
English follows Japanese Before proofread.

最近、業務改革の切り札としてプロセスマイニングに対する関心がますます高まっています。多くの人は、プロセスマイニングのデモで示される「プロセスモデル」、すなわち、イベントログから自動的に作成された業務フローチャート図を目にして「おおっ、すごい」と感嘆の声をあげます。

業務プロセスを可視化するための従来のアプローチであるヒアリングやワークショップの大変さと比較して、ITシステムから抽出したデータから簡単にすばやく業務フロー図が描けるのはすばらしい、と皆さんお感じになるわけですね。

ただ、何事にも明るい側面(Bright side)と、暗い側面(Shadow side)があるものです。プロセスマイニングツールを操作して、今まで見えなかった業務プロセスの流れや業務と担当者との関係が図表でわかりやすく示されるところは「明るい側面」です。一方、導入の心理的ハードルを上げてしまうために、あまり語られない「暗い側面」があります。

暗い側面は実は2つあります。プロセスマイニングツールを操作して実際の分析を行う段階の前に必要な業務である「データ前処理」、そして実際の分析の後に行う「分析結果の評価・解釈」の2つのフェーズです。

プロセスマイニングツールを操作して、ビジュアルな画面を切り替えるのは簡単で楽しいものです。一方、データ前処理、および分析結果の評価・解釈は多大な労力を要します。しかし、プロセスマイニングを通じて業務改革を成し遂げるためには避けて通るわけにはいかないフェーズ。このことは、プロセスマイニングの不都合な真実と言えるでしょう。

今回は、まず、プロセスマイニング分析の前工程である「データ前処理」について解説します。

プロセスマイニングの対象とする業務プロセスを決定したら、その業務プロセスを遂行しているITシステムから、必要なデータを抽出するわけですが、抽出されたデータ(生データ:トランザクションデータ)をそのままプロセスマイニングツールにアップロードすることはできません。

というのも、プロセスマイニングツールにアップロードするファイルは、ノイズなどが除去され、所定のデータ項目が揃ったクリーンなファイルに一本化する必要があるからです。

一般に、ITシステム内のDBから抽出されたデータは年度単位でファイルが分かれていたり、トランザクションファイルとマスターファイルが分かれていたり、データの抜け漏れ(ブランク)や文字化けがあったりと、要するに汚れたデータ、ダーティデータです。

このような複数(しばしば数十本)のダーティデータをクリーンにし1つのデータファイル=クリーンなイベントログに加工する作業が「データ前処理」です。

データ前処理をどのように行うかの説明は別記事で取り上げますが、例えば、ブランクが存在するデータについては一括削除したり、なんらかの補正値を入力したりします。こうした前処理作業を数十万~数百万件の生データに対して行うため、基本的にはデータ前処理のためのツール「ETL」を用います。

ETLはExtract, Tranform, Loadの頭文字を取ったものですが、文字通りデータ抽出からデータ変換(加工)、他のツールへのアップロード、さらには分析機能も持つ多機能なツールですが、プロセスマイニングにおいてはもっぱらデータ変換(加工)に活用します。

私がお勧めしているETLは、「KNIME(ナイム)」というオープンソースのツールです。日本語ローカライズはされていませんが、なんせ無料ですし、直感的な操作を行うことができる非常に優れたツールです。

KNIMEであれば、様々なデータ加工をノンプログラミングで行うことができるため、エンジニアでなくともデータ前処理を実行可能です。もちろん、エンジニアの方がデータ前処理を行うのであれば、SQL、Python、Rなど得意なスクリプトでデータ加工処理を行えば、KNIMEより高速に処理ができるでしょう。

データ前処理の基本的な流れ

データマイニングプロジェクトでは、しばしば、データ前処理にプロジェクト工数の8割ほどが費やされると言われますが、プロセスマイニングプロジェクトでも同様に、データ前処理がプロジェクト成功の鍵を握っています。きちんとしたデータが準備されてこそ、プロセスマイニング分析、また分析結果の評価・解釈が意味のあるものになるからです。


Recently, there has been increasing interest in process mining as a trump card for business innovation. Many people marvel at the “process model” shown in the process mining demos, or business flow charts automatically created from event logs, saying, “Oh, my God.”.

In contrast to the challenges of traditional approaches to visualizing business processes such as interviews and workshops, you find it great to be able to draw business flow diagrams easily and quickly from data extracted from IT systems.

But everything has a bright side (Bright side) and a dark side (Shadow side). When you operate the process mining tool, the flow of business processes and the relationship between business and the person in charge, which has not been seen until now, are shown clearly in the diagram, is “bright side”. On the other hand, there is a “dark side” that is rarely talked about because it raises the psychological hurdle of introduction.

There are actually two dark sides. There are 2 phases: “data preprocessing” which is the work required before the stage of operating the process mining tool and performing the actual analysis, and “Evaluation and interpretation of analysis results” which is performed after the actual analysis.

It’s easy and fun to navigate through process mining tools and switch between visual screens. On the other hand, data preprocessing and the evaluation and interpretation of analysis results require a great deal of labor. However, this is a phase that cannot be avoided in order to achieve business reform through process mining. This is an inconvenient truth of process mining.

In this article, I will first explain “data preprocessing” which is a pre-process of process mining analysis.

Once a business process to be subjected to process mining is determined, necessary data is extracted from the IT system executing the business process, but the extracted data (raw data: transaction data) cannot be directly uploaded to the process mining tool.

This is because the files to be uploaded to the process mining tool need to be unified into a clean file with all the necessary data items.

In general, the data extracted from the DB in the IT system is dirty data or dirty data, for example, the file is divided by the year, the transaction file and the master file are separated, and there are omissions of data (Blank) and garbled characters.

“data preprocessing” is the process of cleaning such multiple (Often dozens) dirty data and processing them into 1 data file = clean event log.

We’ll discuss how to do this in a separate article, but for example, you might want to delete all data with blanks or enter some correction. To perform these preprocessing operations on 100,000 to 1 million raw data items, a data preprocessing tool “ETL” is basically used.

ETL, which stands for Extract, Tranform, and Load, is a multi-functional tool that literally extracts data, transforms it (Machining), uploads it to other tools, and even provides analysis capabilities, but is used exclusively for data transformation (Machining) in process mining.

The ETL tool I recommend is an open source one called “KNIME”. It’s not localized in Japanese, but it’s free and very intuitive.

KNIME can perform various data processing without programming, so even non-engineers can perform data preprocessing. Of course, if your engineers preprocess data, they can do it faster than KNIME by using SQL, Python, R, or other scripts that you’re good at.

In data mining projects, it is often said that data preprocessing consumes about 80% of the project effort. Process mining analysis and the evaluation and interpretation of analysis results become meaningful only when proper data is prepared.

プロセスマイニング入門(0)目次

Introduction to Process Mining (0) Table of Content

プロセスマイニングの歴史から理論的背景、世界・日本のトレンド、事例、導入の具体的手順など幅広く解説していきます。現在の構成(目次案)は以下の通りです。お楽しみに!

プロセスマイニングとは? – What is process mining

プロセスマイニングの歴史 – History of process mining

プロセスマイニングが必要とされるビジネス環境 – Business environments which necessitates process mining

プロセスマイニングの効用 – What process mining can deliver

プロセスマイニングの適用範囲 – Application areas of process mining

プロセスマイニングと関連ソリューション – Process mining and related solutions

イベントログとは – What is a event log

プロセスマイニングのアルゴリズム – Process mining algorithm

プロセスマイニングの4つのアプローチ – Four approaches of process mining

プロセスディスカバリー – Process discovery

コンフォーマンスチェッキング – Conformance checking

プロセスエンハンスメント – Process enhancement

運用サポート – Operational support

プロセスマイニング事例 – Use cases

プロセスマイニングプロジェクトの進め方 – How to manage a process mining project

プロセスマイニングツール – Process mining tools

プロセスマイニングの展望 – Outlook for the future of process mining

プロセスマイニングツール比較検討のための「機能チェックリスト」

function checklist preview

Checklist for functionalities of process mining tool

現在、世界各国でプロセスマイニングに取り組む企業・組織がどんどん増えています。

プロセスマイニングはビッグデータ分析であり、イベントログから、業務手順を再現したフローチャート(プロセスモデル)を作成するためには特殊なアルゴリズムが必要です。このため、一般的なBIツールではなく、プロセスマイニングツールを利用することが求められます。

今のところ、世界には30以上のプロセスマイニングツールがあり、うち、ガートナーのマーケットガイド(2019年版)では、代表的なプロセスマイニングツールとして19個のベンダー・ツールが紹介されています。

日本においては、「データ前処理支援」など、プロフェショナルサービスなどを含めて利用可能なプロセスマイニングツールは現在数種に限定されます。しかし、日本のプロセスマイニング市場も立ち上がりつつあることから、様々なベンダーが日本でのツール提供を開始することでしょう。

さて、プロセスマイニングツール導入を考えているすユーザー企業として悩ましいのは、どのツールがどんな機能を備えているかを確認し、比較検討することが大変だということでしょう。

プロセスマイニング・イニシアティブでは、できるだけ中立的な立場で各種ツールの比較検討をお手伝いできますが、まずは検討対象のプロセスマイニングツールがどんな機能をどの程度備えているかを記述するための「プロセスマイニングツール機能チェックリスト」を無料提供しています。当チェックリストをぜひ欲しいという方は、お問い合わせフォームから、「機能チェックリスト希望」と記入してご連絡ください。折り返し、PDF版をメール添付にてお送りします。

機能チェックリストに掲載している機能項目は以下の通りです。

プロセス発見 – Process Discovery
 頻度分析 – Frequency Analysis
 パフォーマンス分析 – Performance Analysis
 バリアント分析 – Variant Analysis
 フィルター – Filtering
 比較分析 – Comparison Analysis
適合性検査 – Conformance Checking
基本統計量表示 – Process Intelligence(Basic Statistics)
KPI設定 – KPI setting
カスタマイズダッシュボード作成 – Dashboard customization
運用サポート – Operational support
BPMNモデル変換・作成 – BPMN modeling
シミュレーション – Simulation

プロセスマイニング関連ツールの位置づけを整理整頓する!

work place analytics overview in english

Positioning of process mining-related tools from Workplace Analytics perspective
English follows Japanese. Before proofread.

「プロセスマイニング」は1990年代末に誕生し、昨年、20歳の誕生日を迎えたばかりの新しい分析手法ですが、2019年には新たに「タスクマイニング」という概念が登場しました。

当記事では、プロセスマイニング、タスクマイニングに、これらのソリューションと類似のソリューションである「SIEM:Security Information and Event Management」を含めて、狙いや位置づけの違いを整理整頓してみたいと思います。

まず、プロセスマイニングとタスクマイニングの違いについて。簡単に説明するなら、分析対象となるデータが異なります。

プロセスマイニングは、ERPやCRM、SFAなどの業務システムに記録・蓄積されたイベントログ(トランザクションデータ)を抽出したものが分析対象です。記録されているデータは、「購買申請」、「購買承認」など、システムの「送信」や「更新」ボタンを押下したタイミングの活動が基本で、業務の「節目(マイルストーン)」だけの粒度の粗いものです。

一方、タスクマイニングは、従業員が各自操作するPC上での詳細な操作、具体的には、アプリの起動、ファイルオープン、マウスクリックやコピー&ペーストなどが記録された「PC操作ログ」が分析対象となります。業務システムから抽出されたイベントログと比べると、これ以上分解できない「アトミック(原子的)」な詳細データであり、タスクレベルでの分析が可能です。なお、こうしたPC操作ログは、どこかに記録されているものではないため、分析対象となるPCに、センサー、あるいはエージェントと呼ばれるソフトをインストールして、能動的にPC操作をデータとして捕捉、収集サーバに蓄積する仕組みが必要となります。

プロセスマイニング、タスクマイニングに隣接した類似ソリューションに「SIEM」があります。これは、セキュリティ機器、ネットワーク機器、およびサーバに残されている各種ログを分析することで、サイバーアタック、データ漏洩などのセキュリティに関わる問題を発見する、また、IT機器の資産としての管理を行う、といったことが目的になります。

さて、これらのソリューションは、基本的に「職場(ワークプレイス)」で発生しているデータを分析することから、大きくは「ワークプレイスアナリティクス(Workplace Analytics)」という枠組みに入れることができるでしょう。

それでは、ワークプレイスアナリティクスの枠組みで、プロセスマイニング、タスクマイニング、SIEM、およびそれぞれのキーソリューションを位置付けてみましょう。(下図参照)

図の下部の両矢印あたりをご覧ください。プロセスマイニングは「プロセス改善志向」であり、一方、「SIEM」は、「リスク回避・管理志向」です。タスクマイニングその中間に位置しています。なぜなら、タスクマイニングでは従業員の日々の業務内容全体を把握できるため、勤怠管理にも活用できるからです。(プロセスマイニングは、業務システム上で行われた操作だけのデータが分析対象のため、一日の業務全体を把握することはできません)

また、プロセスマイニングとタスクマイニングは、「プロセスインテリジェンス」という枠組みで囲むことができますが、SIEMは、「プロセス」を分析対象とはしていないため、含まれません。

そして、プロセスマイニングは、企業全体のプロセス改革やデジタルトランスフォーメーション(DX)の視点からのアプローチに有効であることから「DX志向」、一方、タスクマイニングは、最終的にはタスクレベルでの自動化であるRPAを目的とすることが多いため、「RPA志向」と言えるでしょう。

では、それぞれのカテゴリーのキーソリューションを見ていきましょう。現時点(2020年2月)において、日本のプロセスマイニング市場のキープレーヤーは、CelonoisとmyInvenioの2つ。両ツールとも豊富な機能と優れた操作性を備えたエンタープライズソリューションであり、大企業を中心に導入企業が増えています。そしてつい最近、両ツールとも「タスクマイニング機能」を追加しています。業務システムからのイベントログデータだけでなく、PC操作ログからのフローチャート(プロセスモデル)も作成可能とすることで、タスクレベルでの自動化を目指すRPA化に必要な分析ニーズに対応したものだと言えるでしょう。

タスクマイニングのカテゴリーでは、myInvenioの日本総代理店であるハートコアが、「Heartcore Task Mining」を提供。また、銀行業界を中心に導入実績のある「MeeCap」は、ERPなどからのイベントログも分析するプロセスマイニング機能へと拡張を始めています。

SIEMカテゴリーでは、Splunkや、Skysea Viewが知られていますが、SPlunkが、プロセスのフローチャート機能を追加してきています。ただし、イベントログを取り込んだ分析までは行えないようです。

以上、ワークプレイスアナリティクスの枠組みでプロセスマイニング、タスクマイニング、SIEMの目的や位置づけを整理整頓してみました。

職場の業務改革のための各種ソリューション比較検討の参考になれば幸いです。


“Process mining” was born in the late 1990s and last year turned 20 years old. In 2019, a new concept called “task mining” appeared.

In this article, I would like to organize and sort out the differences in purpose and positioning, including “SIEM: Security Information and Event Management”, which is a similar solution to process mining and task mining.

First, the difference between process mining and task mining. In simple terms, the data to be analyzed is different.

Process mining analyzes the event logs (transaction data) recorded and accumulated in business systems such as ERP, CRM, and SFA. The recorded data is based on activities such as “purchase request” and “purchase approval” when the “send” or “update” button of the system is pressed, and the granularity of only the “milestone” of the business Is a rough thing.

On the other hand, task mining analyzes the detailed operations on PCs that employees operate individually, specifically, the “PC operation log” that records application launches, file opens, mouse clicks, copy and paste, etc. Eligible. Compared to the event log extracted from the business system, it is “atomic” detailed data that cannot be further decomposed and can be analyzed at the task level. Since these PC operation logs are not recorded anywhere, install software called sensors or agents on the PC to be analyzed and actively capture and collect PC operations as data. A mechanism to accumulate on the server is required.

“SIEM” is a similar solution adjacent to process mining and task mining. It analyzes security logs, network devices, and various logs remaining on servers to find security-related issues such as cyber attacks and data leaks, and manages IT devices as assets. And so on.

Now, since these solutions basically analyze data generated in the “workplace”, they can be broadly put into the framework of “Workplace Analytics”.

Now let’s position process mining, task mining, SIEM, and their key solutions within the framework of workplace analytics. (See the figure below)

Look around the double arrow at the bottom of the figure. Process mining is “process improvement oriented”, while “SIEM” is “risk aversion and management oriented”. Task mining is located in the middle. This is because task mining can be used for attendance management because it allows you to understand the entire daily work of employees. (In process mining, since only the data of operations performed on the business system is the analysis target, it is not possible to grasp the entire business of the day.)

In addition, process mining and task mining can be surrounded by the framework of “process intelligence”, but SIEM is not included because “process” is not analyzed.

And process mining is “DX-driven” because it is effective for process reform of the entire company and approach from the viewpoint of digital transformation (DX), while task mining is ultimately an automation at the task level Because it is often aimed at a certain RPA, it can be said that it is “RPA-driven”.

Let’s look at the key solutions in each category. At this time (February 2020), two key players in the Japanese process mining market are Celonois and myInvenio. Both tools are enterprise solutions with rich functions and excellent operability, and the number of enterprises, especially large enterprises, is increasing. And recently, both tools have added a “task mining function”. By being able to create not only event log data from business systems, but also flow charts (process models) from PC operation logs, it can be said that it meets the analysis needs necessary for RPA to aim for task-level automation Will be.

In the task mining category, heartcore, myInvenio’s sole agent in Japan, provides Heartcore Task Mining. In addition, MeeCap, which has a track record of introduction in the banking industry, has begun to expand to a process mining function that analyzes event logs from ERP and other sources.

In the SIEM category, Splunk and Skysea View are known, but Splunk has added a process flowchart function. However, it seems that analysis cannot be performed until the event log is imported.

プロセスマイニングツール – 日本 Feb2020

Available process mining tools – Japan Feb2020

当記事では、2020年2月時点で、日本において利用可能なプロセスマイニングツールをご紹介します。

留意していただきたいことがあります。「ツールを利用する」ということだけであれば、日本に拠点や代理店がなかったとしても、直接ベンダーに連絡すればライセンス購入可能です。しかし、プロセスマイニングツールは高度で複雑なツールです。「ちょっとお試し」、だったとしても残念ながら、そう簡単には使いこなせません。

そもそも、業務プロセス改善を目的とする「プロセスマイニングソリューション」の観点からは、ツールの操作方法の最低限のトレーニングに加え、データ前処理、分析結果の解釈など、専門性の高い人材が不可欠です。

多くの企業では、自前の人材だけでプロセスマイニングを導入して成果を出すことは難しいと思いますので、日本企業に対して、ツール操作トレーニング、データ前処理支援などのプロフェッショナルサービスを併せて提供してくれる代理店なりコンサルティング会社の存在があるツールのみをここではご紹介します。

とういうわけで、現在日本において、比較検討が可能なプロセスマイニングツールは以下の4つです。なお、以下は公開された情報に基づいています。ここに掲載がなく、「当社のツールも日本での販売開始してます」「うちも代理店として扱ってるよ」という会社様はお知らせください。

セロニス(Celonis)

日本法人あり。アビームコンサルティングなど、大手コンサルティング会社とグローバルなアライアンス契約を結んでいる。日本語ローカライズ中。

→ Celonis

マイインベニオ(myInvenio) 

独占販売契約を結んでいるハートコアがライセンス販売に加え、トレーニングをはじめ、各種プロフェショナルサービスを提供。日本語ローカライズ済。

→ ハートコア株式会社(日本総代理店)

シグナビオ(Signavio)

イントラマート社が、Signavio Process Miningを活用した「DXアプローチメソッド」を提供。日本語ローカライズ状況不明。

→ 株式会社NTTデータ イントラマート(パートナー契約)

アビー・タイムライン(ABBYY Timeline)

OCR製品で知られるABBYY社が提供するプロセスマイニングツールです。日本語ローカライズ済。

→ ABBYY 日本

ラナ・プロセスマイニング(LANA Process Mining) 

リグリット・パートナーズが、ラナ・プロセスマイニングを活用した「オペレーションアセスメントサービス」を提供。日本語ローカライズ済。

→ 株式会社リグリット・パートナーズ(パートナー契約)

プロセスマイニングツール – グローバル Feb2020

Process mining tools – global Feb2020

現在、世界にはどんなプロセスマイニングツールがあるのか概観してみましょう。

2019年の時点で、大小合わせて30以上のプロセスマイニングツールが世界には存在していると考えられます。 米ITアドバイザリ企業Gartnerが2019年6月に発表した、『Gartner, Market Guide for Process Mining, Marc Kerremans, 17 Jun 2019』においては、代表的なベンダー・ツールが19種類挙げられています。

  • Apromore – Apromore
  • Celonis – Celonis Process Mining
  • Cognitive Technology – myInvenio
  • Everflow – Everflow
  • Fluxicon – Disco
  • INTEGRIS Explora
  • Lana Labs – LANA Process Mining – Magellanic
  • Logpickr – Logpickr Process Explorer 360
  • Mehrwerk AG – MEHERWERK ProcessMining (MPM)
  • Minit – Minit
  • Process Anaytics Factory – PAFnow
  • Process Mining Groups at TUE and RWTH – ProM, ProM Lite, RapidProm M, PM4Py
  • Process Gold – ProcessGold
  • Puzzle Data – ProDiscovery
  • QPR Software – QPR ProcesAnalyzer
  • Signavio – Signavio Process Intelligence
  • Software AG – ARIS Process Mining
  • StereoLOGIC – StereoLogic Process Analysis
  • TimelinePI – Process Intelligence Platform *2019年にABBYY社が買収

さて、これらのうち、グローバルなマーケティング&セールス活動に積極的と感じられ、Webサイトを通じて有益な情報を提供しているとして、私が日ごろからチェックしているのは、以下の10のツール・ベンダーです。

プロセスマイニングはまだ新しい市場であるため、ベンダー各社のライセンス販売本数や売上もほとんどが非公開、調査会社による市場シェア等は当てになりません。とはいえ、Celonisが市場リーダーであることは間違いなく、2番手にCognitive Technology、さらにLana Labs、ProcessGold、 Minitなどがそれぞれがんばっているという状況だと推測しています。

ユニークな存在としては、オープンソースのApromoreが挙げられます。同じくオープンソースのProMは主に学術的研究に利用されているのに対し、Apromoreは企業での活用も増えており、大規模ユーザーへの有償版の提供も始まっています。

なお、ProcessGoldは、2019年末、RPAベンダーのUiPathに買収され、同社の製品ラインアップのひとつとして販売される形となりました。このため、2020年3月に、「UiPath Process Mining」という名称に変更されています。

プロセスマイニングトレンド – グローバル 2005-2019

Process mining trend – global 2005-2019

日本では2019年初頭から本格展開が始まったプロセスマイニング。2020年は、本格導入する日本企業が続々と登場しそうな状況です。

さて、1990年代末に欧州・オランダで生まれたプロセスマイニングですが、2010年代から普及が本格化し、2018年以降はRPAに続くITトレンドとしてブームの様相を呈しています。

プロセスマイニング市場はまだまだ新しいため、市場全体を把握できるデータや資料がほとんど存在しません。そんな中、イタリアのITコンサルティング会社、「HSPI Management Consulting」が2018年から毎年発行している「Process Mining: A DATABASE OF APPLICATION」は、プロセスマイニングプロジェクト件数ベースでの概要を伝えてくれる貴重な調査資料です。

当記事では、上記調査資料の最新版、2020 Edition(2020年1月20日公開)の一部をご紹介します。なお、以下に示すデータは、世界各国のプロセスマイニングツールベンダーや、プロセスマイニング導入を支援するコンサルティング会社等に協力を仰ぎ、任意に提出された過去のプロジェクトの件数や概要に基づくものです。調査に協力していないベンダー、コンサルティング会社等のプロジェクトはカウントされていない点にご留意ください。

年別プロジェクト件数推移

まずは、年別のプロセスマイニングのプロジェクト件数の推移を見ましょう。以下のグラフからわかるように、2011年からの伸びがめざましく、2019年は100件に届こうとする勢いです。昨年2019年は75件と減少していますが、HSPIによれば今回の調査時期が2019年秋だったため、未完了プロジェクト分がレポートされたためだろうと述べています。2021年版で明らかになりますが、実際には、2019年の年間プロジェクト件数は100件を大きく超えていると思われます。

産業別プロジェクト件数

次に、2005-2019年の総プロジェクト件数551件の産業別の内訳を見てみましょう。最も多いのは、航空、自動車、建設、物流などの業界で21%。航空業界だと、エアバス、ルフトハンザ航空、また自動車業界では、BMW、PSI、フェラーリ、ポルシェなどがプロセスマイニングに取り組んでいることが知られています。

次いで、「銀行・保険」で17%。様々な手続きに係る社内業務が煩雑であることから、コスト削減余地が大きい業界だからでしょうか。

3位につけているのは「医療・医薬」で16%です。プロセスマイニングは、初期の頃、病院での医療行為(医療検査など)への適用事例が多く報告されていますが、近年は製薬会社での導入も進んでいます。

地域・国別プロジェクト件数

地域・国別のプロジェクトの構成比については簡潔に触れるに留めます。プロセスマイニング発祥の地、欧州が最も多く37.9%を占めています。次いで、米国5.0%、ブラジル4.0%、オーストラリア38%と続いています。

プロジェクト対象プロセス・目的

この調査資料は、DATABASE OF APPLICATIONとあるように、各プロジェクトについて、企業名(匿名の場合もある)、業種、プロジェクト概要が収録されています。簡潔なプロジェクト説明ですので詳細はもちろん推測するしかないのですが、価値ある事例集だと言えます。

2019年の最新事例をざっと眺めてみると、従来から多かった購買プロセス(P2P: Procure to Pay)、受注プロセス(O2C: Order to Cash)や、ヘルプデスクのITSMプロセス以外の多様なプロセスへと適用が広がっているのがわかります。また、RPAによる自動化を目的に、タスクレベル分析、すなわちタスクマイニングの事例もいくつか登場していることが特筆できるでしょう。

当調査資料(PDF)は、無料でダウンロードできます。

→ Process Mining: A DATABASE OF APPLICATIONS 2020 Edition (HSPI)

プロセスマイニングとは – What is process mining?

「プロセスマイニング」は、主に業務プロセスの「見える化」を行う分析手法です。分析対象としては、業務遂行に用いられる様々なシステム、具体的にはERPやCRM、SFA等の操作内容を詳細に記録したデータ、すなわち「イベントログ」を用います。

プロセスマイニングを行う主な目的は、プロセスに関わる様々な問題を発見することです。例えば価値を生まない無駄な手順や、非効率な活動、業務の滞留が発生しているボトルネックなどを特定し、是正することで、プロセスを開始してから完了するまでの所要時間を短縮、あるいは、プロセスに係るコスト削減を狙います。

プロセスマイニングを病気の治療にたとえるなら、改善すべき問題プロセスは、CoE(Center of Excellence)と呼ばれるプロセス改善のための専門病院に入院させます。そして、まずは治療対象プロセスの概要を把握するための問診を行います。

次に、X-ray(レントゲン)はCT検査としてのプロセスマイニングにより、業務プロセスを「見える化」します。見える化、すなわち業務プロセスを表すフローチャートを見ながら、非効率、ボトルネック、逸脱などの病巣を特定。

さらに詳細に病巣を検査したければ、PC操作ログを収集、分析するタスクマイニングを実行します。タスクマイニングは、内視鏡のようなものです。

病巣が特定され、また根本原因が判明したら、適切な治療方針・処方を行い、手術(改善施策)に着手します。無事、病巣、すなわち問題箇所が解消され、対象プロセスが最適化されたら、予後の経過を見るために定期検診=継続的モニタリングを行い、再発防止に努めるのです。