プロセスマイニング最新機能群と課題、今後の進化の方向性

direct follows graphs

今回の記事では、2021年夏時点における、プロセスマイニングのテクノロジーやソリューションに焦点を当て、機能、課題、今後の進化についてお伝えします。

1 プロセスマイニングの最新機能群

プロセスマイニングは、テクノロジーやツールの側面に関心が行きがちであるが、その本質は、データ分析の理論体系・方法論(Discipline)である。実際、プロセス“マイニング”という言葉でわかるように、データマイニングの一類型と考えることができる。ただし、あらゆる事象を分析対象とする幅広い概念のデータマイニングと異なり、文字通り「プロセス」を分析対象とするのがプロセスマイニングである。その基本となる用途は「プロセスの可視化」であり、プロセスが可視化されたことによって、対象プロセスがはらむ問題点の発見が容易になる。結果として、プロセス改善の取り組みに大きな役割を果たすことができる。

1.1  現在の主要機能

さて、プロセスマイニングは、前述したように「プロセスの可視化」の方法論の確立とツール開発からその研究がスタートしている。それは、業務遂行に使用するITシステムから抽出されたデータに基づき、業務手順を示すフローチャートを自動的に作成する機能であり、「プロセス発見(Process Discovery)」と呼ばれる。その後、研究の進展、ツールの高度化に伴い、様々な機能が実装されてきた。以下は、現在のプロセスマイニングツールの多くが実装している主な分析機能である。

・プロセス発見:


業務手順を自動的にフローチャート化し、作業頻度や所要時間などを算出する

・適合性検査:


データに基づき発見された現状プロセス(as-is)と標準プロセス(to-be)との比較分析を行い、現状プロセスの逸脱を抽出する

・ダッシュボード:


対象プロセスについて、様々な切り口から集計・分析した結果を各種グラフや図でビジュアルに表示する(BIツールと同等)

1.2 最新機能群

さらに、近年では、最先端のプロセスマイニングツールでは、次のような最新機能群が搭載され始めている。

・ビジネスルールマイニング:


 対象プロセスにおいて、フローの分岐(意思決定ノード)が発生している箇所がある場合、その分岐を決定している基準=ビジネスルールをデータに基づいて自動発見する

・シミュレーション(What-If分析)


 プロセス発見機能によって可視化された現状プロセスについて、一部のタスクを排除したり、あるいは自動化したりすることで、どの程度の改善効果が期待できるかをシミュレートする

・運用サポート


 現在仕掛中の案件について、業務遂行に関わるデータをリアルタイムに吸い上げ、業務の逸脱を探知したり、将来の問題発生を予測したりして、担当者にアラートを出す、また最善手を提案する、あるいは自動的に改善施策を実行する。

上記3つの最新機能のうち、ビジネスルールマイニング、およびシミュレーションは、既に完了した案件、すなわち過去データを分析対象としているが、運用サポートは、未完了の案件に関わるデータを逐次処理し、円滑な業務遂行を支援することが主眼である。この意味で、運用サポートは、分析の方法論の枠を超えたITソリューションの一形態とも言えるだろう。このため、プロセスマイニング業界最大手のセロニス社では、当該機能を「EMS(Execution Management System)」と呼んでいる。


2 プロセスマイニングが克服すべき課題

2.1 データ前処理の難しさ

データマイニングでは、全体の所要時間の約8割がデータの収集・抽出、クリーニングといったデータ前処理に費やされると言われる。プロセスマイニングでも同様である。多様なITシステムから抽出された数十~数百に及ぶデータファイルを適切に統合し、抜け漏れ、文字化けなどのダーティなデータを補正し、ツールに投入して分析可能な「データセット」を作り上げる労力は大きい。プロセスマイニングにおけるデータ前処理の難度を高くしている要因としては、データの抽出元が各種業務システムであることから、業務システムへの理解が必要であること、また、業務プロセス改善に資する分析結果を導くためのデータセットを作成するためには、業務自体への理解、また業務改善手法にもある程度通暁している必要があることが挙げられる。

2.2 ツールの分析品質

分析品質については2つの課題を述べたい。一つはDFGs(Directly Follows Graphs)の限界、もうひとつは、Convergence/Divergence問題である。

2.2.1 DFGsの限界

プロセスマイニングの基本機能である「プロセス発見」は、当初、ペトリネットがベースになっていたが、より現実に近いフローチャートを再現するために、様々なアルゴリズムが開発されてきている。ただ、業界有識者の話によれば、現在実用化されているプロセスマイニングツールのほとんどは、ファジーマイナーと呼ばれるアルゴリズムに基づいたもの(各社独自の改善は行っていると思われる)であると言われている。
同アルゴリズムは、一般にDFGs(Directly-follows Graphs)と呼ばれる。ペトリネットや、また業務手順をフローチャートとして記述するための世界標準であるBPMN(Business Process Modeling and Notation)と異なり、ノードとノードが直接(Directly)結びつけられたフローチャートがDFGsである。すなわち、分岐ノードが描かれないため、このアルゴリズムでは、どこでどのような分岐が発生しているのか、具体的には、排他的(OR)なのか、並行的(AND)なのか、といったことが把握できない。このため、現状のプロセスを自動的に再現するとはいっても、分岐が明確でない不完全なものになるというのが現実である。もちろん、これについては、BPMN形式のフローチャートへの自動変換や、前述したビジネスルールマイニングの採用などの機能改善が行われてきている。

図1 Petri net、BPMN、Fuzzy Minerのフロー図例
上図でわかるように、DFGsであるFuzzy Minerには、Petri netやBPMNのような分岐ノードが存在しないため、同じプロセスの表現でありながら、Fuzzy Minerでは分岐のルールを判別することができない。

2.2.2 Convergence/Divergence問題

プロセスマイニングでは、対象プロセスで処理される案件に対して行われる各アクティビティを束ねて、フローチャートを描くために、「案件ID」、「アクティビティ(処理内容)」、およびタイムスタンプの3項目が必須である。例えば、請求書処理プロセスであれば、各請求書に付番されている個別の請求書番号、そして、その請求書に対して行われる「受領」、「確認」、「承認」、「支払い」などのアクティビティをタイムスタンプとともにITシステムから抽出することになる。


 実際のプロセスにおいてしばしば直面するのは、案件IDがひとつではないという点である。具体例を示そう。図2は、エンジニアリング会社の受注から資材調達までのプロセスの一般的なイメージである。受注した機械は、発注企業の仕様に基づいて製造されなければならないため、受注後は、まず設計を行い、次に設計図(Blueprint)に基づいて必要な資材・パーツを洗い出し、サプライヤに発注する流れとなる。ここで、受注した案件は、工事番号(Construction Number)で管理されるが、一つの機械に対して複数の設計図が作成されるため、設計段階では、設計図番号(Blueprint Number)が用いられる。さらに、資材・パーツの洗い出しにはパーツ番号(Parts Number)が、調達時には、複数のパーツがいくつかにまとめられて調達要求が出される。この時は、調達要求番号(Procurement Request Number)が付番される。さらに、複数の調達要求は、サプライヤ毎に集約されて発注が行われる。ここでは発注番号(Order Number)が管理用のIDとなる。

図2 受注から資材調達までのプロセス例(エンジニアリング会社)
1台の機械受注に対して複数のBluleprint、Parts、Procurement Request、Orderが紐づけられ、ひとつの案件IDだけでは適切な分析が行えない

 このように、ひとつの案件が処理されていく中で、集約されたり(Convergence)、拡散したり(Divergence)するプロセスが実務ではごく普通に見られる。従来のアプローチでは、プロセス開始時の工事番号を案件IDとして資材調達までを一気通貫に分析することになるが、途中に集約や拡散が存在していると、実態とはかけ離れたプロセスが再現されてしまう。(例えば、拡散している箇所は単なる繰り返しタスクとして認識されるなど)


 このConvergence/Divergence問題は、プロセスマイニングの分析品質を左右する最大の課題と言える。そこで、近年では、プロセスマイニングのゴッドファーザー、Wil van der Aalst教授が率いる研究者たちが「Object-Centric Process Mining」(1)と称する独自の方法論により当課題の解決に取り組んでいる。 また、myInvenioには、マルチレベルマイニングという機能が実装されており、一つのプロセスについて複数の案件IDを設定することで、プロセスの集約・拡散の状況を加味したフローの再現を実現している。


 今後の進化の方向性

 プロセスマイニングは、データ分析の枠を超えて、業務支援ソリューションとしての役割も果たしつつあることは前述した。ここでは、プロセスマイニングは今後、どのように進化していくのか、俯瞰的な視点で述べてみたい。

3.1 プロセスマイニング1.0

プロセスマイニングは。現状のプロセスをデータから自動再現する「プロセス発見」が基本機能であった。これは、現状をありのままに描きだすという点において「記述的分析(Descriptive Analysis)」である。
ただし、本来やりたいことは、プロセスに潜む非効率性やボトルネックなどの問題個所の抽出である。つまり、どこが悪いのか、を探し出さなければならない。そこで、この部分の処理時間が長すぎる、あるいは繰り返しが多いなど、容易に問題と思われる個所を教えてくれる機能が付加されている。診断的分析(Diagnostic Analysis)に属する機能である。プロセスマイニングツールでは、一般に「根本原因分析(Root Cause Analysis)」と命名されている。
以上は、過去データを対象とする分析機能であり、プロセスマイニング1.0と呼ぶべきものであろう。

図3 プロセスマイニングの進化
プロセスマイニングの機能は、プロセスマイニング1.0から2.0へと大きく進化しつつある

3.2 プロセスマイニング2.0

 プロセスマイニングの分析対象として、未完了、すなわち現在進行中の案件データをリアルタイムに取り込むようになると、逸脱の発見に加えて、現在走っている案件はあとどのくらいで完了しそうなのか、といった所要時間の予測や、将来に発生するかもしれない逸脱の予測も可能になる。こうした予測的分析(Predictive Analysis)が実装されたツールも増えつつある。
 さらには、予測結果に基づいて、所要時間を短縮するために、あるいは将来の逸脱発生を未然に防ぐために、今どのような対応を行うべきかを提案する機能を持つツールも登場しつつある。これは「処方的分析(Prescriptive Analysis)」の機能である。


 こうした未完了データを扱うプロセスマイニング分析は、既存のプロセスマイニング1.0を大きくバージョンアップするものであり、プロセスマイニング2.0と呼ぶことができるであろう。
予測的分析、処方的分析は未成熟であり、その信頼性は必ずしも高いとは言えないが、今後のさらなる技術進展を通じて、ERPなどのエンタープライズシステムに基づく円滑な業務遂行を支援する価値あるソリューションとして多くの企業への導入が進むことは間違いないと思われる。

HFS Top 10 Process Intelligence Products 2020 – プロセスマイニングツールトップ10 (2020)

HFS report on Top 10 Process Intelligence Products

米ITサービス調査会社大手のHFS Researchが、2020年9月、「HFS Top 10 Process Intelligence Products 2020」と題したレポートを発行しました。

HFSでは、40人を超える業界のリーダーたちにインタビューを行い、有望なプロセスインテリジェンス製品として14製品を選出しました。そして、大きくは、「革新(Innovation)」、「実行(Execution)」、「顧客の「声(Voice of the customer)」の3つの切り口で14製品を評価し、ランク付けを行いトップ10を決定しています。

総合評価ランキングは以下の通りです。

1位 Celonis

2位 minit

3位 Fotress IQ

4位 UiPath

5位 KRYON

6位 pafnow

7位 LANA

8位 myInvenio

9位 QPR

10位 ABBYY Timeline

HFSにおける「プロセスインテリジェンス」は、プロセスマイニング、およびタスクマイニングの両方のソリューションを含んでいます。上記トップ10ベンダーのうち、「Fortress IQ」、および「KRYON」は、タスクマイニングソリューションです。

上記プロセスマイニングベンダーのうち、CelonisやmyInvenioは、タスクマイニング機能の拡張を行っています。他のベンダーでも、タスクマイニング機能の拡張を図っているところがあります。

当レポートの詳細はHFSのサイトを参照ください!

→ https://www.hfsresearch.com/research/hfs-top-ten-process-intelligence-products-2020/

ランキング表はこちらから閲覧できます。

プロセスマイニングvsプロセスインテリジェンス

business intelligence process intelligence process mining

Process Mining vs Process Intelligence
English follows Japanese. Before proofread.

プロセスマイニングについて書かれた資料やベンダー情報では、「プロセスインテリジェンス」という言葉がしばしば登場します。

「プロセスインテリジェンス」がどのようなものか、ベンダーによってその定義は異なるようですが、明確な説明がないため、プロセスマイニングとどう違うのか混乱されている方も多いと思われます。

当記事では、「プロセスマイニング」と「プロセスインテリジェンス」の関係性や違いについて、「ビジネスインテリジェンス」も含め、わかりやすさを優先して解説したいと思います。

実のところ、両者の関係性は明白で、2011年に発行された「プロセスマイニングマニフェスト」に以下の図が掲載されています。

ご覧の通り、一番大きな枠として「ビジネスインテリジェンス」があり、その内側に「プロセスインテリジェンス」、さらにその内側に「プロセスマイニング」があるという入れ子構造になっています。

まずビジネスインテリジェンスですが、文字通り、ビジネスに関わるあらゆるデータ・情報を分析対象として収集し、分析するものです。いわゆるBIツールを用いて分析することが多いですが、典型的には、売上や利益などの財務データをベースに、年度別、月別、週別などの推移を見たり、エリア別や製品別にドリルダウンして、売上や利益に貢献しているエリアや製品カテゴリ、逆に足を引っ張っている要因がどこかを掘り下げて分析する。これがビジネスインテリジェンスです。

ビジネスインテリジェンスのうち、特に業務プロセスに関わるデータ・情報に絞って各種分析を行うのが「プロセスインテリジェンス」です。さらに、プロセスインテリジェンスの中で、業務の流れ、すなわち「コントロールフロー」を核とする分析手法が「プロセスマイニング」です。

このようにみると、プロセスマイニングは大きくはビジネスインテリジェンスに含まれるため、ビジネスインテリジェンスで代替できるのではないか、とおっしゃる方もいます。

しかし、プロセスマイニングの基本機能である「(自動的な)プロセス発見」には、特殊なアルゴリズムが必要であり、BIツールには、このアルゴリズムは通常、実装されていません。また、BI機能に基づいて、プロセスマイニング用のアルゴリズムをゼロベースで組むのは現実的には不可能です。(初歩的なものは組めたとしても、それによって、再現されたプロセスモデルの信頼性は低いものでしょう)

したがって、プロセスマイニングを実行したければ、専用のプロセスマイニングツールの採用が必要になり、BIで代替することはできません。

では、プロセスインテリジェンスがカバーする領域はどこになるのでしょうか?

プロセスマイニングツールでは、特殊なアルゴリズムを用いて行うプロセス発見以外に、様々な統計数値を算出し、様々な表・グラフで表現する機能が備わっています。

例えば、分析対象としたプロセスに含まれる案件数、プロセスの開始から終了までのスループット(サイクルタイム)や、各アクティビティごとの処理数、処理時間、あるアクティビティから別のアクティビティまでの移行時間、すなわち待ち時間などです。そして、これらの数値に関して平均、最大・最小、中央値、標準偏差などを併せて確認することが可能です。

こうした統計数値の算出は、シンプルな四則演算ベースで可能であり、特殊なアルゴリズムは言うまでもなく必要ありません。BIでも簡単に実行できますが、これこそ「プロセスインテリジェンス」がカバーしている領域です。

プロセスマイニングによる分析においては、アルゴリズムを通じて発見された「プロセスモデル」(as isプロセスモデル)を起点に、様々なバリエーションを検証する「バリアント分析」や、理想プロセス(to beプロセス)との比較分析、すなわち適合性検査などを行います。

さらに、処理時間がKPIを超えている問題アクティビティや、待ち時間が長くなっているボトルネックを特定していきますが、ここで重要になってくるのが処理件数や処理時間、待ち時間などの基本統計数値です。

すなわち、プロセスマイニングでは、プロセスモデルと併せてプロセスインテリジェンスの数値を様々な視点で掘り下げることを行うわけです。

主要なプロセスマイニングツールでは、プロセスモデルを作成するアルゴリズムは当然として、プロセスインテリジェンス機能、特に、様々な数値をビジュアルに表現するダッシュボード機能が標準で装備されています。この意味では、現在のプロセスマイニングツールは、「プロセスインテリジェンスツール」と言い換えても全く支障がないと言えます。


The term “Process Intelligence” is often used in process mining documentation and vendor information.

The definition of “Process Intelligence” varies from vendor to vendor, but there is no clear definition, therefere many people are confused about how it differs from process mining.

In this article, I would like to explain the relationship and differences between “process mining” and “Process Intelligence”, explaining “Business Intelligence” at the same time.

In fact, the relationship between the two is clear, as illustrated in the “process mining manifest” published in 2011.

As you can see, the largest frame is the “Business Intelligence”, inside which is the “Process Intelligence”, and inside which is the “process mining”. They are nesting relationships.

Business intelligence is literally the collection and analysis of all the business related data and information. The analysis is often conducted using so-called BI tools, typically starting from financial data such as sales and profits, we look at trends by fiscal year, month, and week, and drill down by area and product to delve into the areas and product categories that contribute to sales and profits, as well as the factors that are hindering them. This is business intelligence.

“Process Intelligence” is a type of business intelligence analysis that focuses on data and information related to business processes. Furthermore, “process mining” is an analytical method based on the flow of business process, or “Control Flow” in process intelligence.

Some people say that since process mining is basically included in business intelligence, can it be replaced by business intelligence?

However, the basic function of process mining, “(automatic) Process Discovery” requires a special algorithm that BI tools typically do not equipped with. And it is not practical to build algorithms for process mining based on BI capabilities from scratch (Even if you could build an elementary one, the process model that you reproduced would be unreliable.)

Therefore, if you want to do process mining, you need to use a dedicated process mining tool, which BI cannot replace.

So where does process intelligence cover?

In addition to process discovery using special algorithms, the Process Mining Tool calculates various statistical values and presents them in various tables and graphs.

For example, the number of issues involved in the process being analyzed, the throughput from start to finish of the process (cycle time), the number of activities per activity, the processing time, the transition time (path time) from one activity to another, or the wait time. The average, maximum and minimum, median, and standard deviation of these values can also be checked.

These statistics can be calculated on the basis of simple arithmetic operations without the need for special algorithms. It’s easy to do with BI. That’s where “Process Intelligence” covers.

In the process mining analysis, based on the “process model” (as is process model) discovered through the algorithm, various variations are verified “variant analysis”, and comparative analysis with ideal processes (to be Process), that is, conformance checking, is performed.

In addition, identify problem activities where processing time exceeds KPIs and bottlenecks where waiting time is too long. Basic statistics such as number of processes, processing time, and waiting time are important.

In other words, process mining involves drilling down into process intelligence figures from various perspectives in conjunction with process models.

The major process mining tools have standard process intelligence capabilities with dashboards that visually represent various numbers, as well as algorithms for creating process models. In this sense, it is safe to say that the current process mining tools are “process intelligence tool”.