シミュレーション - Simulation | PROCESS MINING INITIATIVE - プロセスマイニング・イニシアティブ

The Road from Process Mining to Augmented Business Process Management (Japanese ver.) – Marlon Dumas

2021-12-30 by Jun Matsuo

当記事は、Tartu大学教授、Marlon Dumas氏の掲載許諾を得て日本語に翻訳したものです。日本語での理解がしやすいよう、多少補足・意訳している箇所があります。日本語版の文責はすべて松尾にあります。

Marlon Dumas氏は、BPM(Business Process Management）、Process Miningの研究者として世界的に著名です。オープンソースのプロセスマイニングツール、「Apromore（アプロモーレ）」を開発販売するApromore Pty Ltdの共同創業者でもあります。

また、世界の多数の大学において、BPMの教科書に採用されている『Fundamentals of Business Process Management』の共著者です。なお、『Fundamentals of Business Process Management』の日本語版が2022年中に刊行予定です。

The Road from Process Mining to Augmented Business Process Management

プロセスマイニングから拡張ビジネスプロセスマネジメントへ

– Marlon Dumas, Professor at University of Tartu | Co-founder at Apromore

ビジネスプロセスマネジメント（BPM）の分野において、2021年はわくわくする一年となった。プロセスマイニング、タスクマイニング、デジタルプロセスツイン、予測プロセスモニタリングなどの分野で、導入の成功事例や報告が相次いだ。

そして、これからやってくるものがまだある。私たちは、BPMに対する新しいアプローチの誕生を目の当たりにしようとしているのである。データ分析と人工知能（AI）の手法を活用して、継続的なプロセス改善を実現するアプローチである。私たちはこのアプローチを拡張BPM – Augmented BPM –と呼んでいる。

2022年には、拡張BPMの方向にさらに歩みを進めることになるだろう。この記事では、拡張 BPMの出現をもたらす潮流と、これらの潮流から、組織がどのように利益を得られるかを探っている。

拡張 BPMとは？

拡張 BPMとは、データ分析とAIに基づき、プロセスの設計時と、プロセス実行時の両方でプロセス改善の意思決定を行う、ビジネスプロセス管理のアプローチである。

拡張BPMは、個々のタスクの実行や意思決定の自動化（例：機械学習コンポーネントを使用して顧客の苦情を分類する）に、分析やAIを使用する以上のものである。それは、分析とAIを全面的に利用して、ビジネスプロセスを継続的に監視し、適応させ、また再設計することである。

拡張 BPM ピラミッド

拡張 BPMがカバーする範囲をよりよく理解できるよう、図1に示したような「ケイパビリティ（能力）のピラミッド」として概念化した。

最下層には、「記述的プロセスマイニング – Descriptive Process Mining -」がある。（これは、従来のプロセスマイニングの領域である）プロセスマイニングは、企業システムから抽出したデータセットを用いてビジネスプロセスを分析する技術である。これらのデータセットはイベントログと呼ばれる。イベントログは、ビジネスプロセスの文脈においては、アクティビティ（またはアクティビティ内のステップ）の実行を捕捉した記録の集合体である。

プロセスマイニングには様々な技術が含まれるが、これらは4つのケイパビリティ領域に分けられる。

自動化されたプロセス発見 – Automated Process Discovery

データからプロセスモデルを発見し、プロセスの主な経路や例外を明らかにし、無駄（反復・手戻りや、過剰な処理など）を浮き彫りにする機能。

適合性検査 – Conformance Checking

コンプライアンスルールの違反（請求書のない購買発注など）や、観測された実際の手順と、準拠すべき規範的手順との乖離など、望ましい手順からの逸脱を検出する機能。

パフォーマンス・マイニング – Performance Mining

定量的なパフォーマンス指標をプロセスの要素に結びつける機能。例えば、SLA(Service level Agreement)に対する違反に関わるボトルネック、反復・手戻りの繰り返しがもたらす過剰なコストや無駄を明らかにする。

バリアント分析 – Variant Analysis

異なるサブセットのケース（例えば、地域別）でプロセスがどのように実行されているかを比較することにより、プロセスにおける好ましい、あるいは好ましくない逸脱を識別する機能。

これらの機能により、ボトルネック、反復・手戻り、コンプライアンス違反などの摩擦が起きている箇所を特定し、その原因やKPI（主要業績評価指標）への影響を調査することができる。これらの機能を利用して、継続的なプロセス改善に取り組んでいる企業は多い。

記述的プロセスマイニングは、それ自体が価値のある能力であるが、その長期的な価値は、それが他の豊富な能力につながる扉を開くことにある。実際、組織がプロセスマイニングのために収集した同じデータセットを使って、将来何が起こるかを教えてくれる予測モデルを構築することができる。

これにより、拡張 BPMピラミッドの第2層である「予測的プロセスマイニング – Predictive Process Mining – 」にたどり着く。記述的プロセスマイニングでは、プロセスが過去にどのように実行されてきたかを理解ができる。一方、予測的プロセスマイニングでは、プロセスが将来どのように展開するかを予測する。予測的プロセスマイニングには2つの機能がある。

予測的プロセスモニタリング – Predictive Process Monitoring

プロセスの将来の状態を予測する機能。例えば、O2C（Order-to-Cash：受注から入金まで）のプロセスでは、顧客が注文した製品が時間通りに発送されるか、あるいは遅れて発送されるかを予測することができる。一般的に、予測的プロセスモニタリングは機械学習技術を用いて実装される。まず、過去のデータをもとに予測モデルを作成し、それをイベントストリーム（現在実行中のプロセス）に適用して将来どうなるかを予測する。

デジタルプロセスツイン – Digital Process Twin

プロセスを変更した場合の影響を予測すること。例えば、ERPシステム上で実行されるO2Cプロセスを考えてみよう。記述的プロセスマイニングを適用することで、プロセスの包装工程でボトルネックが発生し、多くの遅延が発生していることが判明するかもしれない。ここで、プロセスマイニングと機械学習を用いて、デジタルプロセスツイン（DPT）と呼ばれるプロセスの複製を構築する。そして、このDPTを用いて、包装工程にスタッフを追加投入した場合に何が起こるかをシミュレーションする。DPTでは、このような変更やその他の実行可能な変更が納期遅れに与える影響度合いを推定することができる。管理者は、この機能のおかげでプロセス改善行動のROIを推定し、より効果な改善行動を見出すことができる。

プロセスがこの先どうなるかを予測することは役に立つ。しかし、予測が価値を生むのは、それに基づく改善行動があってこそだ。これが、拡張 BPMピラミッドの第３層である「処方的プロセス改善 – Prescriptive Process Improvement- 」である。処方的プロセス改善とは、予測をアクションに変えることであり、1つまたは複数のKPIに関して、ビジネスプロセスのパフォーマンスを改善するために最適なタイミングで実行される仕組みである。

この層では、「プロセスマイニング」から「プロセス改善」へと焦点が移る。プロセスマイニングでは、データからパターンを発見し、そのパターンを使ってプロセスを説明したり、予測を立てたりすることに焦点を当てる。ピラミッドの第３層では、パターンは二の次となり、代わりに、改善アクションを扱う。

処方的プロセス改善には2つの機能がある。

処方的プロセスモニタリング – Prescriptive Process Monitoring

1つまたは複数のKPIに関して、プロセスのパフォーマンスを最適化するためのアクションを、リアルタイムまたはそれに近い状態で推奨する機能。例えば、ある処方的プロセスモニタリングシステムが、バッチ製品の出荷が遅れる可能性を検出したとする。そのとき、遅延の影響を最小限に抑えるため、当該製品を注文した顧客に連絡して、製品を2つのバッチに分けて発送する選択肢を提案することを推奨できるだろう。

自動化されたプロセス改善 – Automated Process Improvement

例えば、不良率やサイクルタイムを最小限に抑えつつ、コストを削減するなど、相反するKPI間のトレードオフを実現するために、プロセスに変更を加えることを推奨する機能。自動プロセス改善システムは、週の初めに発生する特定のボトルネックを軽減するため、一部の担当者の割り当てルールや作業スケジュールを変更するようにプロセスオーナーに提案したり、誤発注を防ぐため、一部の発注書に追加の検証ステップを実行するように提案したりする。

上記のようなレコメンデーションは、行動と結果の間の因果関係を発見し、その関係を利用して、プロセスのどのような場合に（いつ）特定の行動を行うのが最適かを判断する因果推論と呼ばれる技術を用いて作成できる。

処方的プロセス改善では、人間のプロセス参加者に対し、機械が可能なアクションを提案する。人間の参加者は、これらの推奨事項を適用するか、あるいは無視するかを決定する。言い換えれば、システムと人間の参加者の間のやりとりは一方通行である。もし、改善アクションが、人間の参加者とAIとの会話の結果だったらどうだろうか？

これで４層目が見えてきた。「拡張 BPM – Augmented BPM – 」である。拡張 BPMは、ビジネスプロセス実行システムの自律性と、マシンと人間の参加者との間での豊かな対話が行われるという点で、処方的プロセス改善を超えている。拡張 BPMはまだ始まったばかりの概念であるが、すでに2つの特徴的なテーマを特定することができる。

対話的プロセスの最適化 – Conversational Process Optimization

プロセスのパフォーマンスが低下する状況を自動的に検出し、そのパフォーマンス低下の原因を人間のプロセス参加者（プロセスオーナーなど）に説明し、その対策を人間の参加者と議論する機能。例えば、対話型プロセス最適化システムが、ある種類の出荷がしばしば遅れることを検出したら、プロセスオーナーにこれらの出荷の輸送ルート変更をすべきであると提案する。人間の参加者は、ルート変更オプションのうち、いくつかは費用が増える可能性があるために採用しないかもしれない。あるいは、顧客に対して、複数の輸送ルートオプションを提供すると決定するかもしれない。当システムは、顧客の所在地に応じて、各顧客に複数の選択肢を提供することができる。

適応型自動運転プロセス – Adaptive Self-driving processes

自動化されたシステムが、プロセスの中で起こりうる次のアクションを判断し、次に取るべきアクションを決定する。また、人間への引継ぎが必要な状況を検出できる能力のこと。例えば、過去の実行データに基づいて、発注書を受け取った際に行うべき検証手順をシステムが決定することができる。これまでに見たことのない新しいタイプの購買注文をシステムが検出すると、人間の担当者に引き継ぎ、その担当者が、この新しいタイプの注文に対してどの検証を行うべきかを決定する。当システムは担当者の判断を記録しておおり、このタイプの発注書を再び受け取ったときにはそれを適用する。

ピラミッドのこの最後の層では、「プロセス改善」から「BPM」へと移行している。拡張BPMは、パターンを発見したり、プロセス再設計の提案を行うだけではない。拡張 BPMは、BPMのライフサイクル全体を扱うアプローチである。

拡張 BPMの恩恵を受けるために、自社は何ができるか？

多くの読者にとって、拡張されたBPMはあまりにも未来的であり、すぐに行動を起こすには値しないと思われるかもしれない。しかし、ピラミッドの最初の二つの層は、すでに実際に広く活用されている。また、第３の層を支える技術は急速に進化しており、すでに他の分野で成功を収めている。拡張 BPMのピラミッドを登ることで得られる利益は極めて大きい。ピラミッドを登るステップを踏まない組織は、取り残される可能性が高くなるだろう。その機会損失は無視できないほど大きい。

ピラミッドに沿った取り組みを考えている企業は、その過程で重要な３つのポイントを心に留めておくとよい。

１．基礎を固め、登り始め、登り続け、先延ばしにしない。

多くのマネージャーは、「データがない」「データが十分ではない」と言って、プロセスマイニングの導入を先延ばしにする。確かに、プロセスマイニングのためのデータを得ることはしばしば困難である。しかし、その効果は数千もの成功事例で繰り返し実証されている。プロセスマイニングを行うためのデータを得ることで、多くの扉が開かれる。今日、プロセスマイニングに使用されたデータは、明日には予測的プロセスモニタリングや、デジタルプロセスツインの構築に使用することができる。データの収集と前処理という障害を乗り越えれば、その可能性は無限に広がる。なお、タスクマイニングは、企業システムでは、データ収集が行えない場合に、データ収集のための別の方法を提供することに留意されたい。

２．レイヤを飛ばしてはいけない。

BPMピラミッドの下層部は、上層部からビジネス価値を引き出すための基盤となる。上の層の機能を採用することで最大限の利益を得たいと考える組織は、下の層をマスターする必要がある。

３．戦略との整合を取り、段階的にガバナンスを構築する。

プロセスマイニング、予測モニタリング、また処方的プロセス改善の取り組みは、組織の戦略的優先事項に基づいて行われる必要がある。拡張BPMピラミッドの機能は、何よりもまず、組織にとって重要なビジネスプロセスに適用されるべきである。また、これらのテクノロジーは、1つのプロセスずつ段階的に採用することが重要だ。時間をかけて、ピラミッドのテクノロジーが予測可能、かつ繰り返し価値を生み出すことを保証するために、ガバナンス構造が必要である。しかし、そこに到達する前に、社内でいくつかの成功事例を作り、幹部の支持を得る。そうして、拡張BPMピラミッドのすべての能力が具体的な価値を生み出すことを示すことで、彼らの支持を維持することが重要である。

免責事項、承認およびライセンス

この作品は、タルトゥ大学の教授として書かれたものです。私の研究は、欧州研究評議会（PIXプロジェクト）とエストニア研究評議会から資金提供を受けています。また、オープンソースのプロセスマイニングソリューションを提供するApromoreの共同設立者でもあります。

この記事はクリエイティブ・コモンズ表示一般ライセンス CC-BY 4.0 (CC-BY 4.0)の下でライセンスされています。

　Marlon Dumas – Professor at University of Tartu | Co-founder at Apromore

→　原文はこちらからどうぞ

プロセスマイニング最新機能群と課題、今後の進化の方向性

2021-11-162021-08-27 by Jun Matsuo

Latest Process Mining Functionality, Challenges, and Future Evolutionary Trends

English follows Japanese.

今回の記事では、2021年夏時点における、プロセスマイニングのテクノロジーやソリューションに焦点を当て、機能、課題、今後の進化についてお伝えします。

１　プロセスマイニングの最新機能群

プロセスマイニングは、テクノロジーやツールの側面に関心が行きがちであるが、その本質は、データ分析の理論体系・方法論（Discipline）である。実際、プロセス“マイニング”という言葉でわかるように、データマイニングの一類型と考えることができる。ただし、あらゆる事象を分析対象とする幅広い概念のデータマイニングと異なり、文字通り「プロセス」を分析対象とするのがプロセスマイニングである。その基本となる用途は「プロセスの可視化」であり、プロセスが可視化されたことによって、対象プロセスがはらむ問題点の発見が容易になる。結果として、プロセス改善の取り組みに大きな役割を果たすことができる。

1.1　現在の主要機能

さて、プロセスマイニングは、前述したように「プロセスの可視化」の方法論の確立とツール開発からその研究がスタートしている。それは、業務遂行に使用するITシステムから抽出されたデータに基づき、業務手順を示すフローチャートを自動的に作成する機能であり、「プロセス発見（Process Discovery）」と呼ばれる。その後、研究の進展、ツールの高度化に伴い、様々な機能が実装されてきた。以下は、現在のプロセスマイニングツールの多くが実装している主な分析機能である。

・プロセス発見：

業務手順を自動的にフローチャート化し、作業頻度や所要時間などを算出する

・適合性検査：

データに基づき発見された現状プロセス（as-is）と標準プロセス（to-be）との比較分析を行い、現状プロセスの逸脱を抽出する

・ダッシュボード：

対象プロセスについて、様々な切り口から集計・分析した結果を各種グラフや図でビジュアルに表示する（BIツールと同等）

1.2　最新機能群

さらに、近年では、最先端のプロセスマイニングツールでは、次のような最新機能群が搭載され始めている。

・ビジネスルールマイニング：

　対象プロセスにおいて、フローの分岐（意思決定ノード）が発生している箇所がある場合、その分岐を決定している基準＝ビジネスルールをデータに基づいて自動発見する

・シミュレーション（What-If分析）

　プロセス発見機能によって可視化された現状プロセスについて、一部のタスクを排除したり、あるいは自動化したりすることで、どの程度の改善効果が期待できるかをシミュレートする

・運用サポート

　現在仕掛中の案件について、業務遂行に関わるデータをリアルタイムに吸い上げ、業務の逸脱を探知したり、将来の問題発生を予測したりして、担当者にアラートを出す、また最善手を提案する、あるいは自動的に改善施策を実行する。

上記３つの最新機能のうち、ビジネスルールマイニング、およびシミュレーションは、既に完了した案件、すなわち過去データを分析対象としているが、運用サポートは、未完了の案件に関わるデータを逐次処理し、円滑な業務遂行を支援することが主眼である。この意味で、運用サポートは、分析の方法論の枠を超えたITソリューションの一形態とも言えるだろう。このため、プロセスマイニング業界最大手のセロニス社では、当該機能を「EMS（Execution Management System）」と呼んでいる。

２　プロセスマイニングが克服すべき課題

2.1　データ前処理の難しさ

データマイニングでは、全体の所要時間の約8割がデータの収集・抽出、クリーニングといったデータ前処理に費やされると言われる。プロセスマイニングでも同様である。多様なITシステムから抽出された数十～数百に及ぶデータファイルを適切に統合し、抜け漏れ、文字化けなどのダーティなデータを補正し、ツールに投入して分析可能な「データセット」を作り上げる労力は大きい。プロセスマイニングにおけるデータ前処理の難度を高くしている要因としては、データの抽出元が各種業務システムであることから、業務システムへの理解が必要であること、また、業務プロセス改善に資する分析結果を導くためのデータセットを作成するためには、業務自体への理解、また業務改善手法にもある程度通暁している必要があることが挙げられる。

2.2　ツールの分析品質

分析品質については２つの課題を述べたい。一つはDFGs（Directly Follows Graphs）の限界、もうひとつは、Convergence/Divergence問題である。

2.2.1　DFGsの限界

プロセスマイニングの基本機能である「プロセス発見」は、当初、ペトリネットがベースになっていたが、より現実に近いフローチャートを再現するために、様々なアルゴリズムが開発されてきている。ただ、業界有識者の話によれば、現在実用化されているプロセスマイニングツールのほとんどは、ファジーマイナーと呼ばれるアルゴリズムに基づいたもの（各社独自の改善は行っていると思われる）であると言われている。
同アルゴリズムは、一般にＤFGs(Directly-follows Graphs)と呼ばれる。ペトリネットや、また業務手順をフローチャートとして記述するための世界標準であるBPMN（Business Process Modeling and Notation）と異なり、ノードとノードが直接（Directly）結びつけられたフローチャートがDFGsである。すなわち、分岐ノードが描かれないため、このアルゴリズムでは、どこでどのような分岐が発生しているのか、具体的には、排他的（OR）なのか、並行的（AND）なのか、といったことが把握できない。このため、現状のプロセスを自動的に再現するとはいっても、分岐が明確でない不完全なものになるというのが現実である。もちろん、これについては、BPMN形式のフローチャートへの自動変換や、前述したビジネスルールマイニングの採用などの機能改善が行われてきている。

図１　Petri net、BPMN、Fuzzy Minerのフロー図例
上図でわかるように、DFGsであるFuzzy Minerには、Petri netやBPMNのような分岐ノードが存在しないため、同じプロセスの表現でありながら、Fuzzy Minerでは分岐のルールを判別することができない。

2.2.2　Convergence/Divergence問題

プロセスマイニングでは、対象プロセスで処理される案件に対して行われる各アクティビティを束ねて、フローチャートを描くために、「案件ID」、「アクティビティ（処理内容）」、およびタイムスタンプの3項目が必須である。例えば、請求書処理プロセスであれば、各請求書に付番されている個別の請求書番号、そして、その請求書に対して行われる「受領」、「確認」、「承認」、「支払い」などのアクティビティをタイムスタンプとともにITシステムから抽出することになる。

　実際のプロセスにおいてしばしば直面するのは、案件IDがひとつではないという点である。具体例を示そう。図２は、エンジニアリング会社の受注から資材調達までのプロセスの一般的なイメージである。受注した機械は、発注企業の仕様に基づいて製造されなければならないため、受注後は、まず設計を行い、次に設計図（Blueprint）に基づいて必要な資材・パーツを洗い出し、サプライヤに発注する流れとなる。ここで、受注した案件は、工事番号（Construction Number）で管理されるが、一つの機械に対して複数の設計図が作成されるため、設計段階では、設計図番号（Blueprint Number）が用いられる。さらに、資材・パーツの洗い出しにはパーツ番号（Parts Number）が、調達時には、複数のパーツがいくつかにまとめられて調達要求が出される。この時は、調達要求番号（Procurement Request Number）が付番される。さらに、複数の調達要求は、サプライヤ毎に集約されて発注が行われる。ここでは発注番号（Order Number）が管理用のIDとなる。

図２　受注から資材調達までのプロセス例（エンジニアリング会社）
1台の機械受注に対して複数のBluleprint、Parts、Procurement Request、Orderが紐づけられ、ひとつの案件IDだけでは適切な分析が行えない

　このように、ひとつの案件が処理されていく中で、集約されたり（Convergence）、拡散したり（Divergence）するプロセスが実務ではごく普通に見られる。従来のアプローチでは、プロセス開始時の工事番号を案件IDとして資材調達までを一気通貫に分析することになるが、途中に集約や拡散が存在していると、実態とはかけ離れたプロセスが再現されてしまう。（例えば、拡散している箇所は単なる繰り返しタスクとして認識されるなど）

　このConvergence/Divergence問題は、プロセスマイニングの分析品質を左右する最大の課題と言える。そこで、近年では、プロセスマイニングのゴッドファーザー、Wil van der Aalst教授が率いる研究者たちが「Object-Centric Process Mining」(1)と称する独自の方法論により当課題の解決に取り組んでいる。また、myInvenioには、マルチレベルマイニングという機能が実装されており、一つのプロセスについて複数の案件IDを設定することで、プロセスの集約・拡散の状況を加味したフローの再現を実現している。

３　今後の進化の方向性

　プロセスマイニングは、データ分析の枠を超えて、業務支援ソリューションとしての役割も果たしつつあることは前述した。ここでは、プロセスマイニングは今後、どのように進化していくのか、俯瞰的な視点で述べてみたい。

3.1　プロセスマイニング1.0

プロセスマイニングは。現状のプロセスをデータから自動再現する「プロセス発見」が基本機能であった。これは、現状をありのままに描きだすという点において「記述的分析（Descriptive Analysis）」である。
ただし、本来やりたいことは、プロセスに潜む非効率性やボトルネックなどの問題個所の抽出である。つまり、どこが悪いのか、を探し出さなければならない。そこで、この部分の処理時間が長すぎる、あるいは繰り返しが多いなど、容易に問題と思われる個所を教えてくれる機能が付加されている。診断的分析（Diagnostic Analysis）に属する機能である。プロセスマイニングツールでは、一般に「根本原因分析（Root Cause Analysis）」と命名されている。
以上は、過去データを対象とする分析機能であり、プロセスマイニング1.0と呼ぶべきものであろう。

図３プロセスマイニングの進化
プロセスマイニングの機能は、プロセスマイニング1.0から2.0へと大きく進化しつつある

3.2　プロセスマイニング2.0

　プロセスマイニングの分析対象として、未完了、すなわち現在進行中の案件データをリアルタイムに取り込むようになると、逸脱の発見に加えて、現在走っている案件はあとどのくらいで完了しそうなのか、といった所要時間の予測や、将来に発生するかもしれない逸脱の予測も可能になる。こうした予測的分析（Predictive Analysis）が実装されたツールも増えつつある。
　さらには、予測結果に基づいて、所要時間を短縮するために、あるいは将来の逸脱発生を未然に防ぐために、今どのような対応を行うべきかを提案する機能を持つツールも登場しつつある。これは「処方的分析（Prescriptive Analysis）」の機能である。

　こうした未完了データを扱うプロセスマイニング分析は、既存のプロセスマイニング1.0を大きくバージョンアップするものであり、プロセスマイニング2.0と呼ぶことができるであろう。
予測的分析、処方的分析は未成熟であり、その信頼性は必ずしも高いとは言えないが、今後のさらなる技術進展を通じて、ERPなどのエンタープライズシステムに基づく円滑な業務遂行を支援する価値あるソリューションとして多くの企業への導入が進むことは間違いないと思われる。

Latest Process Mining Functionality, Challenges, and Future Evolutionary Trends

1 Latest Functions of Process Mining

Process mining tends to attract attention in terms of technology and tools, but its essence is a theoretical system and methodology (discipline) of data analysis. In fact, as the term “process” mining suggests, it can be considered as a type of data mining. However, unlike data mining, which is a broad concept that targets all kinds of events for analysis, process mining literally targets “processes” for analysis. The basic use of process mining is “process visualization,” and the visualization of processes facilitates the discovery of problems associated with the target processes. As a result, it can play a significant role in process improvement efforts.

1.1 Current Major Functions

As mentioned above, the research of process mining has started from the establishment of the methodology of “process visualization” and the development of tools. It is a function to automatically create a flowchart showing business procedures based on data extracted from IT systems used for business execution, and is called “Process Discovery. Since then, various functions have been implemented as research has progressed and tools have become more sophisticated. The following are the main analysis functions implemented in most of the current process mining tools.

Process Discovery

automatically create a flowchart of business procedures and calculate the frequency of work and time required.

Conformance Checking

compares and analyzes the current process (as-is) discovered based on data with the standard process (to-be), and extracts deviations from the current process.

Dashboards

A function to display the results of aggregation and analysis of target processes from various perspectives in various graphs and tables.

1.2 Latest Functions

In addition, in recent years, the most advanced process mining tools have begun to include the following latest functions.

Business Rule Mining

When there is a flow branching (decision node) in a target process, it automatically discovers the criteria (business rules) that determine the routing based on the data.

Simulation (What-If Analysis)

Simulate how much improvement can be expected by eliminating or automating some of the tasks in the current process visualized by the process discovery function.

Operational Support

For projects that are currently in progress, the system absorbs data related to business execution in real time, detects deviations in business operations, predicts future problems, and alerts the person in charge, suggests the best course of action, or automatically implements improvement measures.

Of the three latest functions mentioned above, business rule mining and simulation analyze past data, i.e., data that has already been completed, while operational support focuses on supporting smooth business execution by sequentially processing data related to unfinished projects. In this sense, it can be said that operational support is a form of IT solution that goes beyond the framework of analysis methodology. For this reason, Ceronis, the largest company in the process mining industry, calls this function “EMS (Execution Management System).

2 Issues to be overcome to make process mining better to be used

As seen in the acquisition of Signavio, a major tool vendor, by SAP and myInvenio by IBM, process mining is increasingly recognized as an important tool that is part of IT solutions. However, there are issues that need to be overcome in order for it to be used properly in business practices and to bring results. In this section, I would like to present the main issues from two perspectives.

2.1 Difficulties in data preprocessing

In data mining, it is said that about 80% of the total time required is spent on data preprocessing such as data collection, extraction, and cleaning. The same is true for process mining. It takes a lot of effort to properly integrate dozens to hundreds of data files extracted from various IT systems, to correct dirty data such as omissions and garbled characters, and to create a “data set” that can be fed into tools for analysis. Factors that make data pre-processing in process mining difficult include the fact that the source of data extraction is various business systems, and thus an understanding of the business systems is necessary. In addition, in order to create a data set to derive analysis results that contribute to business process improvement, it is necessary to understand the business itself and to have some familiarity with business improvement methods.

2.2 Analysis quality of tools

There are two issues that need to be addressed regarding the quality of analysis. One is the limitation of DFGs (Directly Follows Graphs), and the other is the Convergence/Divergence problem.

2.2.1 Limitations of DFGs

The basic function of process mining, “process discovery,” was initially based on Petri nets, but various algorithms have been developed to reproduce flowcharts closer to reality. However, according to industry experts, most of the process mining tools currently in practical use are said to be based on an algorithm called fuzzy miner (each company is believed to have made its own improvements).

This algorithm is commonly called DFGs (Directly-follows Graphs). Unlike Petri nets and BPMN (Business Process Modeling and Notation), which is the world standard for describing business procedures as flowcharts, DFGs are flowcharts in which nodes are directly connected to each other (directly). In other words, since branching nodes are not drawn, the algorithm cannot grasp where and how the branching is occurring, specifically, whether it is exclusive (OR) or concurrent (AND). For this reason, even if the current process is automatically reproduced, the reality is that the branching is not clear and incomplete. Of course, functional improvements have been made in this regard, such as automatic conversion to BPMN format flowcharts and the adoption of business rule mining as mentioned above.

2.2.2 Convergence/Divergence Problem

In process mining, three items, “case ID,” “activity (event),” and timestamp, are essential to draw a flowchart by bundling each activity performed for a case processed in the target process. For example, in the case of an invoice processing process, the individual invoice number attached to each invoice and the activities such as “receipt,” “confirmation,” “approval,” and “payment” for that invoice are extracted from the IT system along with the time stamp.

What we often face in the actual process is that there is no single case ID. Let’s take a concrete example. The figure below shows a general image of the process of an engineering company from order receipt to material procurement.

Since the ordered machine must be manufactured based on the specifications of the ordering company, after receiving the order, the company first designs the machine, then identifies the necessary materials and parts based on the blueprint, and then places an order with the supplier. Since multiple blueprints are created for a single machine, the Blueprint Number is used in the design stage. In addition, the Parts Number is used to identify materials and parts, and at the time of procurement, multiple parts are combined into several parts and a procurement request is issued. In this case, a Procurement Request Number is assigned. In addition, the multiple procurement requests are aggregated to each supplier and an order is placed. In this case, the Order Number becomes the ID for management.

In this way, the processes of convergence and divergence are commonly seen in practice as a single case is processed. In the conventional approach, the construction number at the beginning of the process is used as the case ID, and the entire process is analyzed up to the procurement of materials, but if there is convergence or divergence in the process, a process that is far from the actual situation is reproduced. (For example, the diffused part is recognized as a mere repetitive task.)

This Convergence/Divergence problem is the biggest issue that affects the analysis quality of process mining. In recent years, researchers led by Professor Wil van der Aalst, the Godfather of Process Mining, have been working on solving this problem using a unique methodology called “Object-Centric Process Mining” .

3 Future Direction of Evolution

We have already mentioned that process mining is playing a role as a business support solution beyond the framework of data analysis. In this section, we will discuss how process mining will evolve in the future from a bird’s eye view.

3.1 Process Mining 1.0

Process mining is. The basic function of process mining was “process discovery,” which automatically reproduces the current process from data. This is a “Descriptive Analysis” in that it depicts the current state as it is.

However, what we originally wanted to do was to extract problem areas such as inefficiencies and bottlenecks hidden in the process. In other words, we need to find out what is wrong with the process. Therefore, there is an additional function that can easily tell us where the problem is, such as the processing time of this part is too long or there are too many repetitions. This is a function that belongs to Diagnostic Analysis. In process mining tools, it is generally named “Root Cause Analysis.

The above is an analysis function for historical data, and should be called Process Mining 1.0.

3.2 Process Mining 2.0

When process mining starts to take in uncompleted, i.e., ongoing, case data in real time as a target of analysis, it becomes possible not only to detect deviations but also to predict how long it will take to complete the currently running case, and to predict deviations that may occur in the future. In addition, it is possible to predict how long it will take to complete a case that is currently running, and to predict future deviations. The number of tools that implement such predictive analysis is increasing.

Furthermore, based on the prediction results, tools that can suggest what actions should be taken now to shorten the time required or to prevent future deviations from occurring are also emerging. This is the function of “Prescriptive Analysis”.

Such process mining analysis that deals with incomplete data is a major upgrade of the existing process mining 1.0, and can be called process mining 2.0.

Although predictive and prescriptive analyses are still in their infancy and their reliability is not necessarily high, it is certain that they will be introduced to many companies as valuable solutions to support smooth business execution based on enterprise systems such as ERP through further technological progress in the future.

プロセスマイニング事例: AIG

2020-07-012020-06-27 by Jun Matsuo

Concise report of process mining case: AIG – Process Mining Camp 2020

プロセスマイニングツールとして最も初期から提供されているDiscoの開発・販売元、Fluxicon社は毎年、「プロセスマイニングキャンプ」と題したイベントを開催しています。

2020年のプロセスマイニングキャンプは、オンラインにて2020年6月15日（月）～24日（水）で開催されました。土日を除き1日1セッション、合計8セッションが行われ、様々な企業・組織でのプロセスマイニングの活用事例が報告されました。

PMI(Process Mining Initiative）では、一部のセッションについて重要なポイントに絞った簡潔なレポートを提供いたします。なお、セッション動画は後日、Fluxicon社より一般公開されます。

AIG (USA) – Process Wind Tunnel（プロセス風洞）で確実な改善効果を

グローバルに展開する保険会社、AIGでは様々な業務プロセス改善に取り組んでいます。特に、米国AIGの”Data-Driven Process Optimization”と呼ばれる部署では、プロセスマイニング、シミュレーション、BIを組み合わせることで改善成果を積み重ねています。

Data-Driven Process Optimization部署では、プロセス改善の一連の手順を「プロセス風洞（Process Wind Tunnel）」と呼んでいます。自動車や航空機、建築物などの設計においては、風洞に模型を置いて風の流れ等を測定する「風洞実験」を行います。同様に、プロセスの改善にあたって、シミュレーションによる改善成果の予測を行った上で改善施策に展開するという手順を踏んでいるのです。

プロセス風洞は以下の４つの段階で構成されます。

１　データ収集（Data Collection)

ITシステムからのイベントログ抽出に加えて、ビジネスルール、およびリソース（担当者などの属性データを統合します。

2　現状分析（Current State Analysis)

BIツール、プロセスマイニングツールを用いて現状プロセスを可視化し、様々な視点で分析を深めます。

3　未来状態設計（Future Sate Design）

現状を再現するシミュレーションモデルを作成し、さらに、リソース配分の変更などプロセスを最適化するようにモデルのパラメターを変更し、改善成果を試算します。

４　実行

前項のシミュレーションを踏まえ、パイロットプロジェクトを走らせたり、システム改修、新ツールの導入などの改善施策を実行し、改善状況をモニタリングします。

今回紹介された取り組み例はサービス業務です。これは、お客様から届く、月間6万件に上る様々な書類を処理する業務です。書類は、USPSの通常便であったり、翌日配達便であったり、FAX、あるいはeメールと様々な形態があります。

紙の場合には開封して中身をチェックし、スキャンするといった手作業があります。こうした手作業については動作調査(motion study）を行って平均処理時間など、シミュレーションに必要なパラメターとなる情報を収集しています。

データ化された後の処理は、BIツールで曜日別の書類到着数などの統計的分析、およびプロセスマイニング分析を行って現行プロセスモデルを可視化し、プロセス上の問題点を抽出するとともに、データ分析結果から得られた数値はシミュレーションのパラメターとして用いています。

サービス業務の場合、シミュレーションの結果、50％ものスループット（総所要時間）の改善が見込めることがわかり、実際に改善施策を講じたところ、シミュレーションの予測に等しい結果が得られたとのことでした。

Third Day of Camp – AIG – Process Mining Camp 2020