这不是Python的答案,但考虑到这个问题,我认为有更好的方法来执行此类分析。
我不知道您是否听说过Process Mining。但我认为在你的情况下使用它是完美的。基本上,流程挖掘包括分析流程的流程。我使用过不同的工具,其中一些是:
基本上,您需要做的就是定义什么是ID(您已经拥有它),然后选择哪些列代表时间戳(您已经拥有它)和事件的名称(您也拥有它)。
任何这些工具都能够为您提供完美的流量分析。哪个是最常见的路径,每个事件的平均时间等。 如果添加更多属性,它甚至可以返回基于这些属性遵循一个或另一个路径的原因。