CIKM 2021
ACM CIKM(International Conference on Information and Knowledge Management)是信息知识管理和数据挖掘领域顶级学术会议之一,其目的是确定未来知识和信息系统发展面临的具有挑战性的问题,并通过征求和审查高质量的应用和理论研究成果来塑造未来的研究方向。被中国计算机协会 CCF 推荐为 「B类会议」。
ACM CIKM 2021 主要包含 7 个 tracks,其中关注的三个 tracks 对应的接收率为:Full Paper Track(271/1251=21.7%),Applied Paper Track(70/290=24.1%),Short Paper Track(177/626=28.3%)。
本文主要整理下 Full Papers & Applied Papers & Short Papers 三个 Tracks 中 「时间序列」 相关的研究成果。主要研究方向包括:「时间序列预测 & 异常检测」,「时间序列分割」,「时间序列分类」 及其「交叉应用领域」。
01
「论文标题」 ClaSP - Time Series Segmentation
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482240
「源码链接」 https://github.com/alan-turing-institute/sktime
「主要内容」 对生物或物理过程的研究通常会产生一长串按时间顺序排列的值,也就是时间序列 (TS)。观察到的过程的变化,例如作为自然事件或内部状态变化的原因,导致测量值的变化。时间序列分割(TSS)试图在 TS 中找到这样的变化来推断底层过程的变化。 TSS 通常被视为无监督学习问题,旨在识别可通过某些统计属性区分的段。我们提出了 ClaSP,这是一种新颖且高度准确的 TSS 方法。 ClaSP 将一个 TS 分层地分成两部分,其中每个分割点是通过为每个可能的分割点训练一个二元 TS 分类器并选择精度最高的一个来确定的,即最擅长识别来自任一分割点的子序列的那个。分区。在我们使用 98 个数据集的基准进行的实验评估中,我们表明 ClaSP 在准确性方面优于最先进的方法,并且也比第二好的方法更快。我们使用几个真实的时间序列来强调 ClaSP 的属性。
02
「论文标题」 Learning to Learn the Future: Modeling Concept Drifts in Time Series Prediction
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482271
「源码链接」 暂未开源
「主要内容」 时间序列预测在股票市场和零售等广泛的现实场景中具有很大的实用价值。现有方法通常面临由概念漂移引起的模型老化问题:模型性能随时间下降。毫无疑问,模型老化问题会在实际使用中造成严重损坏,例如错误的股价预测可能会导致金融领域的灾难性损失。因此,解决模型老化问题以保证预测器在未来的性能至关重要。在本文中,我们提出了一个新的解决方案来解决这个问题。首先,我们揭示了时间序列数据中复杂概念漂移与深度神经网络梯度之间的理论联系。基于此,我们提出了一个称为学习学习未来的新框架。具体来说,我们开发了一种学习方法来在推理阶段对概念漂移进行建模,这可以帮助模型在未来很好地泛化。此外,为了减轻时间序列数据的噪声和随机性的影响,我们建议通过利用概念漂移建模中的相似序列来增强框架。据我们所知,我们的方法是第一个在时间序列预测中模拟老化问题的通用解决方案。我们对三个真实世界的数据集进行了大量实验,验证了我们框架的有效性。例如,与最先进的方法相比,它在股票价格预测方面实现了 33% 的相对改进。
03
「论文标题」 AdaRNN: Adaptive Learning and Forecasting of Time Series
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482315
「源码链接」 https://github.com/jindongwang/transferlearning/tree/master/code/deep/adarnn
「主要内容」 时间序列在现实世界中有着广泛的应用,并且以难以预测而著称。由于其统计特性随时间变化,其分布也随时间变化,这将对现有方法造成严重的分布偏移问题。然而,从分布的角度对时间序列进行建模仍然是未知的。在本文中,我们将其称为时间协变量偏移 (TCS)。本文提出了自适应 RNN (AdaRNN),通过构建一个自适应模型来解决 TCS 问题,该模型可以很好地泛化未知的测试数据。 AdaRNN 依次由两种新颖的算法组成。首先,我们提出了 Temporal Distribution Characterization 来更好地表征 TS 中的分布信息。其次,我们提出了时间分布匹配来减少 TS 中的分布不匹配,以学习自适应 TS 模型。 AdaRNN 是一个集成了灵活分布距离的通用框架。在人类活动识别、空气质量预测和财务分析方面的实验表明,AdaRNN 以 2.6% 的分类准确率优于最新方法,并显着降低了 9.0% 的 RMSE。我们还表明可以在 Transformer 结构中扩展时间分布匹配算法以提高其性能。
04
「论文标题」 Learning Saliency Maps to Explain Deep Time Series Classifiers
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482446
「源码链接」 https://github.com/kingspp/timeseries-explain
「主要内容」 可解释的分类对于从业者需要证据来支持他们的决定的高影响环境至关重要。然而,最先进的深度学习模型在如何进行预测方面缺乏透明度。一种越来越流行的解决方案是基于归因的可解释性,它发现输入特征对模型预测的影响。虽然这在计算机视觉中很流行,但很少有人解释深度时间序列分类器。在这项工作中,我们研究了这个问题并提出了 PERT,一种新的基于扰动的可解释性方法,旨在解释深度分类器对时间序列的决定。 PERT 超越了最近的扰动方法来生成一个显着图,该图为感兴趣的实例的时间步长分配重要性值。首先,PERT 使用一种新颖的优先替换选择器来了解更大数据集中的哪些替代时间序列对执行这种扰动最有用。其次,PERT 使用引导扰动策略将实例与替换混合,该策略可以在不改变分类器的最终预测的情况下了解每个时间步的扰动程度。这两个步骤共同学习识别解释分类器预测的最少和最有影响的时间步长。我们在九个流行数据集和两个黑盒模型上使用三个指标评估 PERT。我们发现 PERT 始终优于所有五种最先进的方法。使用案例研究,我们还证明了 PERT 成功地找到了输入时间序列的相关区域。
05
「论文标题」 Actionable Insights in Urban Multivariate Time-series
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482410
「源码链接」 https://github.com/AdityaLab/RaTSS
「主要内容」 多元时间序列数据在各种城市应用中越来越受欢迎,例如应急管理、公共卫生等。分割算法主要侧重于识别此类数据中具有变化阶段的离散事件。例如,考虑在飓风期间停电的情况。每个时间序列可以表示一个县在一段时间内的停电次数。此类时间序列中的分段是根据不同阶段找到的,例如,飓风开始时,县面临严重破坏,飓风结束时。灾害管理领域专家通常希望在这些阶段确定受影响最严重的县(利益时间序列)。这些可以有效地为这些地区的资源分配进行回顾性分析和决策,以减轻损害。然而,直接获得这些可操作的县(通过简单的可视化或查看分割算法)通常很难。因此,我们引入并形式化了一个新问题 RaTSS(时间序列分割的合理化),旨在找到这样的时间序列(合理化),这对于分割是可行的。我们还提出了一种算法 Find-RaTSS 来为任何黑盒分割找到它们。我们展示了 Find-RaTSS 在广义合成和真实数据上的表现优于非平凡基线,还在多个城市领域提供了可操作的见解,尤其是灾害和公共卫生。
06
「论文标题」 Integrating Static and Time-Series Data in Deep Recurrent Models for Oncology Early Warning Systems
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482441
「源码链接」 暂未开源
「主要内容」 机器学习技术在基于电子健康记录 (EHR) 预测住院患者的临床恶化方面显示出前景。然而,建立准确的早期预警系统 (EWS) 在实践中仍然具有挑战性。 EHR 是异构的,包括静态和时间序列数据。此外,缺失值在静态和时间序列数据中都很普遍,某些数据的缺失可能与临床结果相关。本文提出了一种通过多模态融合将静态和时间序列临床数据集成到深度循环模型中的新方法。此外,我们通过集成循环模型中的跨模态插补来利用静态和时间序列数据的相关性。我们将所提出的方法应用于从一家研究医院 20,700 名成人肿瘤患者住院治疗的 EHR 中提取的数据集。实验表明,所提出的方法在生成临床恶化早期预警的预测准确性方面优于最先进的模型。一个案例研究进一步确立了预测模型在现实临床环境下的早期预警系统的功效。
07
「论文标题」 Historical Inertia: A Neglected but Powerful Baseline for Long Sequence Time-series Forecasting
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482120
「源码链接」 https://github.com/TakuyaShintate/tsts
「主要内容」 长序列时间序列预测(LSTF)因其广泛的应用而变得越来越流行。 尽管已经提出了更好的模型来提高预测的有效性和效率,但忽视或低估时间序列最自然和基本的时间属性之一:历史具有惯性,这是鲁莽的。 在本文中,我们为 LSTF 引入了一个新的基线,称为历史惯性(HI)。 在HI中,采用输入时间序列中最近的历史数据点作为预测结果。 我们在 4 个公共真实世界数据集和 2 个 LSTF 任务上实验性地评估了 HI。 结果表明,与最先进的作品相比,可以实现高达 82% 的相对改进。 我们进一步讨论了 HI 的工作原理以及从中受益的潜在方式。
08
「论文标题」 Discovering Time-invariant Causal Structure from Temporal Data
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482086
「源码链接」 暂未开源
「主要内容」 从时间数据中发现因果结构是许多科学领域的重要问题。 现有方法通常受到一些限制,例如假设特征之间的线性依赖关系、限制为离散时间序列和/或假设平稳性,即因果依赖关系在所有时间点以相同的时间滞后和强度重复。 在本文中,我们提出了一种称为 μ-PC 的算法来解决这些限制。 它基于μ分离理论,将著名的PC算法扩展到时域。 为了同时适用于离散和连续时间序列,我们利用循环标记时间点过程 (RMTPP) 模型为时间序列开发了一种条件独立性测试技术。 使用合成数据集和真实数据集的实验证明了所提出算法的有效性。
09
「论文标题」 AGCNT: Adaptive Graph Convolutional Network for Transformer-based Long Sequence Time-Series Forecasting
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482054
「源码链接」 暂未开源
「主要内容」 长序列时间序列预测(LSTF)在电力预测、天气预报和交通流量预测等各种实际应用场景中发挥着重要作用。之前已经观察到基于transformer的模型在LSTF任务上取得了出色的结果,可以降低模型的复杂度并保持稳定的预测精度。尽管如此,仍有一些问题限制了基于 Transformer 的 LSTF 任务模型的性能:(i)没有考虑序列之间的潜在相关性; (ii) 编码器-解码器的固有结构在从复杂度方面优化后难以扩展。为了解决这两个问题,我们提出了一个基于transformer的模型,命名为AGCNT,它是高效的,可以在多元LSTF任务中捕获序列之间的相关性,而不会造成内存瓶颈。具体来说,AGCNT 有几个特点:(i) probsparse 自适应图自注意力,它通过自适应图生成将长序列映射到低维密集图结构,并通过自适应图卷积捕获序列之间的关系; (ii) 具有提取概率稀疏图自注意力的堆叠编码器集成了图注意力机制并保留了级联层的主导注意力,从而保留了来自长序列的稀疏查询之间的相关性; (iii) 具有生成推理的堆叠解码器在一次前向操作中生成所有预测值,可以提高长期预测的推理速度。 4 个大规模数据集的实验结果表明 AGCNT 优于最先进的基线。
10
「论文标题」 Improving Irregularly Sampled Time Series Learning with Time-Aware Dual-Attention Memory-Augmented Networks
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482079
「源码链接」 暂未开源
「主要内容」 不规则地,异步和稀疏采样的多元时间序列 (IASS-MTS) 的特征是连续观测之间的稀疏非均匀时间间隔和系列之间的不同采样率。这些特性对用于学习 IASS-MTS 内部和之间复杂关系的主流机器学习模型构成了巨大挑战。这是因为大多数模型都假设所讨论的时间序列是偶数、完整(固定维特征)和同步的。为了应对这些挑战,我们提出了一种新颖的时间感知双重注意和记忆增强网络(DAMA-Net)。所提出的模型可以利用 IASS-MTS 中固有的时间不规则性、多重采样率和全局时间模式信息,以便学习更有效的表示以提高预测性能。对真实数据集的综合实验表明,DAMA-Net 在多元时间序列分类任务中优于最先进的方法。
11
「论文标题」 BiCMTS: Bidirectional Coupled Multivariate Learning of Irregular Time Series with Missing Values
「论文地址」 https://dl.acm.org/doi/10.1145/3459637.3482064
「源码链接」 暂未开源
「主要内容」 多变量时间序列 (MTS),例如重症监护病房 (ICU) 中的多项医疗措施是不规则获取的,并且存在缺失值。 在这种具有缺失值的不规则 MTS 上进行学习任务,例如预测 ICU 患者的死亡率,对现有的 MTS 预测模型和循环神经网络 (RNN) 提出了重大挑战,这些模型可以捕获时间序列中的时间依赖性。 这项工作提出了一种双向耦合 MTS 学习 (BiCMTS) 方法,通过 RNN 表示时间序列内的前向和后向值耦合,以及通过自注意力网络表示 MTS 之间的前向和后向值耦合; 将学习到的双向时间序列内和时间间序列耦合表示融合以估计缺失值。 我们测试了 BiCMTS 对 ICU 患者的数据插补和死亡率预测,显示了利用 BiCMTS 学习的 MTS 中时间序列内和时间间序列值耦合在 RNN 中捕获的深层和隐藏关系的巨大潜力。