诸如“什么是最好的方式......”之类的问题在机器学习中从根本上是不正确的。如果我们假设一个参数很少且数据分布的模型,我们可以争论一个估计量的方差,甚至可以计算它,但是由于我们不知道数据在现实生活中如何分布,所以不能讨论最优性。
直接解决您的问题,您没有指定数据的保存方式,文件类型,结构,大小等。您缺少很多可以帮助我们的细节。此外,只有少数情况我知道不需要数据准备,所有这些都是国际着名的数据集(如MNIST和其他一些旧的竞赛)。您需要并且应该在将数据提供给网络之前准备好数据;此外,您应该尝试不同的方法(将其标准化等)并在保持集(验证)上测量您的表现,看看哪个更好。你可以试着通过使用来分离它们 torchvision.transforms 即使它不是一个愿景任务。这是一个强大的预处理管道。
torchvision.transforms
最后,您还应该尝试不同的体系结构和单元,因为时间序列深度学习在过去几年中取得了显着进展(从变分退出到卷积和注意单位)。