引言

设计原则

  • 即插即用 (PnP):模块化;处理不同市场(例如 T0 与 T+1)。

  • 完整性和通用性:多个市场;各种数据源(API、Excel 等);用户友好变量。

  • 避免硬编码参数。

  • 使用“训练-测试-交易”管道弥合模拟与现实之间的差距:模拟用于训练,连接实时 API 用于测试/交易。

  • 高效数据采样:加速数据采样过程是 DRL 训练的关键!来自 ElegantRL 项目。我们知道多进程能够有效减少训练时间(CPU + GPU 之间的调度)。

  • 透明性:对上层不可见的虚拟环境。

  • 灵活性和可扩展性:继承在这里可能会有帮助。

贡献

  • FinRL 是一个用于金融强化学习的开源框架。提供了包含市场摩擦的交易环境。

  • 提供了附带实践教程的交易任务,以新手友好和可复现的方式。定制是可行的。

  • FinRL 具有良好的可扩展性,集成了精调的最新 DRL 算法。支持根据快速变化的股票市场调整实现。

  • 选择了典型的用例,为量化金融社区建立基准。还提供了标准的回测和评估指标,以便进行简便有效的性能评估。

借助 FinRL 库,实现强大的 DRL 交易策略变得更加便捷、高效和令人愉快。