引言¶
设计原则
即插即用 (PnP):模块化;处理不同市场(例如 T0 与 T+1)。
完整性和通用性:多个市场;各种数据源(API、Excel 等);用户友好变量。
避免硬编码参数。
使用“训练-测试-交易”管道弥合模拟与现实之间的差距:模拟用于训练,连接实时 API 用于测试/交易。
高效数据采样:加速数据采样过程是 DRL 训练的关键!来自 ElegantRL 项目。我们知道多进程能够有效减少训练时间(CPU + GPU 之间的调度)。
透明性:对上层不可见的虚拟环境。
灵活性和可扩展性:继承在这里可能会有帮助。
贡献
FinRL 是一个用于金融强化学习的开源框架。提供了包含市场摩擦的交易环境。
提供了附带实践教程的交易任务,以新手友好和可复现的方式。定制是可行的。
FinRL 具有良好的可扩展性,集成了精调的最新 DRL 算法。支持根据快速变化的股票市场调整实现。
选择了典型的用例,为量化金融社区建立基准。还提供了标准的回测和评估指标,以便进行简便有效的性能评估。
借助 FinRL 库,实现强大的 DRL 交易策略变得更加便捷、高效和令人愉快。