基准¶
性能指标¶
FinRL-Meta 提供以下统一指标来衡量交易表现
累计回报: \(R = \frac{V - V_0}{V_0}\), 其中 V 为最终投资组合价值, \(V_0\) 为初始资金。
年化回报: \(r = (1+R)^\frac{365}{t}-1\), 其中 t 为交易日数。
年化波动率: \({\sigma}_a = \sqrt{\frac{\sum_{i=1}^{n}{(r_i-\bar{r})^2}}{n-1}}\), 其中 \(r_i\) 为第 i 年的年化回报, \(\bar{r}\) 为平均年化回报,n 为年数。
夏普比率: \(S = \frac{r - r_f}{{\sigma}_a}\), 其中 \(r_f\) 为无风险利率。
最大回撤 投资组合价值的最大百分比损失。
提供以下基线交易策略用于比较
被动交易策略,一种广为人知的长期策略。投资者仅买入并持有选定的股票或指数,不进行进一步操作。
均值-方差和最小方差策略,这两种策略都在风险与收益之间寻求平衡。它选择多元化投资组合以在较低风险下获得较高收益。
等权重策略,一种投资组合分配策略,对不同资产赋予相同的权重,避免将过高的权重分配给特定股票。
Jupyter Notebook 教程¶
出于教育目的,我们提供 Jupyter Notebooks 作为教程,以帮助新手熟悉整个流程。Notebooks 可以在此处找到
股票交易:我们应用流行的 DRL 算法来交易多只股票。
投资组合分配:我们使用 DRL 代理来优化一组股票中的资产分配。
加密货币交易:我们重现了对 10 种流行加密货币的实验。
用于清算策略分析的多智能体强化学习:我们重现了 [7] 中的实验。多智能体优化清算任务中的不足,即在给定时间内顺序出售给定数量的某只股票,同时考虑市场影响和风险厌恶引起的成本。
用于股票交易的集成策略:我们重现了在股票交易任务中采用多种 DRL 算法集成策略的实验。
模拟交易演示:我们提供一个模拟交易的演示。用户可以在模拟交易中结合自己的策略或训练好的代理。
中国 A 股演示:我们提供一个基于中国 A 股市场数据的演示。
超参数调优:我们提供多个使用 Optuna 或 Ray Tune 进行超参数调优的演示,因为超参数调优对于更好的性能至关重要。