加密市场中的相关性:为什么斜率很重要

基础知识:你需要了解的相关性

从本质上讲,相关系数是一种将两个资产之间关系浓缩为一个范围从 -1 到 1 的单一数值的指标。可以将其看作是两个价格变动是否倾向于同步或相反的快照。接近 1 的值意味着它们同步上涨和下跌,而接近 -1 的值则表明它们呈反向运动——一个上涨时另一个下跌。零表示没有明显的线性关系。

对于投资组合经理和交易者来说,这个单一数字取代了繁琐的散点图页面,能够在市场、时间框架和资产类别之间实现即时比较。

正斜率与负斜率:运动的两面

当两个变量表现出正斜率时,它们朝同一方向运动。比特币和以太坊在牛市期间经常表现出正相关——当BTC上涨时,山寨币通常跟随。相关系数接近+0.7或更高,表明它们在上升(或下降)的过程中同步。

相反,负斜率表示反向运动。传统股票和政府债券历史上表现出负相关;当股市下跌时,债券通常升值。接近 -0.6 或更低的系数捕捉到这种保护性动态。了解投资组合中哪些资产具有负斜率关系,对于真正实现多元化至关重要。

为什么这对你的投资组合很重要

投资组合构建的关键在于找到不完全同步的资产。当持仓之间的相关性低或为负时,整个组合的总波动性会降低——一项资产的亏损可以被其他资产的收益所抵消。量化团队在寻找这些非相关对时投入巨大努力,因为它们是现代风险管理的核心机制。

然而,相关性具有欺骗性。许多交易者发现,在市场崩盘时,他们依赖的负斜率关系会消失。在2008年金融危机期间,大多数资产类别的相关性突然飙升至接近+0.9,完全抹去了在最需要多元化的时刻的保护效果。

相关性的三大主要类型

皮尔逊相关系数是衡量两个连续变量线性关系的首选指标。它直接衡量点是否紧密聚集在一条向上或向下倾斜的线附近。

斯皮尔曼等级相关不假设线性关系,而是捕捉单调关系——即如果一个变量在增加,另一个也在增加(即使不是直线关系),斯皮尔曼也能检测到。这对于实际数据中很少表现出完美线性的情况非常有价值。

肯德尔的tau提供另一种基于等级的方式,通常在样本较小或存在重复值时更稳健。不同领域偏好不同的指标,但选择哪一个取决于你的数据形态,而不仅仅是其数值大小。

数学解析

皮尔逊系数等于协方差除以两个标准差的乘积:

相关性 = 协方差(X, Y) / (标准差(X) × 标准差(Y))

这种归一化使得结果限制在 -1 到 1 之间,即使变量的尺度差异很大,也能进行可比的比较。

举例来说:如果X从2、4、6、8增加,Y也从1、3、5、7同步变化,偏差完全一致。协方差(covariance)变得很大且为正,标准差的乘积也很大,最终得到的r接近+1——完美的正斜率。

在实际操作中,软件会处理这些计算,但理解其机制有助于避免误解。

数值解读

虽然存在大致的阈值,但它们会因领域而异:

  • **0.0 到 0.2:**几乎没有关系
  • **0.2 到 0.5:**关系较弱
  • **0.5 到 0.8:**中等到强
  • **0.8 到 1.0:**非常强的关联

负值的解释相同,但表示反向关系。系数为 -0.75 表示相当强的反向运动——当一个资产上涨时,另一个通常会下跌。

上下文非常重要。物理学中,相关性接近 ±1 才有统计意义,而社会科学中,由于人类行为的噪声,较小的值也被接受。在加密市场中,低于0.4的相关性常被视为具有对冲意义。

样本量陷阱

用只有10个数据点计算的相关性可能会误导。相同的数值在统计意义上完全不同,取决于样本大小。拥有1000个观察值时,即使相关系数为0.25,也可能具有统计显著性;而只有10个观察值时,可能需要0.8以上才能达到显著。

在使用时,始终结合p值或置信区间,尤其是在数据有限的情况下。

相关性不足之处

**因果关系的误解:**两个变量一起变动并不意味着一个导致另一个。可能存在第三个因素驱动两者。例如,比特币和黄金的相关性可能并非因为它们本质上相关,而是因为通胀预期影响了两者。

**非线性关系的盲点:**皮尔逊只捕捉线性关系。曲线或阶梯式的关系可能导致接近零的皮尔逊系数,但实际上存在强烈的依赖关系。等级相关(如斯皮尔曼)常能揭示皮尔逊遗漏的关系。

**异常值敏感:**一次极端的价格飙升可能会极大扭曲系数。闪崩或操纵交易都可能意外改变相关性。

**分布假设:**非正态分布或类别变量违反了皮尔逊的假设,使得等级相关或列联表更为合适。

现实投资中的应用

加密资产与传统资产: 比特币与美国国债收益率的相关性随时间变化——在避险时期为负,正常时期趋近于零。监控这种变化有助于交易者调整对冲比率。

油气生产商与原油: 能源行业的公司似乎与油价自然相关,但历史分析显示相关性中等且不稳定。这提醒我们:直觉关系常常令人失望。

配对交易: 量化策略利用临时的相关性中断。当两个历史相关的资产偏离时,交易者押注均值回归,如果相关性恢复,就能获利。

因子投资: 动量、价值、波动率等因子之间的相关性会波动。基于昨日相关性构建的投资组合,若关系发生变化,可能面临意外的集中风险。

稳定性问题

相关性不是固定的。市场环境变化、新信息出现,危机会打破历史模式。用五年数据测得的0.3相关性,可能对下个月的对冲决策毫无用处。

解决方案:计算滚动窗口相关性。用最近的60天、90天或252天数据重新计算,以检测趋势。如果相关性从-0.5逐渐变为+0.1,你的对冲策略正在减弱——需要重新平衡。

相关性与R²

r (相关系数)告诉你线性关系的强度和方向。它是向上还是向下倾斜,以及关系有多紧密?

(决定系数)回答:X解释了Y的百分之多少的变异?如果r=0.7,则R²=0.49,意味着Y的49%的变动可以由X预测。投资者常用R²衡量回归模型的预测能力,因为它直接量化了预测力。

依赖相关性前的最佳实践

  1. **先可视化:**绘制散点图。先用肉眼判断是否存在线性(或单调)关系,再相信数字。

  2. **寻找异常值:**识别极端点,判断是否应删除、调整或使用稳健的等级方法。

  3. **验证数据类型:**确保变量是连续的(用于皮尔逊),或已排序(用于斯皮尔曼/Kendall)。

  4. **检验显著性:**计算p值,尤其在样本较小时。如果相关性很高但样本只有15个,可能只是噪声。

  5. **监控变化:**使用滚动窗口检测制度变化。相关性不稳定是策略需要重新校准的预警信号。

最后总结

相关系数是一个看似简单但极其有用的工具,用于量化两个变量的共同运动——无论它们表现为正斜率、负斜率,还是独立波动。它在构建多元化投资组合、识别对冲和配对交易中具有重要价值。

但相关性也有其局限。它只捕捉线性(或单调)关系,无法揭示因果关系,受样本和异常值影响大,并且会随时间变化。应将其作为起点,而非终点。结合散点图、斯皮尔曼或肯德尔等替代指标、统计显著性检验和滚动监测,才能做出基于实际的决策,而非被一个误导性数字所左右。

IN0.41%
WHY11.55%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)