Page 1 of 1

维基百科关于皮尔逊相

Posted: Thu Jan 16, 2025 8:47 am
by md.a.z.i.z.ulha.kim4
关性的文章首先指出,它是“两个变量之间相关性(线性依赖性)的度量”。 维基百科关于斯皮尔曼相关性的文章以右上角的一个例子开始,该例子表明“当被比较的两个变量单调相关时,斯皮尔曼相关性为 ,即使它们之间的关系不是线性的。相反,这并不能给出完美的皮尔逊相关性。” 的观点既没有道理,也不符合文献。我会更详细地研究数学,或引用更权威的资料,但我很确定 现在知道他错了。在 就 相关性和 相关性之间的差异做出错误陈述之后,在我更正了 的资料来源(在我们博客的评论中), 正确地陈述了 相关性和 相关性之间的差异。


但是,我们希望确保对这些观点有一个很好的记录,并解释是什么以及为什么。 )反驳“不是线性方法”的说法 这个例子特别有趣,因为它与主成分分析 有关,而主成分分析与 有关(很多 都熟悉这个概念)。在 中,可以找到 贝宁数字数据 主成分,即特征向量。 也是一个特征向量。不过我跑题了,让我们来讨论一下 的说法。 在 博士批评第三方使用 相关性(因为 相关性仅显示线性相关性)之后,他批评我们没有使用 。 与 相关性一样, 也只能发现线性相关性,因此我指出了他的矛盾之处: 本:“鉴于你的帖子开头批评其他人因为线性问题而使用皮尔逊方法,建议采用另一种线性方法是不是有点奇怪?” 对此, 的回应是: “ 的评论…… 证实了对统计学的错误认识”和 “ 和 ,在谈论与 相关的线性时要小心,因为 不需要对原始数据的分布做出任何假设。


我怀疑你们是否了解 ……线性假设与基向量有关。 ” 但在我们讨论分歧的核心之前,让我指出 的实际陈述几乎是正确的。 定义基向量时,它们是线性去相关的,因此它不需要假设它们会是线性相关的。但这只是一个小问题。 博士的立场存在这个问题,这意味着 的线性方面并不像我声称的那样存在于它在源数据中找到的相关性中,而只存在于基向量中。 因此,存在分歧——类似于皮尔逊相关系数只能发现线性相关性, 是否也只能发现线性相关性? 博士说不是。 和许多学术出版物都说是。例如: “ 没有考虑特征之间的非线性相关性”(“基于 的草书手写识别的核 ”; 和 ) “ 仅识别变量之间的线性相关性”(“使用自联想神经网络进行非线性主成分分析”; (麻省理工学院), 杂志 ) 但是,除了引用权威文献,我们还要考虑一下为什么他的说法是错误的。