Page 1 of 1

社区和学习曲线的总体结论

Posted: Mon Mar 24, 2025 3:30 am
by roseline371274
比较用例,你可以清楚地看到 Julia 的表现是所有语言中最差的。这是由于文件 IO 速度慢造成的;将数据从 CSV 文件加载到数据框中,这占用了大部分运行时间。作为 Julia 的新手,有可能(而且很有可能)忽视了将数据框加载到 Julia 中的有效方法。尽管如此,快速的文件 IO 对于 DS 来说非常重要,尤其是在大数据时代。



图 2:基于实施、绩效、

从用例的实现来看,Python 显然是赢家。所有三个用例都易于实现,有大量可用的示例,并且代码易于解释(易于理解和实现)。这当然是意料之中的,因为 Python 是数据科学的首选语言。

与其他三种语言一样,尽管有些语言表现良好,但实现并不像预期的 BC 数据 那样顺利,其他语言根本没有运行......Julia 具有很大的潜力,您可以在网上找到 K-means 用例的值得称赞的示例。对于另外两种情况,实施起来就变得有点困难了。然而,人们也认为 Julia 尚未达到应有的水平,因此随着语言在内心深处的发展,Julia 可以成为数据科学领域的一颗真正的明珠。

对于 Go 和 Rust 的用例,在网上找到好的示例更加困难,这主要是由于该编程语言的社区较小。然而,Rust 仍处于发展阶段,将来可能会更容易实现这些情况。

换还是不换,这是个问题
这些现代语言表现出一些宝贵的特征,并在某些领域展现出潜力。然而,Python 仍然显示了它的真正价值,尤其是在用例的比较中。当然,这种比较也可以用不同的方式进行;可以选择其他机器学习算法和问题,不同的硬件(仅举几例)。然而在大多数用例中,Python 显然是赢家。请注意,在本质上,Python 在很大程度上依赖于 C/C++。这使得 Python 成为将这些低级算法粘合在一起的合成糖,使它们易于使用。尽管 Rust 不那么容易学习,但由于有多个包(库)可用,它具有相同的功能,因此 Rust 也可能是这方面的一个很好的候选者。