在通用能力评测中轩辕有.%的任务表现超越h..%的任务表现与之持平涉及数学计算、场景写作、逻辑推理、文本摘要等个主要维度。 年在中文任务评测-v和榜单中名列开源首位。 Hhkv妙想金融 作为国内金融公司的佼佼者同花顺和东方财富公司在金融大模型方面的竞争也不相上下在年月相继推出Hhk和妙想金融大模型。 目前同花顺问财已经开始启用妙想还处于内测阶段。下面从技术方面和用户体验方面进行简单对比: -技术方面:从技术架构、k数、落地方式等角度比较两个模型。 -用户体验方面:由于妙想内测审核暂未通过故只初步体验了Hhk问财后续看机会再更新两者的对比。
优势: 市场覆盖广:涉及多个金融市场如股、港股、美股、基金、债券等 亚美尼亚电话数据 等 功能丰富:支持查询、分析、对比、解读、建议多等等包含在选股票、诊股票、看行情、看新闻等股民常用功能方面表现较好。 回答内容丰富:通过动态折线图、动态双柱图、K线图等图表增强可视化能力还有多种投资数据。 不足: 整体界面:Hhk是基于问财上直接套用对比传统引擎用户体验还未跟上 分析较浅显:分析的深度还不太够无法取代专业投顾。 偏向于技术分析:在回答个股的问题时两个模型均注重于估值、技术、资金流向对基本面内容的回答较少。 回答准确率偏低:针对用户的提问偶尔出现答非所问的情况联系上下文的能力不强。
有些问题的逻辑框架不顺畅。 化收费阶段虽然在投顾方面有了一定的帮助但是吸引用户去购买更深层次服务的吸引力不够还需更加努力。特别是在竞争对手也逐步进入商业化阶段的背景下要积极重视提高模型准确率、内容丰富度和用户体验等方面。 金融模型落地挑战 模型的幻觉问题。由于数据质量问题、训练方式问题、缺乏外部知识校验等原因可能导致大模型易生成与事实不符的内容在金融这样对精度要求较高的领域这种错误可能带来严重后果。 成本问题。金融大模型需要进行大量数据的训练和长时间的实验因此开发大模型需要长期战略发展规划需要投入高性能设备、庞大的算力资源(、)、电力资源、长期的无回报资金以及专业的技术人员支持等这使得该技术在开发阶段就存在很高的准入门槛。