第63章 ChatGPT发布_股海弄潮

    第63章 ChatGPT发布 (第2/3页)

复核和最终判断。人机结合，但机器更聪明了。”

    周寻补充道：“技术上有两个挑战。第一，大模型的部署成本很高，需要大量的算力。第二，大模型会产生‘幻觉’——生成一些不存在的数据。在金融领域，这种错误可能是致命的。所以，不能完全信任它。需要人工复核。”

    陈默走回办公桌，坐下来。“还有呢？”

    陆方想了想。“还有一个。我们需要懂大模型的人。现在的团队，擅长传统自然语言处理，但大模型是另一个领域。要么自己学，要么招人。”

    “你打算怎么学？”

    陆方犹豫了一下。“我……可能需要一些时间。”

    陈默看着他。“需要多久？”

    “三个月。至少。”

    陈默点头。“那就三个月。你和周寻牵头，成立一个项目组，专门研究大模型在星海中的应用。预算不设上限。需要什么资源，直接找我。”

    陆方愣了一下。“陈总，你不担心？”

    “担心什么？”

    “担心我们走错了方向。大模型很火，但不一定适合金融领域。”

    陈默靠在椅背上。“2000年，互联网很火。有人说它不适合金融。后来，所有的交易都搬到了网上。2010年，云计算很火。有人说它不适合金融。后来，所有的数据都存到了云上。今天，大模型很火。有人说它不适合金融。也许他们是对的。但我不想因为害怕走错方向，就不敢走。”

    他顿了顿。

    “而且，陈曦以后也要用。我们这代人，可以用老方法。她那一代，不会。”

    陆方和周寻对视了一眼。周寻说：“那我们从今天开始。”

    “好。”

    2022年12月，默石资本成立“大模型项目组”，由陆方和周寻牵头，目标是探索将大模型集成到星海平台中。项目组每周开一次会，汇报进展。

    第一周，陆方测试了ChatGPT对招股书的理解能力。他输入了苏州晶芯的招股书摘要，问：“这家公司的核心竞争力是什么？”ChatGPT回答：“公司的核心竞争力在于其自主研发的12英寸晶圆先进封装设备，是国内唯一可替代进口的产品。核心专利被同行频繁引用，技术壁垒较高。”陆方把这个回答和星海的分析对比。星海的分析是：“研发强度22%，专利数量42项，行业排名第一。”ChatGPT的分析是人话，星海的分析是数字。

    第二周，陆方测试了ChatGPT的风险识别能力。他输入了一份有财务造假嫌疑的公司财报，问：“这家公司有什么风险？”ChatGPT回答：“应收账款周转天数大幅上升，经营活动现金流为负，与净利润严重背离。可能存在虚增收入的风险。”星海的回答是：“应收账款周转天数上升，扣分；现金流为负，扣分。”又是人话和数字的区别。

    第三周，陆方遇到了第一个大问题——ChatGPT会产生“幻觉”。他输入了一份某公司的财报，问：“这家公司的研发投入占比是多少？”财报里写的是8%，ChatGPT回答的是12%。他反复测试，发现ChatGPT在数据提取方面不够稳定。当数据在文本中明确出现时，它一般能答对；当数据需要从多个段落中提取时，它容易出错。他在项目组会上说：“这个问题不解决，我们不敢用。”

    周寻想了想。“那就限制它的使用范围。只让它做文本摘要和定性分析，不做数据提取。数据提取还是用传统方法。”

    陆方点头。“可以试试。”

    2023年1月，陆方开始尝试将大模型接入星海平台。技术难度比他预想的要大。大模型的API调用有延迟，每次请求需要几秒钟。而星海需要实时处理大量数据，几秒钟的延迟是不可接受的。他尝试了本地部署，但算力不够。他尝试了模型压缩，但准确率下降。

    他在项目组会上说：“这条路走不通。我们需要更大的算力。”

    陈默问：“需要多少？”

    陆方算了算。“至少需要几百万的硬件投入。而且，技术迭代很快，现在的硬件可能半年后就过时了。”

    陈默沉默了几秒。“那就不买硬件。用云服务。按需付费，成本可控。”

    陆方点头。“好。”

    2023年2月，陆方成功将大模型接入星海平台，但效果不理想。模型的响应速度慢，准确率也不如预期。他反复调试，试了十几种参数组合，都不满意。他开始怀疑自己是不是走错了方向。

    周寻拍他的肩膀。“别急。技术迭代需要时间。我们当年做星海，也失败了很多次。”

    陆方苦笑。“当

    （本章未完，请点击下一页继续阅读）