第63章 ChatGPT发布 (第2/3页)
复核和最终判断。人机结合,但机器更聪明了。”
周寻补充道:“技术上有两个挑战。第一,大模型的部署成本很高,需要大量的算力。第二,大模型会产生‘幻觉’——生成一些不存在的数据。在金融领域,这种错误可能是致命的。所以,不能完全信任它。需要人工复核。”
陈默走回办公桌,坐下来。“还有呢?”
陆方想了想。“还有一个。我们需要懂大模型的人。现在的团队,擅长传统自然语言处理,但大模型是另一个领域。要么自己学,要么招人。”
“你打算怎么学?”
陆方犹豫了一下。“我……可能需要一些时间。”
陈默看着他。“需要多久?”
“三个月。至少。”
陈默点头。“那就三个月。你和周寻牵头,成立一个项目组,专门研究大模型在星海中的应用。预算不设上限。需要什么资源,直接找我。”
陆方愣了一下。“陈总,你不担心?”
“担心什么?”
“担心我们走错了方向。大模型很火,但不一定适合金融领域。”
陈默靠在椅背上。“2000年,互联网很火。有人说它不适合金融。后来,所有的交易都搬到了网上。2010年,云计算很火。有人说它不适合金融。后来,所有的数据都存到了云上。今天,大模型很火。有人说它不适合金融。也许他们是对的。但我不想因为害怕走错方向,就不敢走。”
他顿了顿。
“而且,陈曦以后也要用。我们这代人,可以用老方法。她那一代,不会。”
陆方和周寻对视了一眼。周寻说:“那我们从今天开始。”
“好。”
2022年12月,默石资本成立“大模型项目组”,由陆方和周寻牵头,目标是探索将大模型集成到星海平台中。项目组每周开一次会,汇报进展。
第一周,陆方测试了ChatGPT对招股书的理解能力。他输入了苏州晶芯的招股书摘要,问:“这家公司的核心竞争力是什么?”ChatGPT回答:“公司的核心竞争力在于其自主研发的12英寸晶圆先进封装设备,是国内唯一可替代进口的产品。核心专利被同行频繁引用,技术壁垒较高。”陆方把这个回答和星海的分析对比。星海的分析是:“研发强度22%,专利数量42项,行业排名第一。”ChatGPT的分析是人话,星海的分析是数字。
第二周,陆方测试了ChatGPT的风险识别能力。他输入了一份有财务造假嫌疑的公司财报,问:“这家公司有什么风险?”ChatGPT回答:“应收账款周转天数大幅上升,经营活动现金流为负,与净利润严重背离。可能存在虚增收入的风险。”星海的回答是:“应收账款周转天数上升,扣分;现金流为负,扣分。”又是人话和数字的区别。
第三周,陆方遇到了第一个大问题——ChatGPT会产生“幻觉”。他输入了一份某公司的财报,问:“这家公司的研发投入占比是多少?”财报里写的是8%,ChatGPT回答的是12%。他反复测试,发现ChatGPT在数据提取方面不够稳定。当数据在文本中明确出现时,它一般能答对;当数据需要从多个段落中提取时,它容易出错。他在项目组会上说:“这个问题不解决,我们不敢用。”
周寻想了想。“那就限制它的使用范围。只让它做文本摘要和定性分析,不做数据提取。数据提取还是用传统方法。”
陆方点头。“可以试试。”
2023年1月,陆方开始尝试将大模型接入星海平台。技术难度比他预想的要大。大模型的API调用有延迟,每次请求需要几秒钟。而星海需要实时处理大量数据,几秒钟的延迟是不可接受的。他尝试了本地部署,但算力不够。他尝试了模型压缩,但准确率下降。
他在项目组会上说:“这条路走不通。我们需要更大的算力。”
陈默问:“需要多少?”
陆方算了算。“至少需要几百万的硬件投入。而且,技术迭代很快,现在的硬件可能半年后就过时了。”
陈默沉默了几秒。“那就不买硬件。用云服务。按需付费,成本可控。”
陆方点头。“好。”
2023年2月,陆方成功将大模型接入星海平台,但效果不理想。模型的响应速度慢,准确率也不如预期。他反复调试,试了十几种参数组合,都不满意。他开始怀疑自己是不是走错了方向。
周寻拍他的肩膀。“别急。技术迭代需要时间。我们当年做星海,也失败了很多次。”
陆方苦笑。“当
(本章未完,请点击下一页继续阅读)