当一个重大的系统故障发生时,会有大量的在线和离线沟通进行。在线部分会创建一个数字审计轨迹,记录了什么时候发生了什么,人们如何反应,以及最终问题是如何解决的。Jeli是一家几年前成立的公司,旨在帮助企业理解和跟踪故障。今天,该公司宣布了其方法的下一个合乎逻辑的步骤—— 一款将ChatGPT类似的功能引入故障管理的测试版。
公司创始人兼CEO Nora Jones表示,将生成式AI加入产品似乎是他们已经在做的事情的自然延伸。“我们一直在寻找改进产品的方法,让人类更容易理解他们在紧急情况中或者紧急情况之外应该做什么,以及在哪里获取专业知识。所以我们开始使用生成式AI来帮助故障发生期间和之后,”Jones告诉TechCrunch。
首先,它会通过一个总结功能来帮助人类理解发生了什么。正如她所指出的,有时候一个故障可能会拖延几天或几周,而不必浏览所有的消息就能了解情况可以节省大量的时间。“所以在故障期间,我们有一个叫做‘Catch Me Up’ 的功能,它会把到目前为止发生的对话进行总结,为需要了解故障情况的人提供信息。”
此外,该公司还为用户提供了一个叙述,让他们了解故障的范围。“我们允许你生成标记,为你总结检测、相关人员、他们说了什么、诊断和修复发生在哪里。这个想法是引导人类去理解事件发展过程中不寻常的事情。”
该公司首先使用OpenAI API来构建这个功能,但Jones表示他们已经针对计算机故障管理对模型进行了特定的训练。“我们利用OpenAI的生成模型。所以我们使用了ChatGPT,然后我们通过一些像链式思维推理这样的方法来改进很多响应。这使得我们能够更容易地对故障记录进行分类。”她说。
Jones说为了限制模型产生部分答案的幻觉问题,这在故障管理场景中尤其有问题。他们展示了他们的工作过程,所以人类可以检查源材料来确认他们生成的数据是正确的。
“你可以看到总结和它从中提取的所有证据。我永远不想把这个叫做‘自动后事分析’或者‘自动故障回顾’,因为它不是这样的,它只是一个启动器。而且我们实际上鼓励人类编辑它提出的内容。”她说。
在当前版本中,你还不能查询故障报告,但Jones说测试版的目的是完善他们已经构建的功能,并根据用户反馈决定如何改进它。