人工智能模型已被证明可以胜任许多任务,但我们真正希望它们做些什么?最好能做枯燥乏味的工作 - 在科研和学术领域有很多这样的工作要做。Reliant希望专注于那些耗时的数据提取工作,目前这种工作通常是疲惫的研究生和实习生的专长。
'您可以通过AI做的最好的事情是改善人类体验:减少机械劳动,让人们去做对他们重要的事情,'首席执行官卡尔·莫里茨说道。在研究领域,他和联合创始人马克·贝勒梅尔和理查德·施莱格尔已经工作多年,文献综述是其中最常见的'机械劳动'之一。
每篇论文都引用先前及相关的研究,但在这个科学的海洋中找到这些资源并不容易。有些论文,如系统评价,引用或使用了数千个数据。
对于一个研究,莫里茨回想说,'作者们不得不看3500篇科学出版物,很多最后并不相关。花费大量时间提取少量有用信息 - 这感觉像是应该由人工智能自动化完成的事情。'
他们知道现代语言模型可以完成这项任务:一项实验让ChatGPT处理此任务,发现它能够以11%的错误率提取数据。就像许多LLM可以做的事情一样,这很令人印象深刻,但并不是人们真正需要的。
'这还不够好,'莫里茨说。'对于这些知识性任务,虽然可能有些枯燥,但重要的是你不要犯错。'
Reliant的核心产品Tabular部分基于LLM(LLaMa 3.1),但同时使用其他专有技术,效果显著。在上述的数千篇论文提取中,他们表示完成了同样的任务,且零错误。
这意味着,你可以输入一千份文档,告诉它需要这个、那个和其他的数据,Reliant会审查这些文档,并找到信息 - 无论它们是否完全标记和结构化(后者更有可能)。然后,它会将所有这些数据和任何你想要的分析放入一个漂亮的用户界面,让你能够深入研究个别案例。
'我们的用户需要能够一次处理所有数据,我们正在开发功能让他们编辑已有的数据,或从数据转到文献;我们认为我们的角色是帮助用户找到在哪里花费精力,'莫里茨说。
这种定制和有效的AI应用 - 并不像数字助手一样引人注目,但几乎肯定更加可行 - 可以加速多个高度技术领域的科学发展。投资者已经注意到这一点,为其进行了1130万美元的种子轮融资;Tola Capital和Inovia Capital领投,天使投资人Mike Volpi参与。
像任何AI应用一样,Reliant的技术需要大量计算资源,这就是为什么公司购买自己的硬件,而不是从大型提供商那里租用。采用自有硬件既有风险也有回报:您必须使这些昂贵的机器为您付款,但您有机会用专用计算打开问题空间。
'我们发现的一件事是,如果您有有限的时间给出好的答案是非常具有挑战性的,'莫里茨解释说 - 比如,如果科学家要求系统在一百篇论文上执行新颖的提取或分析任务。可以快速完成,也可以做得好,但两者不能兼得 - 除非他们能预测用户可能会问什么并提前找到答案,或者类似的答案。
'问题是,很多人都有同样的问题,因此我们可以在他们提问之前找到答案,作为一个起点,'该创业公司的首席科学官贝勒梅尔说。'我们可以把100页的文本精炼成别的东西,可能不是您想要的东西,但对我们来说更容易处理。'
这样想一下:如果您要从一千部小说中提取意义,您会等到有人要求角色的名字才去抓取吗?还是您会提前完成这项工作(连同诸如地点、日期、关系等的事情),因为可能会需要这些数据?显然是后者 - 如果您可以抽出计算资源的话。