Reliant的AI紙張掃描技術應對科學數據枯燥工作

人工智能模型已被证明可以胜任许多任务,但我们真正希望它们做些什么?最好能做枯燥乏味的工作 - 在科研和学术领域有很多这样的工作要做。Reliant希望专注于那些耗时的数据提取工作,目前这种工作通常是疲惫的研究生和实习生的专长。

'您可以通过AI做的最好的事情是改善人类体验:减少机械劳动,让人们去做对他们重要的事情,'首席执行官卡尔·莫里茨说道。在研究领域,他和联合创始人马克·贝勒梅尔和理查德·施莱格尔已经工作多年,文献综述是其中最常见的'机械劳动'之一。

每篇论文都引用先前及相关的研究,但在这个科学的海洋中找到这些资源并不容易。有些论文,如系统评价,引用或使用了数千个数据。

对于一个研究,莫里茨回想说,'作者们不得不看3500篇科学出版物,很多最后并不相关。花费大量时间提取少量有用信息 - 这感觉像是应该由人工智能自动化完成的事情。'

他们知道现代语言模型可以完成这项任务:一项实验让ChatGPT处理此任务,发现它能够以11%的错误率提取数据。就像许多LLM可以做的事情一样,这很令人印象深刻,但并不是人们真正需要的。

图片来源:Reliant AI

'这还不够好,'莫里茨说。'对于这些知识性任务,虽然可能有些枯燥,但重要的是你不要犯错。'

Reliant的核心产品Tabular部分基于LLM(LLaMa 3.1),但同时使用其他专有技术,效果显著。在上述的数千篇论文提取中,他们表示完成了同样的任务,且零错误。

这意味着,你可以输入一千份文档,告诉它需要这个、那个和其他的数据,Reliant会审查这些文档,并找到信息 - 无论它们是否完全标记和结构化(后者更有可能)。然后,它会将所有这些数据和任何你想要的分析放入一个漂亮的用户界面,让你能够深入研究个别案例。

'我们的用户需要能够一次处理所有数据,我们正在开发功能让他们编辑已有的数据,或从数据转到文献;我们认为我们的角色是帮助用户找到在哪里花费精力,'莫里茨说。

这种定制和有效的AI应用 - 并不像数字助手一样引人注目,但几乎肯定更加可行 - 可以加速多个高度技术领域的科学发展。投资者已经注意到这一点,为其进行了1130万美元的种子轮融资;Tola Capital和Inovia Capital领投,天使投资人Mike Volpi参与。

像任何AI应用一样,Reliant的技术需要大量计算资源,这就是为什么公司购买自己的硬件,而不是从大型提供商那里租用。采用自有硬件既有风险也有回报:您必须使这些昂贵的机器为您付款,但您有机会用专用计算打开问题空间。

'我们发现的一件事是,如果您有有限的时间给出好的答案是非常具有挑战性的,'莫里茨解释说 - 比如,如果科学家要求系统在一百篇论文上执行新颖的提取或分析任务。可以快速完成,也可以做得好,但两者不能兼得 - 除非他们能预测用户可能会问什么并提前找到答案,或者类似的答案。

'问题是,很多人都有同样的问题,因此我们可以在他们提问之前找到答案,作为一个起点,'该创业公司的首席科学官贝勒梅尔说。'我们可以把100页的文本精炼成别的东西,可能不是您想要的东西,但对我们来说更容易处理。'

这样想一下:如果您要从一千部小说中提取意义,您会等到有人要求角色的名字才去抓取吗?还是您会提前完成这项工作(连同诸如地点、日期、关系等的事情),因为可能会需要这些数据?显然是后者 - 如果您可以抽出计算资源的话。

这种预先提取也给模型足够的时间来解决不同科学领域中不可避免的歧义和假设。当一个指标在制药领域中的含义与病理学或临床试验中的含义可能并不相同。此外,语言模型在回答特定问题时往往会产生不同的输出。因此,Reliant的任务是将模糊性转化为确定性 - '这是您只有在愿意投资于特定科学或领域的情况下才能做到的,'莫里茨指出。

作为一家公司,Reliant的首要目标是确保技术可以自付其费用,然后再尝试更有雄心的事情。'要想取得有趣的进展,您必须有一个宏大的愿景,但同时需要着眼于具体的事物,'莫里茨说。'从创业公司的生存角度来看,我们专注于盈利公司,因为他们给了我们支付GPU的钱。我们不以向客户亏本销售这项服务。'

人们可能会期望这家公司会感受到来自像OpenAI和Anthropic这样的公司的竞争压力,后者正将资金投入处理更多结构化任务,比如数据库管理和编码,或来自实施合作伙伴,如Cohere和Scale。但贝勒梅尔对此持乐观态度:'我们正在积极发展 - 技术堆栈的任何改进对我们都是好事。LLM可能是其中八大机器学习模型之一 - 其他模型完全由我们专有,完全基于我们的数据从头开始制作。

生物技术和研究行业向人工智能驱动的行业转变显然只是刚刚开始,未来几年可能会相当零碎。但Reliant似乎已经找到了一个稳固的立足点。

'如果您想要95%的解决方案,并时不时向您的一个客户道歉,那太好了,'莫里茨说。'对于那些真正具有重要性和回忆的任务,以及错误真的很重要的任务,我们非常欢迎,我们很乐意把其他事情留给其他人做。'