#itup01体育游戏app平台
玩LLM和agent有一段时分了,目下合计AI agent落地是一个很难过的阶段。学术上是一个富矿,有点当年人人系统火起来的嗅觉了。
agent work吗,他work,许多bert无法作念好的任务,LLM能有可以的后果,在agent框架加执下,针对特定任务后果会好,不得不承认,岂论是LLM如故agent在后果上都是实打实的向上。
那agent弥散work吗,这个谜底显着是否的。淌若说曩昔深度学习群众是真金不怕火丹师,那目下作念agent专揽是简直木工技巧东谈主了。不同的缅思库,不同的prompt法式,用不同的LLM 拼起来后果差别都蛮大的。
那这些局限性是怎样产生的呢,有一个很核心的问题我称之为shallow reasoning,也就是说那怕是年头的GPT4,他的推理都是相比浅层的。GPT5可以科罚吗,也许。可是这也有可能是decoder-only transformer架构的固有谬误。是以目下看来agent的神经核心如故很原始的阶段。
其实agent四大模块除了tool use都存在肖似的问题。
缅思模块,目下的RAG也非常原始。只是通过文本相似性来搜索是不是也太肤浅狂暴了?比如说,我的指标是从A地到C地,可是我必须加油,中间唯有B地有加油站,那么显着我需要完成A-B-C的旅途。那淌若我目下是A我思意识C,有中间东谈主B。那我王人备可以回思之前加油的例子,来完成我的指标。之前加油的例子诚然和现时任务是共通的,可是文本相似性很低。是以个东谈主见解是咱们需要更高档的缅思模块。
逻辑推理模块目下有许多比如,COT, TOT,GOT,类比相似的例子等等。这些模块一定历程上科罚了浅层推理的问题,可是依然,目下agent的推理深度是不够。是以大部分论文如故在肤浅的数据集上测试(这里的肤浅数据集联系于之前的NLP法式也很难了)。那随之而来的问题是,关于不同的任务,我要聘用哪种法式去推理呢,我需要花几许算力去推理是顺应的呢?目下即使是最高档的prompt手段,也需要许多手工调养。是以推理模块也依然黑白常原始的。
淌若不说那么远,淌若基于目下agent仍是有的智商去落地呢?依然还有许多问题。
从需求上,譬如说目下agent可以帮你订个外卖,旅馆,机票。问题是他简直比用APP顺遂吗?我思咱们不要小看了十多年来出动互联网发展中,对APP的优化历程。再比如说像characterAI这么,简直比刷抖音和看短剧荒谬义吗?
目下合计几个相比好的专揽想法是,医疗多模态大模子+agent,淌若医疗影像可以关于新任务可以径直few-shot,并且后果粗略商用,会是一个很好的冲破。还有作念游戏亦然很好的想法,agent可以产生许多很情理情理的游戏本体,我思这类游戏仍是在路上了。还有外交限制,天然这里不是真东谈主外交,是假造伴侣,假造偶像,这些需求细目是存在的,可是家具修复也需要摸着石头过河。
至于软件修复,目下用GPT4的智商,王人备是扯蛋的。
终末是算力的问题,serving cost简直太高了。目下能作念agent的LLM,唯有GPT4,3.5水平不异的模子作念agent很拼凑。一个用户单次交互,也许要花好几毛东谈主民币。什么样的家具,夸口什么样的需求才调卖得起这个价格呢?
是以说目下落地是个难过的阶段,要么等算力,推理框架,蒸馏技术发展,让工作本钱弥散低廉。要么等agent这套框架发展处更好的缅思,和推贤慧商
❤(itup01)体育游戏app平台