网站建设计庆阳网站设计价格

张小明 2025/12/30 12:50:50
网站建设计,庆阳网站设计价格,北京营销型网站建设,wordpress 500 根目录简介 Agent技术经历了从早期伪工具调用到Function Calling成为标准#xff0c;再到Claude Skills等优化的演进过程。通过思考-行动-观察的循环模式#xff0c;Agent结合有限工具的组合#xff0c;有效解决了传统工作流无法处理的长尾问题#xff0…简介Agent技术经历了从早期伪工具调用到Function Calling成为标准再到Claude Skills等优化的演进过程。通过思考-行动-观察的循环模式Agent结合有限工具的组合有效解决了传统工作流无法处理的长尾问题大幅提高了系统泛化能力。虽然存在成本高、稳定性有限等挑战但在当前技术条件下Agent已成为AI应用开发中极具价值的架构范式代表着从对话的奇迹到行动的伙伴的转变。这篇文章源于我近半年关于Agent去除敏感信息的生产实践也源于近一年和各个团队关于Agent的一些交流包括我对类Manus项目的一些困惑。就当前来说存在两个截然相反的声音Agent就是未来其他技术都过时了 VS AgentManus没有用不解决实际问题。以下几乎是原话摘录Agent支持派AI开发变化太快了上半年的经验在下半年已经不适用了去年Dify、n8n牛逼哄哄的今年agent模型流行后新开发的项目都是agent自主规划了已经没人考虑Dify、n8n这种落后的思路了事实就是新的Agent比旧的工作流效果好太多了…Agent反对派Manus自始至今从产品角度而言思路是完全失败的。它没有专业数据、没有专属工具链、没有行业认证、没有与业务深度绑定的集成也没有与高价值业务场景的绑定也就是任何人都能做。所以它更偏向工程能力的延伸而不是在构建场景护城河用户会发现当他们遇到真正复杂的问题时这个通用 Agent 还是帮不上忙最终不得不转向专业的垂直产品或人工服务导致用户留存率不高…总结下来就一句话有人觉得Agent已经无所不能代表当前先进生产力了、也有人认为Agent撒也不是谁都能做毫无壁垒费Token还不解决实际问题。怎么说呢过于悲观和过于乐观的认知都是错误的他直接导致的结果就是各个公司乱投入或者不投入而我这边近3年全部在做AI相关工作前前后后接触了40多家公司做了25个AI项目花钱多的过2亿、花钱少的不到10万在Agent这块有些个人心得我们今天就来系统性的探讨下Agent这东西到底先进到哪以及他到底能不能解决实际问题unsetunset为什么25年是Agent元年unsetunset首先Agent的核心是外部工具调用而非严格意义来说Function Calling 是Agent架构的基石因为有了他才有正经的Tools调用。虽然在官方提出这Function Calling之前也能够自己训练模型或者让模型输出类似的格式去模拟Function Calling但这毕竟不是正道因为换个模型也许就不好用了。当前最经典的Agent框架是ReAct他大约是在2022年提出论文《ReAct: Synergizing Reasoning and Acting in Language Models》其中就有伪FC的实现。最后到23年6月OpenAI的更新正式提出了Function Calling将他作为ChatGPT 产品的正式能力后续逐渐成为事实上的标准各个基座模型都有对应实现有了这个基础后Agent的出现就变得更加顺滑了。国内概念的火热从年初的Manus开始但如果真要追溯早期、又出圈的Agent的话可以是2023年3月的开源项目Auto-GPT只不过就算今年的Manus在早期因为基座能力不足都表现不佳遑论更早期的Auto-GPT了呢从Manus发布后2025 AI应用元年逐渐转移成2025 AI Agent元年模型也取得了长足的发展包括整体的推理能力、上下文长度得到了极大的加强而且我相信各个基座模型一定在工具调用这块做了大量微调训练其直接的结果是下半年的工具调用能力有明显的加强。虽然模型的稳定性调用能力有不小的加强但在工具多了后依旧会有找不到、乱调用的问题。于是Claude开始收集了大量Tools调优经验在25年10月正式提出了Skills技术可以认为他是在对整体Function Calling进行补足当然Skills除了提升工具识别能力之外还做了很多其他工作。现阶段使用Skills Function Calling 上下文工程已经可以将准确率做得很不错了比如我们就能折腾到90%这在之前是很难的。以上是我从技术层面看到的近三年Agent发展的情况也就是说在今年之前想要做出个好的Agent几乎不可能在今年下半年开始整体难度会小非常多最后这里的结论就是之前对于Agent的很多质疑乃至产品体验差的问题在2026年应该会得到很大的缓解。所以要说Agent直接依赖于模型能力的变迁这句话还真的没问题你怎么优化都可能比不上模型一次能力升级。接下来我们再来说其核心编排层这个可以解释为什么Agent会越来越强unsetunset规划框架思考-行动-观察unsetunset很多同学知道Agent的工作模式一直在模仿人但多数同学对ReAct这个词并不熟也不能理解思考-行动-观察这套循环到底有什么作用毕竟多聊一轮响应速度就会慢很多还会多花不少冤枉钱耗Token关于为什么要有这么多循环我认为主要是模型能力不足所致需要多轮调优才能最终做出合理的规划。他就像一个需要调教的学生下面这个案例可以很好说明循环调教对于模型做出合理规划的意义六顶思考帽是一种经典的“平行思维”框架旨在将混乱的思考过程结构化。其核心是赋予思考者六种不同的角色“帽子”白帽客观中立只关注事实与数据。红帽感性直觉表达情绪与预感。黑帽谨慎批判专注风险与缺陷。黄帽积极乐观看到价值与机会。绿帽创新创造探索新想法与可能性。蓝帽统筹控制管理思考流程与总结。其威力在于强制切换视角避免人们被单一立场比如一味批判或盲目乐观所困从而实现对问题的全方位审视。举个具体的案例要不要在公司上马一个Agent项目跑一轮六顶思考帽大致会变成这样一套 ReAct 循环白帽我到底知道哪些事实现在公司有什么基础预算多少有哪些现成数据和系统黑帽最坏的情况是什么可能踩哪些坑哪些部门一定会强烈反对黄帽如果成功了最大的收益是什么对业务、对团队能力有哪些放大绿帽在现有资源约束下有没有一些性价比更高的落地路线比如先从一个小流程改造而不是一上来做全栈Agent平台。蓝帽把前面所有视角收束成一个可执行的行动计划先做什么怎么拆阶段怎么验证失败后怎么止损蓝猫开始收尾做输出了。这一整套六顶思考帽跑下来模型在不断地对自己刚刚的想法进行追问、纠偏和补充这就是典型的模型自问自答这有三个好处第一强行补全视角第二把想清楚从一次性梭哈变成逐步逼近最终让规划从黑盒直觉变成可复盘的过程。六顶思考帽这种玩法就是设计了一套学生自己跟自己对话的训练框架以达到对模型调教的目的从 Agent 的角度看这就是把思考-行动-观察这条 ReAct 循环进一步做了角色化化的实现。这一套的结果是模型的规划能力不是凭空长出来的而是在一次次自问自答中长出来的。并且随着模型能力的进一步加强其生成的解法会更加完善所以从框架层面来说Agent架构确实会越来越好只不过费Token暂时没法避免。在了解Agent进化史后我们再看看最经典的旅游案例unsetunsetTools排列组合unsetunset首先大家要理解模型本身是没有思考能力的他的每次回答都是一次千锤百炼的文本统计模仿比如DeepSeek是没有办法识别Claude Code 10月发布的Skills技术的这东西在他的基础数据里没有对于模型没有的东西他一定会胡编乱造这个可以从论文《OpenAIWhy Language Models Hallucinate》看出来。为了解决这个问题模型就一定要引入外部工具调用的能力Function Calling、MCP等出现后模型就开始从问答机器人逐渐往解决具体问题的Agent做进化了。而这也是很多人认为Agent是先进技术、先进生产力的原因严格来说他对工具利用的效率会更高在之前我们解决问题的方式是Workflow AI模型会在流程中某个节点上贡献自己的一己之力。Workflow虽然稳定、效率也高但Workflow不得不面对一个问题总会有20%的场景是他无法满足的而这种长尾问题很严重也许10个Workflow可以解决80%的问题但如果想要把80%提升到85%可能需要100个Workflow提升到90%可能需要1000个…于是这里核心矛盾也就出现了Workflow无法满足用户无穷的需求并且约到后面成本越高那么该怎么办呢答案是用有限的工具去约束用户无穷的意图能这样做的原因是模型基本能力已经很强了**ReAct思考-行动-观察**架构能很好的多数时候能实现规划工作另外由于互联网这些年的发展很多工具已经很成熟了常用的如搜索引擎、地图服务、文件处理等都非常标准不太标准的如订票、支付、抖音APP操作等非要做也可以用RPA技术过渡垂直平台如携程早晚会开放接口更进一步当前Computer-Use、Browser-Use乃至手机操作等更平台型的技术都在使劲突破当然最厉害的大杀器还是AI Coding理论上这家伙能够把所有的工具生成出来实际肯定做不到所以模型规划 Tools排列组合理论上是可以解决20%的问题的就算不能解决但他也会大大降低将80%变为90%的成本。这里举个我自己的例子unsetunsetPlanning Tools 收束意图unsetunset去年以来事情就变得特别多、特别杂我需要找课题、写文章、开发课件、做拜访、出差咨询、各种售前…最后还需要稍微花点心思管理团队但事情多了的结果就一个很多事情会被漏掉。一开始我用的 Todolist 提醒把要做的事记下来设个时间提醒自己别忘做完就勾掉只不过后面问题变多了简单的模式就不好用了任务来源越来越多微信聊天、公众号文章、抖音/视频号、小程序消息每条 todo 背后的上下文不一样有的是选题有的是客户有的是灵感片段还要和团队共享、分配、跟进这时候Workflow排上了用场如果是某个微信群就抄到表 A如果包含选题两个字就打某个标签如果是抖音链接就丢给某个脚本处理这就跟上面说的类似了规则不够用一旦入口多一点、场景多一点Workflow 就会爆炸刚才说的“10 个流程覆盖 80%想做到 90% 要 1000 个流程”的问题就出现了。这里就轮到 Agent 上场了。对我来说核心不是再造一个巨复杂的系统而是在一个相对稳定的 Todolist / 项目看板之上加一个项目小助理Agent让它帮我把事情从“世界”搬运到“列表”。这个小助理手里只有几类 Tools文本提取类从微信消息、抖音、网页链接中抽取正文内容加工类摘要、改写、提炼关键句结构化写入类写入多维表格 / 看板字段包括来源、类型、优先级、截止时间等通知提醒类给我或同事发一条“你该处理了”的消息从 Tools 的视角看这套能力很“有限”就是几种固定的操作但从“意图”的视角看它可以覆盖非常多种变体把这篇公众号发给你帮我记成一个选题 todo这个抖音视频不错帮我提炼成一条学习任务客户在微信里说的需求帮我拆成三个可执行任务分给不同同事这篇长论文只要结论帮我变成一个写作素材条目相信从这里大家也看出来Agent的核心价值了他会大大增加我Workflow的泛化能力模型用 ReAct 式的思考-行动-观察循环来决定怎么排列组合这些 Tools对同一个输入它会先判断这是“选题”“学习任务”还是“客户需求”再按套路调用提取文本 → 生成摘要 → 识别类型 → 写入对应项目表 → 视情况创建提醒如果发现字段不全就再问一句补信息继续调用这里结果是我不需要为每种场景写死一个 Workflow只要提供一组通用的能力工具再把“该怎么组合这些工具”交给模型的规划能力就能在有限规则下去承接用户几乎无穷的意图变化。这就是前面那句话的落地版有限的 Tools 模型的规划能力可以在成本可控的前提下大幅“吃掉”长尾需求。从这个角度来说Agent不能说是先进的技术但我也没想到其他的解法这本来就是一种时间、空间成本、稳定性 换取 兜底的设计如果设计如此的话就不能去挑Agent的那些毛病。unsetunset结语unsetunset当然一套优秀的Agent必定离不开记忆模块只不过大家要明白记忆体系虽然很复杂但他在Agent架构中的最最核心的意义是让模型更清晰的理解用户意图以做更合理的规划、调用更合适的工具组合所以记忆问题我们在这里就不做展开因为其实记忆系统衍生出来的上下文工程才是整个工程架构里面最难、最烦、成本最高的部分这里面涉及了各种结构设计、状态更新、偏好记录、只是增强等等这里根本没办法放开了聊。最后我们收一收关于**Agent 是未来的先进生产力还是一个谁都能做的伪概念**我相信大家现在有了一个清晰的判断了。Agent 不仅是一项先进的技术架构更是当前 AI 应用演进中极具价值的范式突破这东西并不是一下子蹦出来的而是建立在坚实的演进逻辑之上从早期的伪工具调用到 2023 年 OpenAI 推出 Function Calling 成为业界标准再到 Claude Skills 等工程优化。模型在工具调用、规划与执行上的能力已经实现了质的飞跃。这是 2025 年 Agent 从“玩具”走向“工具”的核心原因。从工程实践来看Agent 也不是玄学而是一种清醒的取舍用更多 Token、更多循环、更多系统复杂度去换更高的覆盖率和更强的泛化能力。本质上是用「时间 成本 稳定性的一点点牺牲」换「业务长尾的极大收缩」。如果你认同真实世界业务必然是长尾、必然充满变化那在当前技术条件下很难找到比 Agent 更合理的工程解法。再看 Manus 这条线也许现实会更有说服力。一个被无数人嘲讽为套壳、一个周末就能抄出来的产品几个季度过去了既没有被替代反而在 RLI 等 Benchmark 上长期排在第一这说明什么说明它踩中的不是噱头而是正确的结构性选择Less structure, more intelligence。展望未来正如Manus张涛所言Agent 将向着更通用的工具平台、更持久的伴随式服务、更主动的意图理解演进。它或许尚不完美在成本控制、复杂场景稳定性方面仍需探索但其路径已经清晰作为扩展人类智能与效率的新一代中介Agent 正在将 AI 从“对话的奇迹”转变为“行动的伙伴”。因此对于每一位身处这个时代的构建者与使用者而言理解并善用 Agent已非选择题而是一道关乎效率与竞争力的必答题。最后再引用张涛在清华那场分享里说现在已经是 2025 年最后一个月了如果你还没真正用过 Agent至少要在今年学会和它共处就像几十年前学会用电脑一样。几年之后你大概率不会记得哪一篇 Agent 概念文章但你会很清楚自己是从什么时候开始把 Agent 当成日常工作的一部分的。2025 Agent 元年 只是序幕…如何学习AI大模型如果你对AI大模型入门感兴趣那么你需要的话可以点击这里大模型重磅福利入门进阶全套104G学习资源包免费分享这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】这是一份大模型从零基础到进阶的学习路线大纲全览小伙伴们记得点个收藏第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。100套AI大模型商业化落地方案大模型全套视频教程200本大模型PDF书籍学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。LLM面试题合集大模型产品经理资源合集大模型项目实战合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

古董专家官方网站微信无为县城乡建设局网站

锂金属电池锂枝晶溶解—沉积过程的三维变形模型模型为电化学模型,仿真锂金属电池在充放电过程中负极的锂枝晶沉积和溶解行为,可以计算生成锂枝晶浓度,因沉积变形而产生的应力应变和和变形情况等锂金属电池因其高比能和能量密度,被…

张小明 2025/12/28 14:35:49 网站建设

网站开发需要的技术石家庄营销型网站建设费用

第一章:Dify条件分支性能瓶颈突破概述在现代低代码与AI集成平台中,Dify凭借其灵活的流程编排能力被广泛采用。然而,随着业务逻辑复杂度上升,其条件分支(Conditional Branching)机制逐渐暴露出性能瓶颈&…

张小明 2025/12/22 9:58:41 网站建设

达州住房和城乡建设部网站下载百度极速版

FaceFusion在宗教文化传播中的数字化形象呈现 在敦煌莫高窟的一幅唐代壁画前,一位观众戴上AR眼镜,看到画中菩萨缓缓睁开双眼,轻启朱唇,用温和的语调讲述千年前的智慧箴言——这并非科幻电影场景,而是基于FaceFusion等A…

张小明 2025/12/26 14:27:24 网站建设

手机论坛网站模板免费看电视的网站有哪些

AutoGPT平台架构解析与实战应用指南 在大模型技术迅猛发展的今天,AI不再只是被动应答的“工具”,而是逐渐演变为能主动思考、规划并执行任务的“智能体”。AutoGPT正是这一趋势下的代表性开源项目——它让语言模型从“聊天机器人”跃迁为能够自主完成复杂…

张小明 2025/12/22 10:02:09 网站建设

淘宝客 备案 网站名称企业网站定制收费标准

第一章:环境Agent监测频率的核心挑战在现代分布式系统中,环境Agent作为数据采集与状态监控的关键组件,其监测频率的设定直接影响系统的性能、资源消耗与响应实时性。过高频率可能导致资源过载,而过低则可能遗漏关键事件&#xff0…

张小明 2025/12/29 23:17:03 网站建设

电商网站购物流程南阳建设局网站

Clipper2多边形处理技术深度解析:从基础概念到高级应用实践 【免费下载链接】Clipper2 Polygon Clipping and Offsetting - C, C# and Delphi 项目地址: https://gitcode.com/gh_mirrors/cl/Clipper2 在计算机图形学和几何计算领域,多边形裁剪与偏…

张小明 2025/12/22 9:58:21 网站建设