• 作者:老汪软件技巧
  • 发表时间:2024-12-13 07:05
  • 浏览量:

本文将分享作为大模型应用创业者的经历与观察,讨论RAG技术和市场环境在2024年的变化。

一、RAG技术的演进

RAG(检索增强生成)由“检索”和“大模型生成”两部分组成,而检索之前的索引创建(如chunking、embedding等)是核心基础。我们早在2021年便通过Java技术栈实现了RAG的“RA”部分。2023年中,RAG概念突然走红,并迅速在企业应用中显示出更强的实用性。

1. 主流架构的变化

image.png

2024年,RAG的架构讨论趋于成熟。三种模式(Naive RAG、Advanced RAG、Modular RAG)中,Advanced RAG因性能优异且实现难度适中,成为主流。在满足客户需求时,通过在Advanced RAG基础上做优化,往往比复杂的Modular RAG更高效。

2. 技术细节的突破

RAG技术的细节在不断改进,尤其体现在知识提取、索引组织和检索方法三个方面:

二、市场需求的转变

2024年,RAG在市场需求上的表现愈发突出,尤其是与Fine-tune的对比中。

1. RAG的优势

2. 市场表现与趋势

趋势的发展_趋势未来_

2024年RAG占据企业市场51%的份额,遥遥领先于Fine-tune和Prompt工程。随着更多企业关注实际应用价值,小而难的项目需求(如高准确率AI问答)逐渐替代大而全的理想化需求。展望2025年,应用(Application)将成为市场核心,RAG的白盒性和易控性使其更具竞争力。

三、从业者与市场的冷思考

1. 技术热潮的降温

2024年下半年,AI热度有所回落,部分AI团队解散,许多独立开发者退出探索。但这并非坏事,而是技术成熟的自然过程。

2. 价值逐渐显现

目前坚持AI赛道的公司,尤其是在法律、医疗、教育等垂直领域的深耕者,正逐步建立竞争优势。未来,大模型应用的真正价值将在实际业务流程中开花结果。

四、总结与展望

RAG技术正在从快速扩张转向深度优化,并在企业应用中占据主导地位。TorchV等产品以RAG为核心,已为多个大型客户提供服务。期待未来更多企业通过RAG实现高效、精准的AI解决方案。


上一条查看详情 +构建 Flutter 应用的架构指南
下一条 查看详情 +没有了