大语言模型基础

大语言模型(Large Language Model,简称 LLM)是 AI Agent 的大脑,理解它是构建智能 Agent 的基础。大语言模型基础之所以能与你对话、写文章、编程,本质上是它在根据你给出的文本(提示),一个字一个字地猜出最合理的下文。

简单来说,大语言模型是一个经过海量文本数据训练的深度学习模型,它能够理解和生成人类语言。大语言模型通过分析互联网上的海量文本,学习到语言的统计规律和知识,当它收到输入时,会根据学习到的规律,生成最合理的续写。

Transformer 架构

LLM 的惊人能力,离不开其底层核心技术——Transformer 架构。我们不需要深究其复杂的数学原理,但可以理解它的核心思想。

https://www.runoob.com/ai-agent/ai-agent-llm.html

未完待续...

未完待续…