2024-arXiv-TradingAgents：多智能体LLM金融交易框架

标签：模型 arXiv 决策 2024 智能 LLM 团队交易

arXiv | https://arxiv.org/abs/2412.20138

GitHub | https://github.com/TradingAgents-AI/TradingAgents-AI.github.io

摘要：

前排提示，文末有大模型AGI-CSDN独家资料包哦！

在金融领域，LLM 研究主要集中在处理特定任务的单智能体系统或独立收集数据的多智能体框架上，多智能体系统在模拟现实世界交易公司协作动态方面的潜力仍未得到充分探索。TradingAgents 提出了一种受交易公司启发的新型股票交易框架，该框架包含由 LLM 驱动的专业角色智能体，如基本面分析师、情绪分析师、技术分析师以及具有不同风险偏好的交易员。该框架还包括评估市场状况的“牛市”和“熊市”研究员智能体、监控风险敞口的风险管理团队，以及通过辩论和历史数据综合见解以做出明智决策的交易员。通过模拟一个动态、协作的交易环境，该框架旨在提升交易表现。详细的架构设计和广泛的实验揭示了其在累积收益、夏普比率和最大回撤方面相较于基线模型的优越性，凸显了多智能体LLM框架在金融交易中的潜力。

image-20250109101437546

一、引言

利用大型语言模型（LLMs）的自主代理通过在各种应用中复制人类的流程和工作流，为决策提供了一种变革性的方法。一个突出应用是在金融市场中，这是一个受到包括公司基本面、市场情绪、技术指标和宏观经济事件影响的高度复杂系统。

传统的算法交易系统通常依赖于定量模型，这些模型难以完全捕捉多种因素之间的复杂相互作用。相比之下，LLMs在处理和理解自然语言数据方面表现出色，使其在需要文本理解的任务中特别有效，例如分析新闻文章、财务报告和社交媒体情绪。此外，基于深度学习的交易系统通常存在解释性低的问题，因为它们依赖于驱动决策的隐藏特征，但这些特征难以解释。

尽管语言代理在金融和交易领域具有潜力，但当前大多数应用仍面临两大显著局限：

缺乏真实的组织建模 Lack of Realistic Organizational Modeling： 许多框架未能捕捉到模拟现实世界交易公司结构的代理间复杂互动。相反，它们狭隘地聚焦于特定任务的表现，往往与已被证明在交易中有效的组织工作流程和既定人类操作程序脱节。
通信接口效率低 Inefficient Communication Interfaces：大多数现有系统使用自然语言作为主要通信媒介，通常依赖消息历史记录或非结构化的信息池进行决策。这种方法常常导致“电话效应”，即随着对话延长，细节丢失，状态受损。代理在过滤掉先前决策步骤中的无关信息的同时，难以维持上下文并追踪扩展的历史记录，从而在处理复杂、动态任务时效能降低。

二、相关工作

2.1 LLM 金融助理

LLMs 通过微调金融数据或训练金融语料库应用于金融领域。这提升了模型对金融术语和数据的理解能力，使其成为专门的分析支持、洞察和信息检索助手，而非交易执行工具。

2.1.1 微调金融 LLM

PIXIU (FinMA)：在136K条金融相关指令上微调了 LLaMA；
FinGPT：使用LoRA技术微调了 LLaMA 和 ChatGLM 等模型，涉及约 50K 个金融特定样本；
Instruct-FinGPT：在 10K 条来自金融情感分析数据集的指令样本上进行了微调。

2.1.2 从头训练的金融 LLM

BloombergGPT、XuanYuan 2.0、Fin-T5等模型在预训练阶段结合了公共数据集与金融特定数据。例如，BloombergGPT 在通用文本和金融文本上训练，利用 Bloomberg 专有数据提升了其在金融基准测试中的表现。

2.2 LLM 交易员

LLMs作为交易员智能体，通过分析新闻、财务报告和股价等外部数据直接做出交易决策。

2.2.1 新闻驱动智能体

新闻驱动智能体将股票新闻和宏观经济更新整合到LLM提示中，以预测股价走势。

在金融情感分析中的研究表明，闭源 LLMs（GPT-3.5、GPT-4）和开源 LLMs（Qwen、Baichuan）在基于情感评分的简单多空策略中有效。进一步研究如 FinGPT 和 OPT 等微调 LLMs，展示了通过领域特定对齐提升性能。高级方法包括总结新闻数据并推理其与股价的关系。

2.2.2 推理驱动智能体

推理驱动智能体通过反思和辩论等机制增强交易决策。

反思驱动智能体（FinMem、FinAgent）：利用分层记忆和多模态数据将输入总结为记忆，为决策提供信息，并整合技术指标，在回测中表现出色，同时减少幻觉。
辩论驱动智能体（TradingGPT）：通过不同角色代理间的 LLM 辩论增强推理和事实有效性，改善情感分类，提高交易决策的鲁棒性。

2.2.3 强化学习驱动智能体

强化学习驱动代理强化学习方法通过回测作为奖励，使LLM输出与预期行为对齐。

SEP 采用 RL 结合记忆和反思，基于市场历史优化LLM预测。经典RL方法也用于整合LLM生成嵌入与股票特征的交易框架，通过如**近端策略优化（PPO）**等算法训练。

2.3 LLM 因子挖掘者

LLMs还用于生成 Alpha 因子，而非直接做出交易决策。

QuantAgent：通过内外循环架构利用 LLMs 生成 Alpha 因子。内循环中，写作智能体从交易者想法生成脚本，评判智能体提供反馈；外循环中，代码在真实市场测试，交易结果增强评判智能体。这种方法实现了最优行为的渐进逼近。
AlphaGPT：提出了人机交互 Alpha 挖掘框架。

三、TradingAgents：专业角色

为 LLM 智能体分配明确、定义清晰的角色及具体目标，能够将复杂目标分解为更小、更易管理的子任务。在典型的交易公司中，会收集大量数据，包括财务指标、价格波动、交易量、历史表现、经济指标及新闻情绪等。随后，这些数据由量化专家（如数学家、数据科学家和工程师）利用先进工具和算法进行分析，以识别趋势并预测市场动向。

TradingAgents在模拟交易公司中定义了七个不同的角色：基本面分析师、情绪分析师、新闻分析师、技术分析师、研究员、交易员和风险经理。每个智能体都被赋予特定的名称、角色、目标及一系列约束条件，同时配备与其职能相匹配的预定义上下文、技能和工具（例如，情绪分析师配备有网络搜索引擎、Reddit搜索API、X/Twitter搜索工具及情绪评分计算算法等工具，而技术分析师则能执行代码、计算技术指标并分析交易模式）。

3.1 分析师团队

分析师团队由专门负责收集和分析各类市场数据以指导交易决策的专业智能体组成。每个智能体专注于市场分析的特定方面，共同构建对市场状况的全面视角。

基本面分析师智能体： 通过分析财务报表、收益报告、内部交易及其他相关数据来评估公司基本面。他们评估公司的内在价值，以识别被低估或高估的股票，从而提供长期投资潜力的见解。
情绪分析师智能体： 处理大量社交媒体帖子、情绪评分以及从公开信息和社交媒体活动中提取的内部情绪。他们衡量市场情绪，以预测集体投资者行为可能如何短期内影响股票价格。
新闻分析师智能体： 分析新闻文章、政府公告及其他宏观经济指标，以评估市场的宏观经济状况、重大世界事件及公司重大变化。他们识别可能影响市场走势的新闻事件，帮助预测市场动态的突然变化。
技术分析师智能体： 计算并选择针对特定资产进行定制的相关技术指标，如 MACD 和 RSI。他们分析价格模式和交易量，以预测未来价格走势，协助确定进出场时机。

分析师团队综合来自多源的数据，以提供全面的市场分析。他们整合的见解构成了研究团队的基础输入，确保在后续决策过程中考虑到市场的各个方面。

image-20250109101459066

3.2 研究员团队

研究员团队负责对分析师团队提供的信息进行批判性评估。该团队由牛市研究员和熊市研究员共同组成，他们通过多轮辩论来评估投资决策的潜在风险与收益。

牛市研究员： 通过强调积极指标、增长潜力和有利的市场条件来倡导投资机会。他们构建论据，支持在某些资产上建立或维持头寸。
熊市研究员： 关注潜在的负面因素、风险和不利的市场信号。他们提供警示性见解，质疑投资策略的可行性，并强调可能的负面结果。

通过这种辩证过程，研究员团队旨在达成对市场状况的平衡理解。他们的深入分析有助于识别最有前景的投资策略，同时预见可能的挑战，从而帮助交易员代理人做出明智的决策。

image-20250109101540318

3.3 交易员智能体

交易员智能体负责基于分析师团队提供的全面分析以及研究员团队细致入微的视角来执行交易决策。他们评估综合信息，同时考虑定量数据和定性洞察，以确定最佳交易行动。

评估分析师和研究员的建议与见解。
决定交易的时机和规模，以最大化交易回报。
在市场中下达买入或卖出订单。
根据市场变化和新信息调整投资组合配置。

交易智能体必须在潜在回报与相关风险之间取得平衡，在动态的市场环境中及时做出决策。他们的行为直接影响公司的业绩，因此需要高度的精确性和战略思维。

image-20250109101522149

3.4 风险管理团队

风险管理团队负责监控并控制公司面临的各种市场风险敞口。该团队成员持续评估投资组合的风险状况，确保交易活动保持在预设的风险参数范围内，并符合监管要求。

评估市场波动性、流动性及交易对手风险等因素。
实施风险缓释策略，如设置止损指令或分散持仓。
向交易员智能体提供风险敞口反馈，并建议调整交易策略。
确保整体投资组合与公司的风险承受能力和投资目标相一致。

通过提供监督和指导，风险管理团队有助于维持公司的财务稳定性，并防范不利的市场事件。他们在保护资产和确保长期可持续绩效方面发挥着至关重要的作用。

image-20250109101602187

四、TradingAgents：智能体工作流

4.1 通信协议

现有大多数基于 LLM 的智能体框架采用自然语言作为主要通信接口，但仅依赖自然语言往往不足以解决需要长期规划的复杂任务。纯粹的自然语言通信可能类似于电话游戏——经过多次迭代，初始信息可能会因上下文长度限制和文本过载而被遗忘或扭曲，从而掩盖了早期关键细节。

从 MetaGPT 等框架中汲取灵感，采用结构化的通信方法，引入了一种结构化通信协议来规范代理之间的交互。通过明确定义每个智能体的状态，我们确保每个角色仅提取或查询必要的信息，进行处理并返回完整的报告。这种简化的方法减少了不必要的步骤，降低了消息损坏的风险，并使交互保持专注和高效，即使在复杂且长期的任务中也是如此。

4.2 智能体交互类型

TradingAgents 智能体主要通过结构化文档和图表进行交流，以简洁、组织良好的报告形式封装了代理的见解，保留了核心内容，同时避免了无关信息。通过利用结构化报告，智能体可以直接从全局状态中查询必要的细节，从而无需进行冗长的对话，避免了信息稀释、消息状态无限延长以及数据丢失的风险。

分析师团队： 基本面、情绪、新闻和技术分析师将他们的研究和发现汇编成针对各自专业领域的简明分析报告。这些报告包含基于其专业分析的关键指标、见解和建议。
交易员： 交易员审阅并分析来自分析师的报告，经过仔细考量后生成明确的决策信号。他们为这些决策附上详细报告，解释其理由和支持证据，这些报告随后由风险管理团队使用。

智能体之间的对话和辩论中仅通过自然语言进行交流，能够促进更深层次的推理，并整合多样化的观点，对话状态被记录为整体智能体状态中的一个结构化条目，与结构化的框架无缝融合。

研究员团队：每位研究员智能体查询所有智能体状态以获取分析师报告，并谨慎形成其观点。牛市研究员和熊市研究员在辩论协调智能体的指导下进行 n 轮自然语言对话。辩论结束后，协调者回顾辩论历史，选择占优势的观点，并将其作为结构化条目记录在通信协议中。
风险管理团队：风险管理团队查询交易员的决策及附带报告。随后，他们从风险偏好、中性和厌恶三个角度进行审议，以在风险限制范围内调整交易计划，在协调智能体的引导下进行 n 轮自然语言讨论。
基金经理： 基金经理审阅风险管理团队的讨论，确定适当的风险调整，并在通信协议中更新交易员的决策和报告状态。

4.3 LLMs

依据 LLMs 的优势进行策略性选择。快速思维模型（gpt-4o-mini、gpt-4o）高效处理快速、低深度的任务，如摘要、数据检索及表格数据转文本。深度思维模型（o1-preview）在推理密集型任务上表现卓越，如决策制定、基于证据的报告撰写及数据分析，这些模型利用其架构进行多轮推理，产生逻辑严密、深入的见解。此外，我们优先考虑那些已证明具有可靠性和可扩展性的模型，以确保在各种市场条件下实现最佳性能。我们还采用辅助专家模型来处理特定任务，如情感分析。

分析师均依赖深度思考模型以确保分析的稳健性，通过快速思考模型负责从API和工具中高效检索数据。研究员和交易员利用深度思考模型生成有价值的洞见，支持做出明智的决策。通过将大型语言模型（LLMs）的选择与每项任务的具体需求相匹配，我们的框架实现了效率与推理深度之间的平衡。

这一实施策略确保了 TradingAgents 能够在无需 GPU 的情况下部署，仅依赖 API 额度。同时，它引入了模型的无缝互换性。因此 TradingAgents 具有高度的可扩展性和前瞻性。

五、实验

5.1 数据

为了模拟一个真实的交易环境，我们采用了一个多资产、多模态的金融数据集，该数据集涵盖了苹果、英伟达、微软、Meta、谷歌等多种股票。

历史股价： 2024年1月1日至2024年3月29日的开盘价、最高价、最低价、收盘价、成交量以及调整后的收盘价。
新闻文章： 每日新闻更新来自彭博社、雅虎、EODHD、FinnHub 和 Reddit 等多样化来源，涵盖特定公司动态、全球事件、宏观经济趋势以及政府更新。
社交媒体帖子及情绪： 来自Reddit、X/Twitter等平台的帖子，以及由辅助语言模型计算的帖子情绪得分。
内部人士情绪与交易： 从公开信息中提取的情绪，包括SEDI的交易记录和相关公司文件。
财务报表与收益报告： 公司提交的季度和年度报告。
公司概况与财务历史： 由第三方报告的公司概况、目标行业及财务历史描述。
技术指标： 为每种资产计算的六十种标准技术分析指标，包括MACD、RSI、布林带等。

5.2 模拟设置

模拟交易环境：2024年6月19日至2024年11月19日。

TradingAgents 在模拟过程中实现了策略的无缝即插即用，使得与任何基准的直接比较变得简便。交易代理仅基于截至每个交易日可获得的数据做出决策，确保不使用未来数据（消除了前瞻性偏差），生成买入、卖出或持有资产的交易信号，随后执行这些信号。之后，在继续处理下一天的数据之前，计算分析指标。

5.3 基线模型

买入并持有： 在所有选定的股票中投入等额资金，并在整个模拟期间持有这些股票。
MACD： 一种趋势跟踪动量策略，根据MACD线与信号线之间的交叉点生成买入和卖出信号。
KDJ 与 RSI： 一种动量策略，结合 KDJ 和 RSI 指标识别超买和超卖状态，从而生成交易信号。
ZMR： 一种均值回归交易策略，基于价格偏离零参考线及其随后向该线的回归来生成信号。
SMA： 一种趋势跟踪策略，通过短期和长期移动平均线之间的交叉来生成交易信号。

5.4 评估指标

累计收益率（CR）： 衡量在模拟期间产生的总回报。
年化收益率（AR）： 将累计收益率按年数进行归一化。
夏普比率（SR）： 衡量风险调整后的回报。
最大回撤（MDD）： 衡量投资组合价值从峰值到谷底的最大跌幅。

六、结果和分析

image-20250109110200459

当前用于交易的深度学习方法的显著缺点在于其密集且复杂的架构，这往往使得交易代理做出的决策对人类而言难以解读。相比之下，基于 LLM 的交易智能体框架提供了一个变革性的优势：其操作和决策以自然语言传达，使其对人类高度可解释。TradingAgents 一天的完整交易日志，展示了其使用 ReAct 风格提示框架的情况。

image-20250109110224371

image-20250109110914440

image-20250109110947250

附录有所有角色的工作流，结构化文档和结构化条目

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

标签：模型,arXiv,决策,2024,智能,LLM,团队,交易
From： https://blog.csdn.net/xiangxueerfei/article/details/145032909