暗号資産市場におけるAI取引の進化:汎用LLMはリスク調整型専門ボットに及ばず

暗号資産市場におけるAI取引エージェントの性能比較について、Recall Labsが実施した競技会の結果を伝える記事である。GPT-5、DeepSeek、Gemini Proなどの大規模言語モデル(LLM)と、カスタマイズされた専門的なAI取引エージェントを対戦させたところ、リスク調整メトリクス(例:シャープレシオ)を学習プロセスに組み込み、市場状況に応じてリスクと報酬のバランスを取るように設計された専門エージェントが、汎用LLMを上回るパフォーマンスを示した。Recall Labsが主催した約20回のAI取引競技会における知見として、単純な損益(P&L)だけでなく最大ドローダウンやバリューアットリスクなどを考慮する、伝統的金融機関に近いアプローチの有効性が示された。この進歩は、AI取引の「iPhone的転換点」への接近を示唆するが、最も高度なアルファ生成ツールはヘッジファンドやファミリーオフィスが私的に開発・保持する傾向があり、AI取引の民主化とアルファの持続可能性に関する疑問も提起している。

概要

暗号資産市場において、GPT-5やDeepSeekなどの汎用大規模言語モデル(LLM)は、リスクと報酬のバランスを考慮してカスタマイズされた専門的なAI取引エージェントのパフォーマンスに及ばないことが、Recall Labsが実施した一連の競技会で明らかになった。専門エージェントはシャープレシオなどのリスク調整後指標を学習に組み込み、多様な市場条件に対応する。一方、高度なAI取引ツールの恩恵を最初に受けるのは、カスタムツール開発に投資できるリソースを持つヘッジファンドやファミリーオフィスになるとの見方が示されている。

背景

分散型取引所Hyperliquidで最近開催された取引競技会では、GPT-5、DeepSeek、Gemini ProなどのLLMが同じプロンプトを与えられ自律的に取引決定を行ったが、Recall Labsのマイケル・セナ氏によれば、そのパフォーマンスは市場をわずかに上回る程度であった。この結果は、現時点での汎用AIの取引分野における基礎的な能力のベースラインを示すものとなった。

テクニカル詳細

Recall Labsは、コミュニティがAI取引エージェントを提出し、それらが4〜5日間にわたって競い合う「AI取引アリーナ」を約20回運営してきた。同社の最高マーケティング責任者であるマイケル・セナ氏は、成功の尺度が従来は損益(P&L)で測られていたが、アルゴリズムのカスタマイズ方法の進歩により、多様な市場条件に直面した際にリスクと報酬のバランスを継続的に学習するエージェントが生まれていると説明する。学習プロセスにシャープレシオなどのリスク調整後メトリクスを取り入れることで、テストの精緻さが倍増すると述べている。

マーケット動向

具体的な数値として、Recall Labsの競技会では、Hyperliquidコンテストで使用されたAIモデルに対して、人々が構築した取引エージェントを対戦させた。その結果、上位3位はカスタマイズされたモデルが占めた。一部のモデルは収益が上がらずアンダーパフォームしたが、基礎となるAIモデルに追加のロジック、推論、データソースなどを適用する専門的な取引エージェントが、ベースのAIを上回るパフォーマンスを示すことが明らかになった。

影響と展望

AIを利用した取引の民主化は、誰もが同じレベルの高度な機械学習技術を使用する場合、アルファをカバーする余地が残るかどうかという興味深い疑問を提起している。セナ氏は、もし誰もが同じエージェントを使用し、そのエージェントが全員に同じ戦略を実行する場合、それは自己崩壊するのではないか、検出したアルファは他の全員のために大規模に実行しようとするために消えてしまうのではないか、と問いかけている。そのため、AI取引が最終的にもたらす利点から恩恵を受けるのに最も適しているのは、カスタムツールの開発に投資するリソースを持つ主体であると同氏は指摘する。伝統的金融と同様に、最も多くのアルファを生み出す最高品質のツールは通常、公開されていないと付け加えた。

まとめ

汎用の大規模言語モデル(LLM)は、暗号資産取引において一定のベースライン性能を示すが、リスク調整メトリクスを組み込み、特定の比率に対して最適化された専門的なカスタムAI取引エージェントには及ばない。この専門化への移行は、AI取引の「iPhone的転換点」への一歩と見なせるが、最も強力なツールは私的に保持される傾向があり、アルファの持続可能性に関する重要な議論を引き起こしている。

一覧に戻る