最先端のAIエージェントでも、フリーランスの仕事の97.5%が完遂できないことが最新調査で明らかになった。しかし、この数字が照らし出すのは、AIの「未熟さ」ではない。むしろ、人間の仕事がいかに複雑で言語化困難かということだ。
97.5%の失敗が証明する人間の価値
2025年10月30日、Scale AIとCenter for AI Safety(CAIS)が公開した研究は、AI業界に冷水を浴びせた。Remote Labor Index(RLI)と呼ばれるこの新しいベンチマークは、最先端のAIエージェントに実際のフリーランス案件を任せ、その遂行能力を測定した。
結果は衝撃的だった。240の実際のプロジェクト(23分野、合計143,991ドル)に対し、最も優秀なAIエージェントでさえ、わずか2.5%しか完遂できず、稼いだ金額は1,810ドルに留まった。人間のフリーランサーが中央値で11.5時間かけて完遂する案件を、AIは97.5%の確率で失敗する。
トップパフォーマーは中国のスタートアップManusのAIエージェントで、次いでxAIのGrok、AnthropicのClaude、OpenAIのChatGPT、GoogleのGeminiが続いた。しかし、いずれも成功率は3%未満だった。
失敗の解剖学:AIが躓く4つのパターン
Scale AIの詳細な分析によれば、AIの失敗はランダムではない。数百件の失敗した提出物を調査した結果、明確なパターンが浮かび上がった。
45.6%はプロフェッショナル品質の欠如だった。クライアントが受け入れる水準に達していない作品が、失敗の半数近くを占めた。
35.7%は不完全または不正な成果物だった。切れた動画、欠けたソースファイル、空のディレクトリ。AIは「完成」の意味を理解していなかった。
17.6%は技術的問題だった。破損したファイル、開けないファイル、使用不能なファイル。形式は正しくても、中身が機能しない。
14.8%は一貫性の欠如だった。同一プロジェクト内で、ビジュアルや論理が矛盾する。
これらの合計が100%を超えるのは、一つの失敗が複数のパターンを同時に示すことがあるためだ。
一つの失敗が複数のパターンを示すこともあった。宝石デザインの案件では、AIは提供されたリング画像を修正するよう指示されたにもかかわらず、その画像を無視し、AI生成の2つの全く異なるリングを提出した。これは品質の問題、指示無視、そして一貫性の欠如を同時に示していた。
言い換えれば、AIが失敗する領域こそ、人間のフリーランサーが価値を提供している領域だ。
「生成」はできるが「編集」はできない境界線
しかし、成功した2.5%には明確なパターンがあった。それは音声・画像生成(効果音、ロゴ)、データ分析、レポート作成といった、ゼロから生成する案件だった。
Scale AIの分析は冷徹だ。「AIエージェントはシンプルなプロンプトからの生成に優れているが、複雑な編集や正確な多段階指示の遂行に失敗する。生成スキルは高いが、信頼できる細部重視のプロフェッショナルとしての能力は低い」
この境界線は、AIの本質的な限界を示している。AIは「作る」ことはできるが、「直す」ことができない。新しいものを生み出すことはできるが、既存のものを理解し、文脈に沿って修正することができない。
あなたがクライアントから「ここをもっと良い感じに」と言われて即座に対応できることが、AIには不可能な能力なのだ。
人間の仕事の「見えない部分」
なぜAIは失敗するのか。CAIS所長のDan Hendrycksは、3つの決定的な欠落を指摘する。
Advertisement
300x250
第一に、長期記憶の保持ができない。プロジェクトの文脈を保持し続けることができない。
第二に、経験からの継続的学習ができない。失敗から学び、次に活かすことができない。
第三に、仕事を通じたスキル習得ができない。「人間のように仕事をしながらスキルを身につけることができない」とHendrycksは述べる。
これは技術的な問題ではなく、構造的な問題だ。AIは「指示通りのタスク実行」はできる。しかし、人間の仕事の本質は、指示通りの実行ではない。文脈を理解し、適応し、判断することだ。
97.5%という数字が問いかけるもの
Remote Labor Indexの研究は、明確な結論を示している。「『差し迫った広範な自動化』という恐怖は、データに支えられていない。97.5%の失敗率は、AIがまだ複雑でプロフェッショナルな仕事を自律的に遂行する能力を持っていないことを示している」
真の課題は、単純なプロンプトから複雑なプロジェクト実行への移行だ。しかし、それ以上に重要なのは、人間の仕事の複雑さを理解することだ。
私たちは自分の仕事の97.5%を、言語化できるだろうか? マニュアル化できるだろうか?
もしできないなら、それこそがあなたの仕事の価値だ。AIに置き換えられる心配をする前に、その97.5%に誇りを持っていい。


