AIが設定する労働者の賃金は公正か
Adrienne Bresnahan/Getty Images
サマリー:生成AIが労働市場の価格決定に影響を及ぼす中、大規模言語モデル(LLM)による賃金提案の公平性が問われている。筆者による主要LLMを用いた大規模実験の結果、AIは人間に比べて賃金の提示額を高めに設定する傾向があ... もっと見るり、ジェンダーバイアスは見られないものの、居住地や年齢による著しい格差が生じることが判明した。本稿では、プロンプト設計によるバイアス是正の可能性と限界、そして雇用者やプラットフォームが取るべき対策について詳述する。 閉じる

LMMによる賃金設定の公正性に関する実験

 生成AIの仕事は、メールの下書きから労働市場の形成へと進化しつつある。ファイバー、フリーランサー・ドットコム、アップワークなどのクラウドソーシング・プラットフォームでは、何百万人ものフリーランサーが時給ベースで仕事を求めて競い合っている。そして、AIが価格設定の提案にますます影響を与えるようになる中で、ビジネスリーダーは重大な疑問に直面している。大規模言語モデル(LLM)による価格設定は、はたして公正なのか。それとも、長年、人間の労働市場を蝕んできたバイアスや不公平を引き継いでいるのか。

 筆者らが最近の研究で行った大規模実験では、フリーランサー6万人のプロフィールを、広く利用されている8種類のLLMに提供し、それぞれに時給を推奨させた。次に、プロンプトのアプローチの違いが潜在的バイアスに与える影響を検証するために、ジェンダー、居住地、年齢などのスキル以外の属性を考慮に入れる、または無視するようにLLMに指示した。すべてのバリエーションを合わせると、APIクエリを通じてAIは約400万件の賃金を提案した。

研究の概要

対象範囲

  筆者らは、大手マーケットプレイスのプロフィール6万件を使用した。これらは、6つの領域にまたがっている。すなわち、経理および簿記、フルスタック開発、全般的なバーチャルアシスタント業務、データ分析、グラフィックデザイン、ソーシャルメディアマーケティングといった領域である。各プロフィールには、対象サービス、スキル、経験、居住地が記載されている。

モデル

 8種類のLLM(GPT-4.0、GPT-4.0ミニ、ジェミニ1.5フラッシュ、ジェミニ2.5フラッシュ、クロード3.7ソネット、GPT-5ミニ、ディープシーク-R1、ラマ3.1 405B)にプロンプトを与えた。ベースラインのプロンプトでは、プロフィールの内容に基づいて時給(米ドル)を推奨するよう求めた。

設計

 比較対照のため、スキル以外の属性(ジェンダー、地理的条件、年齢)が一つだけ異なり、それ以外はすべて同一という複製を作成した。次に、異なるパターンのプロンプトを用意した。LLMに対し、a)その属性を考慮に入れるよう求める、b)その属性を無視するよう求める、c)あるスタンスを強く明示的に取らせる、という3種である。

実験結果

AIは価格を押し上げる

 全般的に、AIはフリーランサーの価格を、人間よりも高く設定した。人間が設定した時給は平均23.60ドルだったが、AIが推奨する時給はそれに比べてはるかに高く、LLMによって違いはあるものの30ドルから46ドル近くの額を示した。

 この価格上昇は戦略的にはパラドックスになる。一見、賃金上昇はフリーランサーにとってメリットがあるように思えるが、それが必ずしもよりよい結果につながるとは限らない。クライアントが時給の高さに二の足を踏めば、労働者の就業機会が減るかもしれない。雇用者にとっては、AIベースの賃金ツールを導入すると、期せずして、雇用コストが跳ね上がる、または市場予測がゆがめられる可能性がある。

ジェンダーバイアスの問題はなかった

 筆者らの主な疑問の一つは、AIが女性の労働者を男性よりも低く評価するかどうかだった。意外なことに、答えはノーだった。それどころか、何万回ものテストの結果、ジェンダーに基づく顕著な賃金格差は確認されなかった。ジェンダーを考慮するという明示的なプロンプトをLLMに与えても、やはりジェンダーによる賃金格差は認められなかった。強いバイアスのかかった指示を与えた場合のみ、ジェンダーに基づく格差が表れたが、その後、男性よりも高い賃金を女性に与えることで、必要以上に埋め合わせをする傾向があった。

 これは数少ない明るい面だ。少なくともジェンダーの点では、すでに現行のLLMはジェンダーに基づく差別を回避するようにチューニングされているのかもしれない。

地理的要因は、やはり大きな格差を引き起こす

 だが居住地となると、話は変わる。まったく同じプロフィール2件のうち、一方の居住地は米国、もう一方はフィリピンだとしよう。米国のフリーランサーの場合、AIが推奨する平均時給は71ドルだった。フィリピン拠点のフリーランサーはどうかというと、たったの33ドルだった。50%以上低いのである。

 さらに衝撃的なことに、そのフィリピンのフリーランサーの居住地を「米国」に変えると、推奨時給は2倍以上になった。このパターンは複数の国で繰り返された。富裕地域の労働者のAI推奨賃金は、低所得地域の同じ資質の労働者よりも一貫して高かった。

 興味深いことに、プロンプトに戦略的に介入すると、この結果を変えることができた。地理的要因を考慮に入れないように、LLMに明示的に指示すると、この格差は大幅に縮小した。一部のケースでは、米国拠点のフリーランサーとフィリピン拠点のフリーランサーの賃金格差は半分以上縮小した。

年齢バイアスは年長の労働者に有利に働く

 年齢もバイアスを生む要因であることが明らかになった。60歳のフリーランサーの時給は22歳のフリーランサーの時給よりもおよそ46%高く、同じプロフィールの37歳よりも8.1%高かった。そして地理的要因とは異なり、プロンプトの介入による効果はほとんどなかった。「年齢を無視してください」とLLMに命令しても、ほとんど格差は縮まらなかった。