レコメンダー システムはデジタル プラットフォーム上でどのように機能しますか?
民主主義にとって、情報の自由な流れほど重要なものはほとんどありません。 トーマス・ジェファーソンが示唆したように、啓発された市民が民主主義にとって不可欠であるならば、市民は常に情報を得る方法が必要です。 現代のほとんどの時代において、その役割は報道機関、特にどのようなニュースを掲載し放送するかをコントロールする編集者やプロデューサーによって担われてきました。
しかし、情報の流れが変化するにつれて、ニュースの配信と消費は従来のメディアからソーシャル メディアやデジタル プラットフォームへとますます移行しており、現在ではアメリカ人の 4 分の 1 以上が YouTube のみからニュースを入手しており、半数以上がソーシャル メディアからニュースを入手しています。 かつては編集者がどの記事を最も広範囲に届けるべきかを決定していましたが、今日ではレコメンダー システムが、ユーザーがオンライン プラットフォームでどのようなコンテンツに遭遇するか、そしてどの情報が大量に配布されるかを決定します。 その結果、これらのプラットフォームの基盤となるレコメンダー システム、およびそれに含まれるレコメンデーション アルゴリズムとトレーニングされたモデルの重要性が新たに明らかになりました。 正確で信頼できる情報が民主主義の生命線である場合、推薦システムはますますその心臓部としての役割を果たします。
推薦者システムが社会で中心的な役割を占めるようになったことで、これらのシステムと、ヘイトスピーチの蔓延から外国のプロパガンダ、政治的過激主義に至るまでのさまざまな害悪との潜在的な関連性を文書化する研究が増えています。 それにもかかわらず、モデル自体は、国民の間でも、モデルを規制し監督する任務を負っている政策コミュニティの間でも、依然として十分に理解されていません。 この記事では、レコメンダー システムの非常に重要性と情報に基づいた監視の必要性の両方を考慮して、レコメンダー システムがどのように進化してきたか、また最新のレコメンデーション アルゴリズムとモデルがどのように機能するかを説明することで、レコメンダー システムの謎を解き明かすことを目的としています。 目標は、研究者や政策立案者が最終的にどのように監督し統治するかについて情報に基づいた意思決定を行えるベースラインを提供することです。
あなたがソーシャルメディアまたはデジタルプラットフォームを運営していると仮定してください。 ユーザーがアプリを開くたびに、魅力的なコンテンツを 1 秒以内に表示したいと考えています。 そのコンテンツをどのように表面化しますか?
最も迅速かつ効率的なアプローチは、コンテンツを時間順に並べ替えることです。 ほとんどのソーシャル ネットワークやデジタル プラットフォームには大量のコンテンツのバック カタログがあるため、ランダムに抽出されたコンテンツよりも、最新または「最も新しい」コンテンツの方が魅力的である可能性が高くなります。 したがって、単純に最新のアイテムを逆時系列で表示することから始めるのが良いでしょう。 さらに、このアプローチは実装が簡単で理解しやすいため、ユーザーは特定のコンテンツが表示されている理由と、アプリがどのように動作するかについての正確なメンタル モデルを常に明確に把握できます。 業界はそれらを超えて進んでいますが、逆時系列レコメンデーション アルゴリズムは、第 1 世代のソーシャル メディア フィードを強化しており、ほとんどのフィードが今日でも「タイムライン」として知られている理由です。
純粋に時系列を逆にしたフィードには、そのシンプルさは魅力的ですが、十分に拡張できないという大きな欠点があります。 プラットフォームが拡大するにつれて、プラットフォームがホストするコンテンツの量は飛躍的に増加しますが、ユーザーの自由時間は増加しません。 したがって、最も最近追加されたコンテンツは、最も魅力的なコンテンツの代理としての役割がますます低下します。 さらに悪いことに、幅広い視聴者を獲得したいユーザーは、他のユーザーのフィードの上位に留まろうと、プラットフォームに新しいコンテンツを大量に送り込むことになります。 その結果、アプリはすぐに最も興味深いユーザーではなく、最もアクティブなユーザーに偏ることになります。 魅力の低いコンテンツ、あるいは完全なスパムさえも、ユーザーのタイムラインに氾濫し始めます。
この問題に対処するには、最新のコンテンツの中で優先順位を付けるハードコーディングされたルールを作成できます。 たとえば、次のようなルールを作成できます。Nicole が Dia の投稿を他のどのユーザーよりも「いいね!」した場合、今日の Nicole Dia の最新の投稿を他のユーザーよりも先に表示します。 または、次のようなルールを作成することもできます。「ニコールが他のどのコンテンツよりもビデオが好きだった場合、彼女の友達から最後に追加されたビデオが、他のコンテンツよりも先にニコルに表示される必要があります。」 これらの手動ルールを組み合わせて照合することにより、属性ベースおよびカテゴリベースの推奨アルゴリズムは、純粋に時系列を逆にしたフィードよりも、より確実に魅力的なコンテンツを表示できます。
ただし、手作業でコーディングされたルールに依存することには欠点もあります。 そのため、開発者は、ユーザーが最も興味を示すものについて多くの仮定を組み込む必要がありますが、その多くは実際には真実ではない可能性があります。 ユーザーは常にテキストよりもビデオを好むのでしょうか? そして、ユーザーが特定の投稿を気に入ったとき、常にその投稿者の投稿をさらに見たいと思うのでしょうか? レコメンデーション アルゴリズムが純粋に手作業でコーディングされている限り、そのアルゴリズムは、ユーザーが最も興味を持っているものについての開発者の仮定に偏ったものになります。このアプローチも拡張性が高くありません。手動で追加するルールが増えるほど、新しいルールが追加されるたびに、新しいルールが追加されます。効率が低下し、コードベースの保守がより困難になります。
ある程度の規模の場合、魅力的なコンテンツを効率的に表示するための最良のアプローチは、機械学習に依存することです。 過去のユーザー データを利用することにより、深層学習レコメンデーション アルゴリズム、およびそのアルゴリズムに基づいてトレーニングされた深層学習レコメンデーション モデルは、ユーザーがどのようなコンテンツに魅力を感じるかを「学習」し、それをユーザーに提示するのに特に効果的であることが証明されています。 現在、すべての主要なプラットフォームは、表示するコンテンツを選択するために何らかのバージョンの深層学習に依存していますが、これらのアプローチにはコストがかかります。逆時系列アルゴリズムは実装と理解が簡単であるのに対し、大規模な深層学習アルゴリズムは実装と効果的な実装が複雑です。理解も解釈も不可能。
どの推奨アルゴリズムがプラットフォームに最適であるかは、パフォーマンス、コスト、解釈可能性の間のトレードオフ、またはアルゴリズムが特定の方法で動作する理由を特定するのがどれだけ簡単かによって決まります。 大規模なソーシャル ネットワークやデジタル プラットフォームの場合、ディープ ラーニング レコメンデーション アルゴリズムのパフォーマンス向上は、開発コストとそれに伴う解釈可能性の低下の両方をはるかに上回ります。
このトレードオフにより、ユーザーはプラットフォーム上のコンテンツに関わり続ける可能性が高くなりますが、民主主義社会にとっては重要な外部性があります。 米国だけでも、研究者らは推薦システムがユーザーを極右過激派の運動や、新型コロナウイルス感染症(COVID-19)や2020年の選挙の結果に関する陰謀論に明らかにさらしていることを文書化している。 推奨システムは、最近の政治的暴力を助長するのに役立っているこれらの運動や物語に関連するコンテンツを広める役割を果たしているにもかかわらず、政策立案者と国民の両方からは依然として十分に理解されていません。 したがって、テクノロジーがどのように機能するかを理解することは、テクノロジーを統治できる「啓発された市民」への重要な第一歩となります。
詳細はプラットフォームによって若干異なりますが、大規模なレコメンダー システムは通常、同じ基本手順に従います。 図 1 に示すように、レコメンダー システムは通常、最初に利用可能なコンテンツのインベントリを作成し、コンテンツ モデレーション ポリシーに従ってそれをフィルタリングします。その後、ユーザーが最も興味を持つ可能性が高いアイテムのみにインベントリを絞り込みます。
近年、デジタル プラットフォームに関連する害悪の軽減に関する政策に関する議論の多くは、完全性のステップ、特にコンテンツを公開または共有できるかどうかを決定するコンテンツ モデレーション ポリシーに焦点を当てていますが、はるかに大きな注意を払う必要があります。ランキングステップへ。 実際に、推薦システムが選挙の誠実さから公衆衛生に至るまであらゆるものに重大な影響を与えているのであれば、推薦システムがコンテンツを並べ替えてランク付けするプロセスも同様に非常に重要になります。 コンテンツのランキングの背後にある複雑なシステムをより深く理解することで、政策立案者はその利用をより適切に監督できるようになるでしょう。
ソーシャル メディア プラットフォームは、他のデジタル プラットフォームとは若干異なる方法でランキング アルゴリズムを設計していますが、一般に、ほぼすべての大規模プラットフォームは、現在、いわゆる「2 つのタワー」アーキテクチャの変形を使用してアイテムをランク付けしています。
これが実際に何を意味するのかを確認するには、2 つの異なるスプレッドシートがあると想像してください。 1 つ目は、すべての行がユーザー、すべての列がユーザー属性 (年齢、場所、検索履歴など) であるスプレッドシートです。 2 番目のスプレッドシートでは、すべての行がコンテンツであり、すべての列がコンテンツ属性 (コンテンツ タイプ、タイトル、いいね! の数など) です。 各スプレッドシートの情報をディープ ニューラル ネットワーク (脳内のニューロンの接続方法に (非常に) 大まかに類似した構造を持つアルゴリズム) の別々の部分でモデル化することにより、「2 つの塔」アプローチにより、時間の経過とともに、次のような可能性が学習されます。特定のユーザーが特定のコンテンツに関与することになります。
このアプローチは非常に成功していることが証明されていますが、大規模なユーザー ベースと豊富なコンテンツ カタログを持つプラットフォームでは、最終的に非常に大規模なモデルをトレーニングする必要があります。 たとえば、10 億人のユーザーと 1 兆個のコンテンツを持つプラットフォームでは、10 の 21 乗の潜在的なユーザーとアイテムのペアに効率的に一般化できるモデルを学習する必要がありますが、ほとんどのユーザーが決してそうではないという事実により、この課題はさらに困難になります。コンテンツの大部分に関与します。 その結果、非常に多くの異なるユーザーとアイテムのペアで適切に動作するには、非常に多くのモデル パラメーター、つまりニューラル ネットワーク内の「ニューロン」を含める必要があります。 このため、推奨アルゴリズムは他の形式の深層学習よりもはるかに大規模になります。 OpenAIが2020年にリリースした強力な大規模言語モデルであるGPT-3のディープニューラルネットワークには1750億個のパラメータ、つまり「ニューロン」があったのに対し、Facebookのニュースフィードを支えるレコメンデーションモデルには12兆個のパラメータがある。 パラメーターが非常に多いため、トレーニングされたモデル自体を調べるだけでは、モデルがどのように動作するかを理解して推論することは事実上不可能です。
最新のレコメンダー システムのアーキテクチャは、政策立案者や一般大衆にとって重要な意味を持っていますが、技術者以外の読者にとっては明らかではないかもしれません。 次の意味は特に重要です。
大規模なレコメンダー システムのアーキテクチャでは、その動作を理解することが難しいため、その動作を評価するより良い方法を見つけることが重要です。 規制当局、研究者、テクノロジー業界はいずれも、モデルをより適切に評価するための措置を講じることができます。 プラットフォームと研究者のコラボレーションから、シミュレートされた環境やその他のプライバシー保護技術に至るまで、レコメンダー システムの動作や影響について、現在よりもさらに明確に把握することが可能になります。
レコメンダー システムの重要性が高まるにつれ、こうした機会を捉えることがますます重要になります。 バイラルビデオアプリの TikTok は、最近インターネット トラフィックで Google を追い越しました。これは主に、ユーザーの接続だけでなく、アプリのユーザーベース全体からコンテンツを表示する改良されたレコメンダー システムのおかげです。 これに応じて、Facebook や Twitter などのソーシャル メディア プラットフォームも同様に、レコメンダー システムによって最初に表示された「インベントリ」を拡大し、プラットフォーム全体からより多くのコンテンツを含めるようになりました。 たとえば、マーク・ザッカーバーグ氏は最近、2023年までにInstagramやFacebookのユーザーフィードのアイテムの30%以上が、ユーザーが友達になっていない、またはフォローしていないアカウントからのものになるだろうと予想していると述べた。 他のプラットフォームも歩調を合わせようと急ぐ中、それらのプラットフォームも純粋に推奨されるコンテンツへの依存度をほぼ確実に高めることになるだろう。
その結果、推薦者システムが民主主義社会に及ぼす潜在的な影響は増大するばかりであり、推薦者システムがどのように機能するかを理解することの重要性も高まるでしょう。
クリス・メセロールブルッキングス研究所の外交政策研究員であり、ブルッキングス人工知能および新興技術イニシアチブの研究ディレクターでもあります。
Facebook と Google は、厳密かつ独立した詳細な公共政策研究に専念する非営利団体であるブルッキングス研究所に財政的支援を提供しています。
在庫の整合性は候補の生成を処理します。 ランキングの再ランキング 結果の指標が重要です。 量が多すぎて説明や解釈ができない 頻繁な再トレーニングとモデルの更新により評価が困難になる 基礎となるコードとトレーニングされたモデルだけを監査することによっては、アルゴリズムへの影響を評価できない Chris Meserole