banner

ニュース

Sep 13, 2023

LIME と SHAP を使用した上咽頭がん生存率における機械学習の説明可能性

Scientific Reports volume 13、記事番号: 8984 (2023) この記事を引用

274 アクセス

3 オルトメトリック

メトリクスの詳細

上咽頭がん (NPC) は、他の頭頸部がんと比較して独特の組織病理を持っています。 個々の NPC 患者は異なる転帰を達成する可能性があります。 この研究は、高精度の機械学習モデル (ML) モデルと説明可能な人工知能を組み合わせて、NPC 患者を生存確率の低いグループと高いグループに階層化することで予後システムを構築することを目的としています。 説明可能性は、Local Interpretable Model Agnostic Explains (LIME) および SHapley Additive exPlanations (SHAP) 手法を使用して提供されます。 モデルのトレーニングと内部検証のために、監視、疫学、および最終結果 (SEER) データベースから合計 1,094 人の NPC 患者が取得されました。 5 つの異なる ML アルゴリズムを組み合わせて、独自に積み重ねられたアルゴリズムを形成しました。 スタック アルゴリズムの予測パフォーマンスは、NPC 患者を生存確率グループに階層化するための最先端のアルゴリズムである極端勾配ブースティング (XGBoost) と比較されました。 時間的検証 (n = 547) と地理的外部検証 (ヘルシンキ大学病院 NPC コホート、n = 60) を使用してモデルを検証しました。 開発されたスタック型予測 ML モデルは 85.9% の精度を示しましたが、トレーニングおよびテスト段階後の XGBoost の精度は 84.5% でした。 これにより、XGBoost とスタック モデルの両方が同等のパフォーマンスを示すことが実証されました。 XGBoost モデルの外部地理的検証では、c-index 0.74、精度 76.7%、曲線下面積 0.76 が示されました。 SHAP 技術により、診断時の患者の年齢、T ステージ、民族性、M ステージ、婚姻状況、および等級が、NPC 患者の全生存期間に対する有意性の降順で顕著な入力変数であることが明らかになりました。 LIME は、モデルによって行われた予測の信頼性の程度を示しました。 さらに、どちらの手法も、各特徴がモデルによる予測にどのように寄与するかを示しました。 LIME および SHAP 技術は、各 NPC 患者に個別化された防御因子と危険因子を提供し、入力特徴と生存確率の間のいくつかの新しい非線形関係を解明しました。 検討された ML アプローチは、NPC 患者の全生存の可能性を予測できることを示しました。 これは、効果的な治療計画ケアと情報に基づいた臨床決定にとって重要です。 NPC での生存を含む転帰結果を向上させるために、ML は、この患者集団に対する個別化された治療の計画に役立つ可能性があります。

上咽頭癌 (NPC) は、他の頭頸部癌とは異なる独特の疫学および組織病理学を示す珍しい癌です 1、2、3。 これは、かなりの量の腫瘍が未分化および非角化癌である中国南部および東南アジアの地域で風土病です4、5、6。 しかし、風土病ではない地理的場所では、NPC は角化することも、角化しないこともあります 6,7。 特に、NPC は鼻咽頭の上皮内層、つまり咽頭の上部から始まります 8。

最近、NPC はその発生率と死亡率が大幅に増加しているため、世界的な健康上の懸念として大きな注目を集めています9。 さらに、早期診断に関係なく、NPC の死亡率は地理的位置 (風土病か非風土病か) に関係なくかなり高くなります10。 これは、不適切な治療計画が最適ではない治療結果をもたらしたことが原因である可能性があります11。 したがって、予後不良のがん患者数の増加により社会全体のがん負担が増大するため、NPC 患者の予後を正確に推定することは疾患を効果的に管理するために重要です 1,12。

腫瘍リンパ節転移 (TNM) 病期分類スキームは、依然として NPC 患者の予後予測とリスク層別化の基礎となっています 1。 それにもかかわらず、同じステージの患者が重大な臨床的不均一性と独特の腫瘍学的転帰を示す可能性があるため、TNM の病期分類についての批判が高まっています 13。 同様に、血漿エプスタイン・バーウイルス (EBV) DNA 力価は、NPC 患者にとって有用なバイオマーカーであることが報告されています 14,15。 しかし、EBV DNA を検査することの経済的および経済的影響と研究室間変動は、このバイオマーカーを日常の臨床診療に組み込むことを妨げる重大な要因となっています 16。 したがって、リスク層別化を改善するために、TNM パラメーターに加えて生物学的腫瘍の挙動を反映する非解剖学的予後因子を組み込むことについての議論が進行中です 8,17。 TNM ステージング スキームに加えて他の要素を考慮するための洞察力に富んだ潜在的なアプローチは、人工知能のサブフィールドである機械学習 (ML) の使用です。

いくつかの研究では、NPC の結果の予測におけるさまざまな個別の ML アルゴリズムの使用が検討されています 18,20。 この研究では、ロジスティック回帰、単純ベイズ、k 最近傍法、サポート ベクター マシン、決定木アルゴリズムという 5 つの異なる個別のアルゴリズムのパフォーマンスを活用して、スタック アルゴリズム (スタック一般化) として知られる単一の異なる ML アルゴリズムを生成することを目的としています。 )。 さらに、NPC がん患者の全生存期間の予後を予測するために、スタック アルゴリズムのパフォーマンスを、極端勾配ブースティング (XGBoost) ML アルゴリズムと呼ばれる別の最先端のアルゴリズムと比較することを目的としています。 極端な勾配ブースティングが選択されたのは、多くの臨床応用で有望な結果が得られているためです21。 Local Interpretable Model Agnostic Explains (LIME) および SHapley Additive exPlanations (SHAP) 手法を使用して、XGBoost モデルによって行われた予測の説明と解釈を提供しました。 結果として得られる説明可能かつ解釈可能なモデルは、患者の生存確率を個別に層別化するのに役立ち、予後予測に役立つ可能性があります。 したがって、適切な治療強度を患者に合わせて調整できます。

承認は、国立衛生研究所 (NIH) データベースの監視・疫学・最終結果 (SEER) プログラムを通じて、識別番号 (#17247-Nov2020 [alabir]/SAR0058552 [2023]) とともに国立癌研究所 (NCI) データベースから取得されました。 ])。 SEER および NIH の電子研究管理 (eRA) を通じて、すべての参加者から書面によるインフォームドコンセントが得られました。 この公的に利用可能なデータベースが選択されたのは、さまざまながんの質の高い症例が識別不可能な形式で含まれているためです 22,23。 すべての方法はヘルシンキ宣言に従って実行されました。 さらに、この研究で使用されたすべての方法は SEER ガイドラインに従いました。

国立がん研究所データベースの SEER プログラムで、2020 年 11 月の提出 [2000 ~ 2018 年] が検索されました (図 1)。 上咽頭癌に関して選択された臨床病理学的変数は、米国癌合同委員会 (AJCC) の腫瘍リンパ節転移 (TNM) 第 7 版の病期分類スキーム、診断時の年齢、人種、婚姻状況、性別、およびグレードでした。 治療関連パラメーターには、手術、放射線療法 (RT)、化学放射線療法 (CRT)、および化学療法 (CT) が含まれます (表 1)。 患者の生存期間(月単位)と全生存状況も記録されました。

SEERデータベースからの抽出プロセス。

この抽出プロセス (図 1) から、合計 1,641 件の症例がこの研究に含める資格があることが判明しました (表 1)。 これら 1,641 件のうち、合計 1,094 件がモデルのトレーニングと内部検証のための ML 分析に使用されました。

NPC の希少性と、その結果として公開されているデータが不足しているため、残りの 547 ケースは、モデルのトレーニングまたは内部検証中のトレーニングにもテストにも使用されず、開発されたモデルの一時的な形式の外部検証のために予約されていました (「外部検証、パフォーマンス指標と機能の重要性」)。 Ramspek らは、特に比較的大規模な独立した地理的外部検証コホートが存在しない場合、外部検証の時間的形式を強調しました 24,25。 含まれる各変数と分類の詳細な説明を表 1 に示します。未知のケースはすべて除外されました。

ML プロセスの詳細な説明を図 2 に示します。このプロセスはデータ処理から始まり、ML プロセスを容易にするためにデータが数値変数に変換されます。 処理されたデータは入力パラメータと出力パラメータに分割されました。

典型的な ML トレーニング プロセス。

表 1 に示したパラメーターから、全生存期間 (OS) がこの研究で関心のある結果であると考えられました。 出力変数は比較的バランスがとれているため、データセットが著しく不均衡になる心配はありませんでした。 ステーク アルゴリズムを取得するために、5 つのアルゴリズム (ロジスティック回帰、ナイーブ ベイズ、k 最近傍アルゴリズム、サポート ベクター マシン、決定木アルゴリズム) のそれぞれが 10 倍交差検証を使用してトレーニングされました。 さらに、期待できる予測パフォーマンスが確実に達成されるように、必要なハイパーパラメーターが調整されました。 次に、これらすべてのアルゴリズムが、基本アルゴリズムとしてロジスティック回帰とともにステークされました。 結果として得られたステーキング アルゴリズムは、データセット全体でさらに再トレーニングされました。 個々のアルゴリズムとスタックされたアルゴリズムのパフォーマンスが比較されました。

同様に、同じデータを使用して、別の最先端のアルゴリズム、極端勾配ブースティング (XGBoost) をトレーニングしました。 モデルのパフォーマンスを最大化するためにハイパーパラメータが微調整されました (図 2)。 さらに、主に精度に基づいて、これら 2 つの強力なアルゴリズム (スタック型と XGBoost) のパフォーマンスを比較しました。 パフォーマンスの精度が向上したアルゴリズムは外部検証を受けました。 ML トレーニングは、Jupyter ノートブックの Python バージョン 3.11.0 を使用して実行されました。 訓練されたモデルを使用して、OS の可能性に関して患者を 2 つのグループ、つまり OS の可能性が低いか高いかに階層化しました。 OS 予測の可能性に加えて、ローカル解釈可能なモデルに依存しない説明 (LIME) および Shapley Additive exPlanations (SHAP) 手法を使用して、各変数の寄与度のローカル (LIME) またはローカルとグローバルの両方の説明 (SHAP) を提供しました。モデルの予測パフォーマンス。 LIME テクニックと SHAP テクニックの詳細な説明は、それぞれ「ローカル解釈可能なモデルに依存しない説明 (LIME)」と「Shapley additive exPlanations (SHAP)」で提供されます。

LIME は、ローカルで解釈可能なモデルに依存しない説明の頭字語 26 であり、入力パラメータとモデルによって表される出力の間の関係を調査および分析するために、すでにトレーニングされたモデルに適用されるモデルに依存しない手法です 27。 これは、入力パラメータを微調整し、その微調整が出力に及ぼす影響を観察することによって機能する、ローカル モデルの解釈可能性手法です28。 微調整の重要性は、モデルによって行われた予測の精度の程度を理解し、どの入力変数がデータ サンプルの予測の原因となったかを調査するのに役立ちます。

技術的には、LIME 技術は、摂動サンプルと、最初にトレーニングされたモデルからの対応する予測で構成される新しいデータセットを生成します。 その後、解釈可能なモデルが、サンプリングされたインスタンスの対象インスタンス (つまり、トレーニング データの質量中心) への近さを重み付けすることにより、新しく生成されたデータセット上で LIME によってトレーニングされます。 これは、ローカルで、つまりデータセット全体ではなく単一の予測インスタンスに対して、モデル予測の適切な近似を達成するのに役立ちます。 LIME 手法は、データセット全体から解釈可能性を考慮する他の手法とは対照的に、各サンプル データ ポイントからの解釈可能性を考慮するという意味で、他のモデル解釈可能性手法とは異なります。 したがって、LIME はローカルな解釈可能性を提供します。 この種の近似 (精度) は、ローカル忠実度として知られています。 したがって、LIME ではモデルの忠実性と複雑性の間でトレードオフが生じます。 LIME 手法の制約は次のように与えられます。

ここで、 \({LIME}_{explanation} \left(x\right)\) はインスタンスの LIME 説明 \(\left(x\right). f\) はグローバル モデル (この例では勾配ブースティング決定木) です。勉強)。 \(f\) は \({\mathbb{R}}^{d}\to {\mathbb{R}}.g\) であり、ローカル サロゲート モデルです。 G は可能な説明の族または配列です。 つまり、解釈可能なモデルのクラスです。 \(g\in G\) はモデルとして考えられる説明です。 L は、グローバル/元のモデルの予測に対する説明の近さを測定する損失です。 \({\pi }_{x }\left(z\right)\) は、x からのインスタンス z の近接度の測度です。 つまり、指数平滑化カーネルを使用して、インスタンス \((x)\) の周囲の近傍の大きさを測定する近接度です。 \({\Omega }_{\left(g\right)}\) 説明の複雑さの尺度 \(g\in G.\) つまり、モデルの複雑さ、たとえば入力特徴量 (少ないほど良いです)。

制約式 (1) に基づいて、LIME の動作原理には、グローバル モデル f に関するいかなる仮定も行わずに L を最小化することが含まれます (LIME はモデルに依存しないため)。 損失 (L) は、π(x) で定義される局所性でグローバル モデル (f) を近似する際のローカル代理モデル (g) の不忠実さの尺度です。

SHAP は、2017 年に Lundberg と Lee によって導入された Shapley Additive exPlanations の頭字語です29。これは、ゲーム理論の原理を使用して、モデルの予測の局所的な説明を行います29。 ゲーム理論のコンテキストでは、モデルはゲームのルールとみなされますが、入力特徴はゲームに参加する可能性がある (観察された特徴) か参加しなかった (特徴が観察できなかった) 可能性のある潜在的なプレイヤーです。 したがって、SHAP 技術は、入力特徴のいくつかの異なる組み合わせの下でモデルを評価し、特徴が存在する場合と存在しない場合と比較した出力 (予測) の平均差を計算することにより、Shapley 値を計算します。 この差は Shapley 値として知られ、モデルによる予測に対する特徴の寄与を表します30。 したがって、Shapley 値は、特定の入力に対するモデルの予測に対する各特徴の寄与を定量化します 28,30。

技術的には、SHAP 手法は、各共変量がモデルに存在するかどうかを記述する 2 値変数の線形結合としてモデル予測を表す Shapley 値を返します27。 直観的には、各予測 \(f\left(x\right)\) を \(g ({x}^{^{\prime}})\) で近似します。ここで、バイナリ変数の線形関数 (\({ z}^{^{\prime}} \in {\left\{0, 1\right\}}^{M})\) 分類問題と量 \({\varnothing }_{i} の場合と同様) \in {\mathbb{R}}\) は、(2)27 で指定される加法特徴帰属メソッドによって定義されます。

付加的特徴帰属法は、単一の予測について意味のある説明を提示するために、局所的な精度、欠落性、および一貫性の重要な特性を満たしている必要があります。 したがって、これらの特性を満たす加算法は次のように与えられます。

ここで、 \(f\) は説明される元の予測モデル、 \(g\) は説明モデル、 \(x\) は利用可能な変数です。 \({x}^{^{\prime}}\) は選択された変数、M は簡略化された入力特徴の数、\({f}_{x }\left({z}^{^{\prime }}\right)- {f}_{x} ({z}^{^{\prime}}\backslash i)\) は、単一の予測ごとに、平均からの Shapley 値の偏差を表す数量です。 \(i\) 番目の変数の寄与。

したがって、SHAP 手法では、特定の変数値 \(x\) (局所精度) に対して、元のモデルを局所的に近似する説明モデルとしてシャプリー値を使用します。変数がゼロ (シャプリー値、つまり欠損) に等しい場合は常に、 )。 同様に、変数の寄与が別のモデルでより高い場合、それに対応する Shapley 値もより高くなります (一貫性) 27。

LIME による解釈可能性と説明可能性のために、Python バージョン 3.10.0 の LimeTabularExplainer を使用して、グローバル モデル (この研究では極端な勾配ブースティング [XGBoost]) のトレーニング データを適合させました。 これにより、トレーニング データの並べ替えられたサンプルとグローバル モデルからの対応する予測で構成される新しいデータセットが生成されます。 次に、LIME は、元のトレーニング データから生成された摂動データに基づいて解釈可能なモデル (ローカル サロゲート モデル) をトレーニングします。このデータは、サンプリングされたインスタンスと対象のインスタンスの近さによって重み付けされます。 学習されたモデル (つまり、ローカル代理モデル) は、必ずしも良好なグローバル近似である必要はなく、ローカルでのモデル予測の良好な近似 (ローカル忠実度) である必要があります。 したがって、インスタンス x (この研究では 8 番目のインスタンス) の解釈可能かつ説明可能なモデルは、損失関数 (L in 1) を最小化するローカル代理モデル (g in 1) です。 モデルの複雑さ \({\Omega }_{\left(g\right)}\) を低く保ちながら、可能な説明 (G in 1) が存在する場合に、その説明がグローバル モデルの予測にどれだけ近いかを測定します。 (例: 機能は少ないほうがよい)。 この研究では、入力特徴の数が少なかったため (n = 11)、すべての入力特徴を使用しました。 したがって、特定の予測インスタンス (トレーニング データの 8 番目のインスタンス) の予測出力に対する各予後パラメーターの寄与の説明を調べました (図 4)。

同様に、SHAP 手法は、任意のインスタンス \({x}_{i}\) に対する XGBoost モデル (つまり、ツリーベースのモデル) の決定の最終予測に対する各特徴の寄与を計算します。 具体的には、TreeSHAP を使用してモデル内の特徴の Shapley 値を推定します。 これらの Shapley 値は、モデルによる予測に対する各特徴の寄与を定量化する方法を提供します (図 5)。 シャプレー値は、独立変数のないヌル モデルから開始し、各変数がシーケンス内でこのモデルに追加されるときの平均周辺寄与度を計算することによって計算されます。つまり、すべての可能なシーケンスにわたって平均されます。 加法帰属法 (2) を使用して、データセット全体の SHAP 値を計算して近似しました (図 5)。

したがって、計算量が \(O({TLD}^{2})\) のツリー内のパスを通過したトレーニング サンプルの数に基づきます。ここで、T はツリーの数、L は最大リーフ数です任意のツリー内で、D は任意のツリーの最大深さです。 これにより、ツリーのリーフ ノードからの生の予測が説明されます。 つまり、ルート ノードからリーフ ノードまでツリーを再帰的にたどり、途中の各分割で各フィーチャの寄与を計算することにより、各ノードでの各フィーチャの効果を計算します。 次に、その分割を通過するトレーニング サンプルの数によって寄与度が重み付けされ、特徴のシャプレー値は、その特徴を含むすべてのパスにわたる重み付けされた寄与度の合計として推定されます。 同様に、特定の予測に対する入力特徴の具体的な寄与が調べられました (図 6、7)。 LIME 手法と SHAP 手法は両方とも、XGBoost トレーニング済みモデルに実装されました。

NPC は希少であるため、時間的および地理的な外部検証を組み合わせて使用​​しました。 時間的検証は内部検証と外部検証の間に位置します24。 私たちは時間的検証を完全に独立した地理的外部検証で補完しました。 時間的外部検証は、モデルのトレーニングにもテストにも使用されなかった予約ケース (n = 547) を使用して行われました。 時間的検証のプロセスを補完するために、地理的外部検証のためにヘルシンキ大学病院 (HUS) (研究許可番号: Dnro THL/1197/5.05.00/2012) から収集したデータセット (n = 60) を使用しました (表 2)。 。

地理的外部検証の結果は、モデルのゴールドスタンダードのパフォーマンスを示します (表 3)。 外部検証プロセスのパフォーマンスは、一致指数 (c-index)、曲線下面積 (AUC)、感度、特異性、陽性的中率 (PPV)、陰性的中率 (NPV)、F1 スコア、精度の観点から評価されました。 、およびマシューの相関係数 (表 3)。

ML モデル開発の研究コホートには、上咽頭がん患者 1,094 人が含まれていました。 男性 756 名、女性 338 名で、男女比は 2.2:1 です。 診断時の平均年齢は55.1歳(SD \(\pm\) 15.1: 範囲7~85)、年齢中央値は55.0歳でした。 腫瘍病期に関して、AJCC 7th TNM 病期分類スキームでは、393 人 (35.9%) がステージ T1、206 人 (18.8%) がステージ T2、222 人 (20.3%) がステージ T3、273 人 (25.0%) がステージ T4 であることが示されました。 。 同様に、節点パラメータでは、242 (31.3%) が N0、389 (35.6%) が N1、361 (33.0%) が N2、2 (0.2%) が N3 でした。 一方、M0 は 1001 人 (91.5%)、M1 は 93 人 (8.5%) でした。 組織学的等級に関しては、34 個 (3.1%) の腫瘍が高分化、148 個 (13.5%) が中分化、440 個 (40.2%) が低分化、472 個 (43.1%) が未分化でした。 追跡期間は 0 ~ 107 か月の範囲でした(平均 50.2、中央値 51.5、SD \(\pm\) 30.9)。 民族性などのその他の重要なパラメーターでは、462 人 (42.2%) が白人、89 人 (8.1%) が黒人、543 人 (49.6%) がアメリカインディアン/AK 先住民、アジア/太平洋諸島系を含むその他の出身でした。 婚姻状況を考慮すると、診断時に697人(63.7%)が既婚者であった一方、338人(30.9%)が未婚(独身、離婚、死別、別居)と考えられていた(表1)。 このシリーズで行われた最も一般的な種類の放射線療法はビーム放射線療法でした。 臨床病理学的特徴を表 1 に簡単にまとめます。

診断時の外部検証の時間的形式のコホート(n = 547)の平均年齢は55.1歳(中央値:57; SD \(\pm 14.8;\) 範囲9~85)でした。 男女比は 2.5:1 で、男性 390 人、女性 157 人でした。 民族に関しては、392 人(62.0%)が白人、100 人(18.3%)が黒人、108 人(19.7%)がアメリカインディアン/AK 先住民、アジア/太平洋諸島系を含むその他の出身でした。 婚姻状況を考慮すると、診断時に314人(57.4%)が既婚者であったのに対し、233人(42.6%)は未婚(独身、離婚、死別、または別居)とみなされていた(表2)。 AJCC TNM腫瘍病期分類では、183人(33.5%)がT1期、108人(19.7%)がT2期、123人(22.5%)がT3期、133人(24.3%)がT4期であることが示された。 同様に、節点パラメータでは、177 (32.4%) が N0、215 (39.3%) が N1、154 (28.2%) が N2、1 (0.2%) が N3 でした。 一方、497 人 (90.6%) が M0、50 人 (9.1%) が M1 でした。 グレードに関しては、27 個 (4.9%) の腫瘍が高分化、93 個 (17.0%) が中分化、225 個 (46.6%) が低分化、172 個 (31.4%) が未分化でした。 追跡期間は 0 ~ 107 か月の範囲でした(平均 43.8、中央値 43.0、SD \(\pm\) 28.6)。

地理的外部検証開発のための HUS コホートには、主に白人の NPC 患者 60 人が含まれていました。 これら 60 人の患者のうち、378 人(69.1%)が 40 歳以上で、診断時の平均年齢は 56.9 歳でした(中央値 57: SD \(\pm\) 11.9: 範囲 30 ~ 82)。 男性と女性の比は 1.9:1 で、患者 39 人 (65.0%) が男性、21 人 (35.0%) が女性でした。 グレードに関しては、2 個 (3.3%) の腫瘍が高分化、16 個 (26.7%) が中分化、41 個 (68.3%) が低分化、1 個 (1.7%) が未分化でした (表 2)。 AJCC TNM腫瘍の病期分類に関しては、20人(33.3%)がT1期、10人(16.7%)がT2期、そして15人(25.5%)がT3期とT4期の患者であった。 同様に、節点パラメータでは、24 (40.0%) が N0、12 (20.0%) が N1、23 (38.3%) が N2、1 (1.7%) が N3 でした。 59 人 (98.3%) が M0、1 人 (1.7%) が M1 でした (表 2)。 追跡期間は 0 ~ 215 か月の範囲でした(平均 64.1、中央値 49.0、SD \(\pm\) 57.5)。 手術は、HUS コホートにとって好ましい治療選択肢ではありませんでした (表 2)。 したがって、このコホートのすべての患者は根治的(化学)放射線療法を受けました。

個々のアルゴリズムのパフォーマンス精度は、ロジスティック回帰、ナイーブ ベイズ、k 最近傍アルゴリズム、サポート ベクター マシン、およびデシジョン ツリー アルゴリズムで 85.4%、83.0%、85.2%、85.3%、85.9% でした (図 3)。 積み重ねた場合、積み重ねられたアルゴリズムでは 85.9% の精度が得られました (図 3)。 したがって、これらのアルゴリズムを積み重ねても、モデルの精度が大幅に向上することはありませんでした。

個別アルゴリズムとスタックアルゴリズムのトレーニングパフォーマンス。

同様に、最先端の XGBoost アルゴリズムでは 84.5% のパフォーマンス精度が得られました。 これは、XGBoost とこの研究で調べたスタック アルゴリズムが同等のパフォーマンスを示したことを示しています。 この結果は、XGBoost が 5 つの異なる個別のアルゴリズムを組み合わせたものに匹敵する予測パフォーマンスを生成できる可能性があることをさらに実証しました。 その結果、XGBoost アルゴリズムに対して時間的および地理的外部検証のハイブリッドを実行しました (表 3)。 この調査では、地理的外部検証を伴う XGBoost のパフォーマンス指標がゴールドスタンダードのパフォーマンスとして報告されました (表 3)。

XGBoost の時間的外部検証では、精度 85.9%、c-index 0.87 が得られました。 同様に、XGBoost のパフォーマンス精度は、HUS の地理的コホートを使用して外部検証され、76.7% の精度と 0.74 の c-index が得られました。 時間的コホートと外部地理的コホートの両方の特異度は 0.89 でした。 精度 (陽性的中率) と陰性的中率に関して、XGBoost は時間的検証で 0.93、外部地理的検証で 0.78 の精度を示しました。 陰性的中率は、時間的検証では 0.77、外部地理的検証では 0.76 でした。 ハイブリッド検証アプローチによるその他のパフォーマンス指標を表 3 に示します。

LIME 技術は、インスタンス (つまり、個々の患者) の予測をさらに説明および解釈します (図 4)。

単一インスタンスの LIME 説明可能性。

たとえば、図 4 に示す患者の転帰予測は、この特定の患者が NPC により OS になる可能性が低いことを示しており、予測信頼度は 54.0% です。 さらに、入力された特徴 (例: T ステージ = 進行期、M ステージ = 他の部位に転移、腫瘍グレード = 低分化、民族性 = 白人出身、性別など) を示すことで、予測の理論的根拠をさらに説明します。 = 男性)は、予測された結果(OS の可能性が低い)に寄与しています。

同様に、SHAP 技術は、予測に対する各特徴の寄与を計算することにより、結果の予測の説明を提供します [ローカルおよびグローバルの説明] (図 5、6)。 図 5 (局所予測 - モデルによって行われた個別の予測) から、モデルの予測確率値 \([f(x)]\) は、NPC 患者 1 ~ 3 に対してそれぞれ - 1.90、0.99、および 2.20 でした。 表 1 に示すように、ターゲット結果のラベルは、0 は生存の可能性が高いことを意味し、1 は生存の可能性が低いことを意味します。 したがって、最初の患者のモデルの予測確率は生存の可能性が高く、2 番目と 3 番目の患者の生存の可能性は低いと予測されました (図 5a-c)。

SHAP 力プロットは、(a) 高い生存確率 (b、c) 低い生存リスクを示しています。

予測に対する各特徴の全体的な寄与度。

プロットの矢印上の数字は、各患者の入力特徴の値です (図 5)。 矢印が大きいほど、出力に対する機能の影響が大きくなります。 したがって、 \(\left[f\left(x\right)\right]= -1.90\) の最初の患者の場合、婚姻状況 (未婚)、等級 (中等度の分化型)、民族性 (白人)、患者の年齢(65 歳)、および T ステージ(T3)は、患者の生存の可能性が高いとの予測に負の寄与を持ちます(図 6a)が、他の入力特徴は予測結果に正の寄与を持ちます。 注目すべきことに、婚姻状況と T ステージの両方は、矢印のサイズが等しいため、ほぼ等しいプラスの寄与を持ちます。また、患者の年齢、学年、民族も、矢印のサイズがほぼ等しいため、モデルによる予測に等しい寄与を持っています。 (図5)。

同様に、 \(\left[f\left(x\right)\right]= +0.99\) の 2 番目の患者の場合、放射線治療(放射線治療なし)、性別(男性)、グレード(高分化型)、年齢患者(62 歳)と T 期(T3)は、患者の生存確率が低いという予測にプラスの寄与を持っています(図 5b)が、他の入力特徴は予測結果に対してマイナスの寄与をしています。 同様に、\(\left[f\left(x\right)\right]= +2.20\)、放射線治療(放射線治療なし)、N 期(遠隔転移なし)、婚姻状況(未婚)の 3 番目の患者の場合、 、グレード(中等度分化)、患者の年齢(62歳)、およびTステージ(T4)は、患者の生存確率が低いとの予測にプラスの寄与を持っています(図5c)。 モデルの全体的な予測能力に対する各変数の全体的な寄与は、SHAP beeswarm プロット (サブ「XGBoost モデルの説明可能性と解釈可能性」) に表示されます。

SHAP 技術に基づく入力変数の特徴重要度は、有意性の降順で、患者の年齢、T ステージ、民族性、M ステージ、婚姻状況、および腫瘍の悪性度が、 NPC 患者の OS の可能性を予測するためのモデルのパフォーマンスに大きな影響を与える入力変数 (図 6)。 同様に、NPC の生存確率に対するこれらの変数の詳細な寄与を図 7 に示します。

XGBoost モデルの予測能力に対する入力変数の影響に関する SHAP ミツバチの概要プロット。

SHAP beeswarm プロットは、各変数に含まれるパラメーターが目的の結果にどのように寄与するかについての詳細な説明 (全体的な説明と解釈) をさらに提供します。

図 7 に示すように、期待される結果は、生存の可能性が高い (X 軸の負の側) か、生存の可能性が低い (X 軸の正の側) かのいずれかになります。 したがって、各予後パラメーターの効果の詳細を図 7 に示しました。 したがって、年齢が低い、T および M (腫瘍および遠隔転移) ステージが低い、既婚、アジア系の民族性、性別 (女性) であることがわかりました。 、および非外科的治療(化学療法および放射線療法)は、NPCのOSのより高い可能性と関連していました(図7)。

私たちは、5 つの異なる個別のアルゴリズムの有望な予測パフォーマンスを、高い予測パフォーマンス精度を持つ単一の独自のアルゴリズム (スタック アルゴリズム) に結合することで活用しました。 スタックされたアルゴリズムは、上咽頭がん (NPC) 患者の生存確率を予測するための機械学習 (ML) システムを開発するために使用されました。 極度勾配ブースティング (XGBoost) アルゴリズムの優れたパフォーマンスにより、多くの臨床アプリケーションでその応用が拡大していることを考慮して、スタック アルゴリズムの予測パフォーマンスを、XGBoost アルゴリズムを使用して開発された別のモデルと比較しました。 この比較は、ヘルシンキ大学病院 (HUS) からの独立した地理的外部検証コホートに基づいています。 スタックされたアルゴリズムと XGBoost アルゴリズムの両方が、NPC 患者の生存確率層別化において同等に機能することがわかりました。

さらに、ML モデルの予測は不透明で解釈できないことが多いため、ML モデルに対する批判が続いているため、LIME および SHAP 技術を使用して XGBoost モデルによって行われる予測に説明可能性と解釈可能性を組み込みました。 これらの技術は、各変数がモデルによって予測される OS の可能性 (局所的解釈) にどのように寄与したか、特定の患者の OS の予測可能性 (局所的説明) の精度の程度、およびこれらの各変数がどのように寄与したかに関する患者固有の情報を強調表示します。モデルの予測パフォーマンスに貢献しました (全体的な説明と解釈)。 このアプローチは、NPC がんの個別管理を目的としています。

過去には、頭頸部がんのさまざまな部分部位の転帰の予測にいくつかの ML アルゴリズムが使用されてきました 18、20、31、32、33、34、35。 しかし、特に上咽頭がんの予後評価における ML の可能性を探る傾向が高まっています 18,20。 たとえば、Oei らによる研究。 特に ML アプローチと従来の統計を比較したところ、ML がこれらを上回るパフォーマンスを示したことがわかりました20。 同様に、Akcay らによる研究も同様です。 は、NPC 患者の転帰の予測において、さまざまな個別の ML アルゴリズムを比較しました 18。 ただし、これらの研究では比較的少数の症例が使用されました。 さらに、開発されたモデルは外部から検証されず、説明可能でもありませんでした。 私たちは、比較的多数の症例を使用して、NPC の OS の予測における 5 つの個別の ML アルゴリズムを組み合わせたスタック型 ML アルゴリズムの可能性を調査することで、この研究ギャップに焦点を当てました。 この研究分野で得られた有望な結果に基づいて、パフォーマンスを向上させるために、基礎となる ML アルゴリズムにさまざまな変更が加えられました。 これらの変更の例としては、極端な勾配ブースティング ML アルゴリズム (short36 の XGBoost) を実現するための勾配ブースティング アンサンブル パラダイムの効果的な実装が挙げられます。 したがって、我々は、NPC 患者の OS の予後を予測するためのこの強力なアルゴリズムの使用を検討しました。 さらに、この研究では、LIME および SHAP 技術の可能性を活用して、モデルによって行われた予測の説明と解釈を提供しました。 具体的には、SHAP 手法は、XGBoost モデルの OS チャンス階層化パフォーマンスにおける各入力変数の重要性についてさらに説明を提供する準備ができています。

複数のアルゴリズムを組み合わせてスタック モデルを形成しているにもかかわらず、XGBoost モデルだけでも同等のパフォーマンスを生み出しました。 これは、アルゴリズムが一連の反復的に構築されたツリー モデルを生成するように構築されており、ツリーが一度に 1 つずつアンサンブルに追加され、以前のモデルによって生じた予測誤差が適切に修正されるように適合されるためです 36,37。 このアーキテクチャ (ブースティング アプローチ) により、モデルのパフォーマンスが向上します 36,37。 したがって、これは、スケーラブルなエンドツーエンドのツリー ブースティング システム アーキテクチャに基づいた、計算効率の高い (つまり、実行が速い) ML アルゴリズムです36。 医療データの継続的な増加と、個別化された高精度医療の追求を考慮すると、極端な勾配ブースティング アルゴリズムは、非常に高速な実行速度とモデルのパフォーマンスを提供できるため、最適な ML になる可能性があります36。

トレーニングされた ML モデルによって示される予測精度は、正確で客観的で低コストの支援ツールを臨床医に提供すると考えられています 18。 このモデルは、複数のパラメーターを組み込むことにより、生存予後における TNM 病期分類システムを補完する改善された意見を臨床医に提供する可能性があります。 このような戦略は、NPC 患者に個別の治療計画を提供するために重要です。 XGBoost モデルの予測パフォーマンスに加えて、Local Interpretable Model Agnostic Explains (LIME) と SHapley Additive exPlanations (SHAP) の両方の手法が、モデルによる予測結果の理論的根拠を提供します。

LIME 技術と SHAP 技術はどちらも、ML モデルによって行われた予測に説明を提供するためのモデルに依存しない技術です 27,29。 これらの手法は、入力特徴とターゲット結果の間の複雑な関係を解釈できます。 たとえば、LIME アプローチでは、予測が正確である確率の程度と、各要因が予想される結果にどのように寄与したかが明らかになります (図 4)。 LIME 技術によって提供されるこの追加機能は、特に予測結果に関して透過的な ML モデルを提供すると想定されています。 その結果、意思決定者としての臨床医やその他の利害関係者は、モデルの出力につながる決定の説明に関して、より高い可視性、理解、信頼を得ることができます。 一方、SHAP テクニックは、LIME によって提供される説明可能性と解釈可能性を提供しますが、ゲームの理論的に最適な Shapley 値を使用して、より詳細かつコンパクトな方法で提供されます。

LIME と SHAP 手法の主な違いは、LIME は ML モデルによって行われた単一の予測の説明と解釈 (ローカル解釈) のみを提供するのに対し、SHAP はモデルによって行われた予測に対する各入力変数の寄与 (ローカルな説明と解釈) を提供することです。解釈)(図5、7)。 さらに、SHAP 手法は、モデルの全体的な予測能力 (全体的な説明と解釈) に対する各入力変数の寄与を検査します (図 6)。 入力変数の一般的な概要を提供する従来の特徴重要度とは異なり、SHAP ベースの特徴重要度は、各変数に含まれるパラメーターがモデルの全体的な予測能力にどのように寄与しているかをさらに明らかにします (図 5)。

SHAP 技術を使用した OS 予測に対する入力変数の重要性から、年齢、T ステージ、民族性、M ステージ、婚姻状況、および学年が、重要性の高い順に最も重要な予後因子であることが示されました (図 6)。 。 具体的には、年齢が低いこと、T 期および M (腫瘍および遠隔転移) 期が低いこと、既婚であること、アジア系民族であること、性別 (女性)、および非外科的治療 (化学療法および放射線療法) が NPC の OS の可能性が高いことと関連していました (図 1)。 7)。 この観察は、いくつかの研究 12、38、39 によって裏付けられ、強調されています 12、38、39。たとえば、一連の 469 人の NPC 患者における年齢の予後の役割を実証した Zhu らの研究 12。 NPC の発生は年齢とともに着実に増加し、発生率のピークはさまざまな年齢で発生しますが、通常は 40 ~ 59 歳の間です 12、40、41、42。 したがって、患者を若年または高齢の NPC 患者として層別化し、両方のグループに治療ガイドラインを提供するための閾値を定義するための努力が、さまざまな組織によって行われるべきである 18。 この研究では評価された ML モデルによる年齢の特定が重要な要素であるため、標的治療法に関して NPC の年齢特有の違いを認識することは非常に重要です 12。

私たちの ML モデルでは、民族性が生存のための重要な要素の 1 つであることが特定されました。 これは、NPC が中国南部と東南アジアで風土病であるという事実によって裏付けられています 43、44、45。 我々のSHAP技術により、NPC患者のOSの予後予測において遠隔転移が重要であると考えられた。 高度遠隔転移は無病生存期間およびOSの有意な低下と関連しているため、これは上咽頭がんにおける最も重要な負の予後因子であると報告されている44、49、50。 この結果は、再発と遠隔転移が現在のNPCにおける最適以下の治療結果の主な理由であることを示す他の研究によって裏付けられました51,52。 さらに、NPC はリンパ管網が豊富な領域の近くで発生するため、頭頸部の他の部位からの癌よりも転移する傾向が高くなります 10,53。

特に、診断時に遠隔転移があった患者の予後は、治療後に遠隔転移を発症した患者とは異なります54、55、56、57、58、59。 同時に、AJCC 病期分類スキームは遠隔転移のある患者を単一のグループとして考慮しているため、遠隔転移のある患者の前述の予後の違いに対する洞察に富んだ解決策を提供するとは思われません 54,60,61。 したがって、診断時であっても NPC 患者の OS の予測を可能にする生存確率層別化システムとして ML モデルを適用することは、治療上の意思決定と研究の両方にとって価値があります。

放射線療法は NPC にとって選択される治療法であり 46、47、48、54、62、63、全身化学療法は依然として重要な補助療法である 54。 しかし、これらの主要な治療法はいずれも、SHAP 技術によって NPC の OS の予測において最も重要なものとして強調されることはありませんでした。 代わりに、放射線療法と化学療法を含む併用治療戦略が、NPC の OS に最も有用であると考えられます 64,65。 強度変調放射線療法の使用は、NPC の OS 率を改善するための効果的な治療アプローチを提供します66、67、68。

結論として、NPC の予後を推定するための ML アルゴリズムなどの破壊的技術の使用は、遠隔転移を有する NPC 患者における AJCC TNM 病期分類スキームと不均一な治療結果の不均衡に対処する準備が整っています。 これは、ML アプローチにより、標的を絞った治療計画の結果について正確な予測を提供できるためです。 ML パラダイムは、これらの変数間の複雑な関係を調べることができます。 さらに、同様の患者が過去にどのような反応を示したかを分析することができ、それによって検討中の新しい患者の転帰を予測することもできます。 この複雑で異種の疾患群における転帰の予測は、それに応じて治療計画を立てる上で重要です。 したがって、高精度で最先端の ML モデルを説明可能性と解釈可能性と組み合わせることで、NPC 患者の生存確率層別化に有望な方法が提供されます。

私たちの研究にはいくつかの限界があります。 まず、私たちのモデルは、米国人口を対象として公的に利用できる最大のがんデータベースの 1 つである SEER データベースから取得したデータを使用して開発されました。 したがって、このデータベースから得られたデータは、中国南部や東南アジアで見られる EBV 関連の風土病 NPC には直接適用できません。 注目すべきことに、NPC の EBV バリアントは、散発性 NPC で見られる他のタイプと比較して、WHO 分類タイプ 3 に属しています。 したがって、NPC には固有の違いがあるため、この研究で提案されたモデルをアジアの NPC データセットに直ちに関連付けることはできません。 次に、ML モデルは遡及データに基づいて開発されました。 第三に、開発されたモデルは、時間的および地理的な外部検証パラダイムのハイブリッドを使用して外部的に検証されました。 比較的多くの事例があれば、さらなる地理的外部検証が保証されます。 モデルの全体的な実行メトリクスは、よりバランスの取れたデータセットを使用してモデルを再トレーニングできる可能性があることを示しました。 これらの欠点にもかかわらず、ML モデルは依然として重要な予測能力を示しました。 アジアの患者グループを含む他の集団におけるさらなる検証が重要であり、前向き研究が正当化される。 アジアの患者グループに関連して、血漿 EBV-DNA を TNM 病期分類に統合すると、予後への影響がさらに識別されることが発表されています。 したがって、将来の研究では、そのようなデータを使用して AI モデルを開発することができます。 このようなモデルは、生存確率の層別化および管理ガイダンスのための補助ツールとして機能する可能性があります。 将来的には、フェデレーテッド ラーニングを通じてモデルのパフォーマンスを向上させることができます。

現在の研究から生成されたデータセットは、合理的な要求に応じて責任著者から入手できます。

チェン、CLら。 上咽頭癌の全生存期間の予後因子と UICC による TNM 病期分類への影響: 文献の系統的レビュー。 フロント。 オンコル。 11、(2021)。

ロサンゼルス、トーレら。 世界のがん統計、2012 年:世界のがん統計、2012 年。CA Cancer J. Clin。 65、87–108 (2015)。

論文 PubMed Google Scholar

Wei, K.、Xu, Y.、Liu, J.、Zhang, W. & Liang, Z. 上咽頭癌の組織病理学的分類。 アジアンパック J. キャンサー前 12、1141–1147 (2011)。

PubMed Google Scholar

El-Naggar、AK、Chan、JKC、Takata、T.、Grandis、JR、Slootweg、PJ 頭頸部世界保健機関ブルーブックの第 4 版: 編集者の視点。 ハム。 パソル。 66、10–12 (2017)。

Huang、WB、Chan、JYW、および Liu、DL ヒトパピローマウイルスと世界保健機関 III 型上咽頭癌:中国南部の流行地域からの多施設共同研究:ヒトパピローマウイルスと NPC。 Cancer 124、530–536 (2018)。

論文 PubMed Google Scholar

アルマングシュ、A. et al. 腫瘍浸潤リンパ球は非風土病性上咽頭癌の転帰と関連する:多施設共同研究。 ハム。 パソル。 81、211–219 (2018)。

論文 CAS PubMed Google Scholar

Ruuskanen、M. et al. フィンランドにおける上咽頭癌の転帰: 全国規模の研究。 アクタ・オンコル。 57、251–256 (2018)。

論文 PubMed Google Scholar

Guo、R.ら。 上咽頭癌の病期分類の進化。 BJR 92、20190244 (2019)。

記事 PubMed PubMed Central Google Scholar

フェルレー、J.ら。 世界がん観測所: がんの現状 (2018)。 (2020年)。

リー、AWM et al. 上咽頭がんとの闘い。 ラジオザー。 オンコル。 104、272–278 (2012)。

論文 PubMed Google Scholar

Kernohan, MD、Clark, JR、Gao, K.、Ebrahimi, A. & Milross, CG 最初の再発後の口腔扁平上皮癌の予後を予測する。 アーチ。 耳鼻咽喉科。 頭頸部外科手術 136、1235 (2010)。

論文 PubMed Google Scholar

Zhu, Y.、Song, X.、Li, R.、Quan, H. & Yan, L. 30 歳以下の若年患者の上咽頭がんの評価。 フロント。 オンコル。 9、(2019)。

リー、AWM et al. 上咽頭癌の AJCC/UICC 病期分類システム (第 7 版) の長所/短所と今後の改善への提案。 経口オンコル。 48、1007–1013 (2012)。

リン、J.C. 他。 進行性上咽頭癌患者の血漿エプスタイン・バーウイルス DNA の定量化。 N.Engl. J.Med. 350、2461–2470 (2004)。

論文 CAS PubMed Google Scholar

ワン、W.-Y. 他。 血漿エプスタイン・バーウイルス DNA レベルによる上咽頭癌の長期生存分析。 Cancer 119、963–970 (2013)。

論文 CAS PubMed Google Scholar

ル、Q.-T. 他。 上咽頭癌における将来のバイオマーカーに基づく臨床試験のために、定量的血漿エプスタイン・バーウイルス DNA アッセイを調和させるための国際協力。 クリン。 がん研究所 19、2208–2215 (2013)。

論文 CAS PubMed PubMed Central Google Scholar

パン、X.-X. 他。 上咽頭癌の UICC/AJCC 病期分類システムの第 8 版に基づく簡易 T 分類。 CMAR 11、3163–3169 (2019)。

Akcay, M.、Etiz, D.、Celik, O.、Ozen, A. 機械学習を使用した上咽頭がんの予後の評価。 テクノロジー。 がん研究所扱う。 19、153303382090982 (2020)。

記事 Google Scholar

Alabi, RO、Elmusrati, M.、Leivo, I.、Almangush, A. & Mäkitie, AA 進行期の舌扁平上皮癌: リスク層別化と治療計画のための機械学習モデル。 アクタ・オト・喉頭。 (2023) https://doi.org/10.1080/00016489.2023.2172208。

大栄、RW 他強度変調放射線治療後の上咽頭癌患者の無増悪生存予測: 機械学習と従来の統計。 J.パーソナル。 医学。 11、787 (2021)。

記事 Google Scholar

チェン、T.ら。 IgA腎症における腎臓転帰の予測とリスク階層化。 午前。 J.腎臓Dis. 74、300–309 (2019)。

論文 PubMed Google Scholar

リー、Yら。 舌扁平上皮癌患者の長期全生存期間と舌癌特異的生存期間を推定するためのノモグラム。 がん医学。 6、1002–1013 (2017)。

記事 PubMed PubMed Central Google Scholar

SEER、プログラム。 監視、疫学、および最終結果 (SEER) プログラム (www.seer.cancer.gov) 研究データ 1973 ~ 2009 年、国立がん研究所 DCCPS、監視研究プログラム、監視システム部門、2011 年 11 月の提出に基づいて 2012 年 4 月に発表(2012年)。

Ramspek、CL、Jager、KJ、Dekker、FW、Zoccali、C. & van Diepen、M. 予後モデルの外部検証: 何を、なぜ、どのように、いつ、どこで? クリン。 Kidney J. 14、49–58 (2021)。

論文 PubMed Google Scholar

オモボラジ・アラビ、R. 他中咽頭癌における全生存リスク層別化のための人工知能の応用: ProgTOOL の検証。 内部。 J.Med. 知らせる。 175、105064 (2023)。

論文 PubMed Google Scholar

Ribeiro, MT、Singh, S. & Guestrin, C. 「なぜあなたを信頼すべきですか?」: 分類器の予測について説明します。 arXiv:1602.04938 [cs、統計] (2016)。

Gramegna、A. & Giudici、P. SHAP、LIME: 信用リスクにおける識別力の評価。 フロント。 アーティフ。 知性。 4、752558 (2021)。

記事 PubMed PubMed Central Google Scholar

Alabi, R.、Almangush, A.、Elmusrati, M.、Leivo, I. & Mäkitie, AA 中咽頭がんのリスク階層化のための解釈可能な機械学習予後システム。 内部。 J.Med. 知らせる。 168、104896 (2022)。

記事 Google Scholar

ルンドバーグ、SM & リー、S.-I. モデル予測を解釈するための統一されたアプローチ。 米国カリフォルニア州ロングビーチで開催された第 31 回神経情報処理システム会議 (NIPS 2017) にて。 (2017年)。

Joseph, A. ユニバーサル関数近似器を使用したパラメトリック推論。 (2019) https://doi.org/10.48550/ARXIV.1903.04209。

アラビ、RO 他早期口腔舌癌における局所領域再発の予測における教師あり機械学習分類手法の比較。 内部。 J.Med. 知らせる。 https://doi.org/10.1016/j.ijmedinf.2019.104068 (2019)。

論文 PubMed Google Scholar

アラビ、RO 他早期口腔舌癌における局所領域再発を予測するための機械学習アプリケーション: Web ベースの予後ツール。 ヴィルヒョウのアーチ。 475、489–497 (2019)。

論文 CAS PubMed PubMed Central Google Scholar

バー、AM et al. 早期口腔扁平上皮癌における潜在的なリンパ節転移を予測するための機械学習。 経口オンコル。 92、20–25 (2019)。

論文 PubMed Google Scholar

Karadaghy, OA、Shew, M.、New, J. & Bur, AM 口腔扁平上皮癌患者の生存予測に役立つ機械学習モデルの開発と評価。 JAMA耳鼻咽喉科。 頭頸部外科手術 145、1115(2019)。

記事 PubMed PubMed Central Google Scholar

Karadaghy, OA、Kallogjeri, D. & Piccirillo, JF 非転移性甲状腺乳頭癌患者のための新しい臨床重症度分類システムの開発。 JAMA耳鼻咽喉科。 頭頸部外科手術 143、1173 (2017)。

記事 PubMed PubMed Central Google Scholar

Chen, T. & Guestrin, C. XGBoost: スケーラブルなツリー ブースティング システム。 第 22 回 ACM SIGKDD 知識発見とデータ マイニング国際会議議事録 785 ~ 794 (ACM、2016)。 https://doi.org/10.1145/2939672.2939785。

チェン、Xら。 腫瘍量の特徴に基づいた、局所領域進行性上咽頭癌に対する解釈可能な機械学習予後システム。 経口オンコル。 118、105335 (2021)。

論文 PubMed Google Scholar

ハミルトン、SN et al. 上咽頭癌におけるアジア人対非アジア人の転帰:北米の人口ベースの分析。 午前。 J.クリン. オンコル。 39、575–580 (2016)。

論文 PubMed Google Scholar

リー、W.-Z. 他。 上咽頭癌生存率における男女差の年齢依存的変化。 バイオル。 性別が違う。 12、18 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Qiu、W.-Z. 他。 小児および青年期上咽頭癌の治療における強度変調放射線療法と従来の二次元放射線療法の結果と毒性を比較した後ろ向き研究。 J.Cancer Res. クリン。 オンコル。 143、1563–1572 (2017)。

記事 PubMed PubMed Central Google Scholar

リー、Yら。 ステージ II ~ IVb の上咽頭癌に対するセツキシマブを併用または併用しない同時化学放射線療法: 症例対照研究。 BMC Cancer 17, 567 (2017)。

記事 PubMed PubMed Central Google Scholar

Wei, K. et al. 2010 年の中国における上咽頭癌の発生率と死亡率。Chin。 J. キャンサー。 33、381–387 (2014)。

PubMed PubMed Central Google Scholar

曹、S.-M.、サイモンズ、MJ、銭、C.-N. 中国における上咽頭癌の有病率と予防。 顎。 J. Cancer 30、114–119 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

Yeung、DCM、Yeung、Z.、Wong、EWY、Vlantis、AC & Chan、JYK 局所再発または持続性上咽頭癌の生存に関する頸部リンパ節の状態。 科学。 議員 10、(2020)。

Luo、J.ら。 シンガポール、香港、ロサンゼルスの中国人集団における上咽頭癌発生率の長期的傾向、1973 ~ 1997 年。 ユーロ。 J.Epidemiol. 22、513–521 (2007)。

論文 PubMed Google Scholar

イェー、S.-A.、タン、Y.、ルイ、C.-C. & Huang、E.-Y. AJCC Stage IVC 上咽頭癌患者の治療結果: 初回放射線療法の利点。 日本 J.クリン. オンコル。 36、132–136 (2006)。

論文 PubMed Google Scholar

リン、S.ら。 高線量放射線療法と全身化学療法を併用すると、新たに転移性上咽頭がんと診断された患者の生存率が向上します。 午前。 J.クリン. オンコル。 35、474–479 (2012)。

論文 ADS CAS PubMed Google Scholar

チェン、M.-Y. 他。 診断時に上咽頭癌の遠隔転移がある患者に対する局所領域放射線療法。 顎。 J. Cancer 32、604–613 (2013)。

記事 PubMed PubMed Central Google Scholar

チュア、DTT、シャム、JST、ウェイ、ウィスコンシン、ホー、W.-K。 & Au, GKH 上咽頭癌の失敗パターンを決定する際の、1997 年の米国癌合同委員会の病期分類の予測値。 Cancer 92、2845–2855 (2001)。

3.0.CO;2-7" data-track-action="article reference" href="https://doi.org/10.1002%2F1097-0142%2820011201%2992%3A11%3C2845%3A%3AAID-CNCR10133%3E3.0.CO%3B2-7" aria-label="Article reference 49" data-doi="10.1002/1097-0142(20011201)92:113.0.CO;2-7">論文 CAS PubMed Google Scholar

リン、S.ら。 体積減少強度変調放射線療法で治療された上咽頭癌:前向きシリーズの 3 年間の結果についての報告。 内部。 J.ラディアット。 オンコル。 バイオル。 物理学。 75、1071–1078 (2009)。

論文 PubMed Google Scholar

Sun, J.、Huang, Z.、Hu, Z.、Sun, R. 上咽頭癌患者の生存に対する局所腫瘍切除と咽頭切除術の利点: SEER データベースに基づく後ろ向き観察研究。 J.Transl. 医学。 15、116 (2017)。

記事 PubMed PubMed Central Google Scholar

Zhu、Q.ら。 アシルグリセロールキナーゼの過剰発現は、上咽頭癌における予後不良およびリンパ節転移と関連しています。 腫瘍生物学。 37、3349–3357 (2016)。

記事 CAS Google Scholar

ラザック、ARA 他上咽頭癌:次の課題。 ユーロ。 J. Cancer 46、1967–1978 (2010)。

論文 PubMed Google Scholar

Tian、Y.ら。 診断時のIVc期上咽頭癌患者の予後モデルと最適な治療。 科学。 議員9号(2019年)。

Teo、PML、Kwan、WH、Lee、WY、Leung、SF & Johnson、PJ 上咽頭癌の遠隔転移後の生存を決定する予後予測者。 Cancer 77、2423–2431 (1996)。

3.0.CO;2-N" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291097-0142%2819960615%2977%3A12%3C2423%3A%3AAID-CNCR2%3E3.0.CO%3B2-N" aria-label="Article reference 55" data-doi="10.1002/(SICI)1097-0142(19960615)77:123.0.CO;2-N">論文 CAS PubMed Google Scholar

Ong、YKら。 転移性上咽頭癌の予後指標スコアの設計。 ユーロ。 J. Cancer 39、1535–1541 (2003)。

論文 CAS PubMed Google Scholar

ファンディ、A.ら。 上咽頭型の転移性未分化癌における長期無病生存者。 J.クリン. オンコル。 18、1324–1330 (2000)。

論文 CAS PubMed Google Scholar

Khanfir, A.、Frikha, M.、Ghorbel, A.、Drira, MM & Daoud, J. 転移性上咽頭癌の予後因子。 がん/放射線治療 11、461–464 (2007)。

論文 CAS PubMed Google Scholar

ジン、Y. 流行地域における転移性上咽頭癌に不可欠な腫瘍マーカーを含む予後スコアモデルを構築する。 ユーロ。 J. Cancer 48、882–888 (2012)。

論文 CAS PubMed Google Scholar

パン、C.-C. 他。 上咽頭癌の TNM 病期分類システムの M1 期の修正における課題: 1,027 例の研究と文献のレビュー。 経験値それで。 医学。 4、334–338 (2012)。

記事 PubMed PubMed Central Google Scholar

AJCC がん病期分類ハンドブック: AJCC がん病期分類マニュアルより。 (スプリンガー、2010)。

Setton, J.、Wolden, S.、Caria, N. & Lee, N. 転移性上咽頭癌の根治的治療: 文献レビューを含む 5 例の報告。 ヘッドネック 34、753–757 (2012)。

論文 PubMed Google Scholar

Hu, S. et al. 全身化学療法に続いて局所領域根治的強度変調放射線療法を行うと、初期診断時に遠隔転移があった上咽頭癌患者の生存期間が延長されます。 医学。 オンコル。 32、224 (2015)。

論文 PubMed Google Scholar

Qiu、W.-Z. 他。 局所領域進行性上咽頭癌の治療における術前化学療法と強度変調放射線療法と同時化学放射線療法と補助化学療法の比較:後ろ向き対照研究。 顎。 J. Cancer 35、(2016)。

サン、X.-S. 他。 放射線療法、画像技術、化学療法の開発と上咽頭癌患者の生存との関連性: 1990 年から 2012 年までのコホート研究。 J.ラディアット。 オンコル。 バイオル。 物理学。 105、581–590 (2019)。

論文 CAS PubMed Google Scholar

Peng, G. et al. 上咽頭癌の治療における強度変調放射線療法と従来の二次元放射線療法の結果と毒性を比較する前向きランダム化研究。 ラジオザー。 オンコル。 104、286–293 (2012)。

論文 PubMed Google Scholar

ホイ、EP 他。 進行性上咽頭癌に対するネオアジュバントドセタキセルとシスプラチンの有無にかかわらず同時シスプラチン放射線療法のランダム化第II相試験。 JCO 27、242–249 (2009)。

記事 CAS Google Scholar

Du, T.、Xiao, J.、Qiu, Z. & Wu, K. 上咽頭癌の治療における強度変調放射線療法と 2D-RT の有効性: 体系的レビューとメタ分析。 PLoS ONE 14、e0219611 (2019)。

論文 CAS PubMed PubMed Central Google Scholar

リファレンスをダウンロードする

K. アルビン・ヨハソンス・シュティフテルス (2022)。 シグリッド・ジュセリウス財団。 フィンランドがん協会。 Finska Läkaresällskapet、Maritza、Reino Salonen 財団。 ヘルシンキ大学病院研究基金。 トゥルク大学病院基金。 著者らは、英語原稿の貴重な編集をしていただいた Kenneth Quek 博士に感謝します。

この作品は、Alhadi Almangush 氏と Antti A. Mäkitie 氏が共同で監修しました。

ヘルシンキ大学医学部システム腫瘍学研究プログラム(フィンランド、ヘルシンキ)

ラシード・オモボラジ・アラビ、アルハディ・アルマングシュ、アンティ・A・マキティエ

ヴァーサ大学、技術革新学部、産業デジタル化学部、ヴァーサ、フィンランド

ラシード・オモボラジ・アラビ & モハメッド・エルムスラティ

トゥルク大学生物医学病理学研究所、トゥルク、フィンランド

イルモ・レイヴォ

ヘルシンキ大学病理学教室、ヘルシンキ、フィンランド

月曜日のアルマングース

ミスラタ大学歯学部、ミスラタ、リビア

月曜日のアルマングース

ヘルシンキ大学およびヘルシンキ大学病院耳鼻咽喉科頭頸部外科、ヘルシンキ、フィンランド

アンティ・A・マキティエ

スウェーデン、ストックホルム、カロリンスカ研究所およびカロリンスカ大学病院、臨床科学、介入および技術部門、耳鼻咽喉科疾患部門

アンティ・A・マキティエ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

研究コンセプトと研究デザイン: ROA、AAM、AA データ抽出: ROA データ品質: ROA データ分析と解釈: ROA、ME、AA、AAM 原稿作成: ROA、AA、AAM 原稿レビュー: AAM、ME、MA 原稿編集: AA、AAM、イリノイ州 機関長: ME、AAM、イリノイ州 すべての著者が最終原稿の提出を承認しました。

ラシード・オモボラジ・アラビ氏への通信。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

アラビ、RO、エルムスラティ、M.、レイヴォ、I. 他。 LIME と SHAP を使用した上咽頭がん生存率における機械学習の説明可能性。 Sci Rep 13、8984 (2023)。 https://doi.org/10.1038/s41598-023-35795-0

引用をダウンロード

受信日: 2022 年 11 月 14 日

受理日: 2023 年 5 月 24 日

公開日: 2023 年 6 月 2 日

DOI: https://doi.org/10.1038/s41598-023-35795-0

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。

共有