banner

ニュース

Sep 15, 2023

グラフを使用した基底細胞癌の弱い教師付き検出と分類

Scientific Reports volume 13、記事番号: 7555 (2023) この記事を引用

328 アクセス

3 オルトメトリック

メトリクスの詳細

基底細胞癌 (BCC) の発生率が高いため、病理検査室では大きな負担となっています。 標準的な診断プロセスは時間がかかり、病理医によってばらつきが生じやすいです。 他の種類の癌のグレード分けには深層学習アプローチが適用されているにもかかわらず、全スライド画像 (WSI) 上の BCC へのビジョン トランスフォーマーの適用に関する文献は限られています。 479 個の BCC からの合計 1832 個の WSI は、トレーニングおよび検証 (369 個の BCC から 1435 個の WSI) セットとテスト (110 個の BCC からの 397 個の WSI) セットに分けられ、4 つの攻撃性サブタイプに弱いアノテーションが付けられました。 私たちは、グラフ ニューラル ネットワークとビジョン トランスフォーマーを組み合わせて、(1) 腫瘍の存在 (2 つのクラス) を検出し、(2) 腫瘍を低リスクと高リスクのサブタイプ (3 つのクラス) に分類し、(3) 4 つのサブタイプを分類しました。攻撃性のサブタイプ (5 つのクラス)。 相互検証からのモデルで構成されるアンサンブル モデルを使用すると、2 つ、3 つ、および 5 つのクラス分類でそれぞれ 93.5%、86.4%、および 72% の精度が達成されました。 これらの結果は、腫瘍検出と BCC のグレーディングの両方において高い精度を示しています。 自動 WSI 分析を使用すると、ワークフローの効率が向上する可能性があります。

基底細胞癌は、ヒトの皮膚癌の最も一般的な形態です。 この発生率は、他のすべてのがんの発生率を合わせたものと同じくらい高くなります1。 さらに、BCC 症例数は世界的に増加しています2、3、4。 転移や死亡はまれですが、BCC は局所での攻撃的かつ破壊的な増殖により重大な罹患率を引き起こす可能性があります5。

BCC は、異なる増殖パターンを持つ不均一な腫瘍のグループです。 国際的には、BCC は病理組織学的特徴に基づいて、低リスク サブタイプと高リスク サブタイプの 2 つの広いカテゴリーに分類されています6。 これらのカテゴリはさらにサブクラスに分類できます。 たとえば、スウェーデンの病理学者は、BCC を「サバツベルグ モデル」に従って分類しています。このモデルには、次の 3 つのリスク カテゴリが含まれます: (a) 「低悪性度」サブタイプ。さらに表在性 (Ib 型) と結節性 (Ia 型) に分類されます。(b) ) 「中侵襲性」 (タイプ II) には、高侵襲性の腫瘍と比較して、より明確に定義された方法でより表面的に増殖する侵襲性の低い浸潤性サブタイプが含まれます。 (c) 「高侵襲性」 (タイプ III)、攻撃性、浸潤性、およびモルフェア形のサブタイプ7。 サブタイプを正しく評価することは、関連する治療を計画するために非常に重要です。 ただし、腫瘍の等級付け 8 とサブタイプの報告には、病理医間で大きなばらつきがあります 9、10。

さらに、組織学的スライドを評価する時間のかかるプロセスとサンプル数の増加を考慮すると、診断が遅れ、コストが増加します11。 診断時間と観察者間のばらつきを軽減するために、深層学習 12 アプローチが積極的に研究されています。 深層学習により、病理学における計算による画像解析の実装が可能になり、分類精度が向上し、観察者間のばらつきが軽減される可能性があります 13,14。 興味深いことに、転移リスク、無病生存、および予後に関連する未知の形態学的特徴さえも明らかにされる可能性がある15,16。

初期の研究では、計算組織学法ではピクセル単位の注釈、つまり病理学者による WSI 上の特定の領域の輪郭を描く必要がありました 17。 ただし、ピクセル単位の注釈を使用すると時間がかかります。 さらに、そのようなアプローチは現実世界のデータに一般化されません18。 代わりに、弱教師あり学習フレームワークが WSI 分類に広く採用されています。 弱教師あり学習における一般的な手法は、マルチインスタンス学習 (MIL)19 です。 このアプローチでは、パフォーマンスを損なうことなく、WSI レベルのラベル、つまり特定の領域に関連付けられていないラベルを使用できます20。 この手法では、インスタンス (WSI のパッチ) のセットをバッグとして扱います。 陽性の場合のパッチの単なる例ではバッグ (WSI) が陽性になりますが、そうでない場合は陰性として扱われます。 MIL では、WSI を一連のパッチに分割することが要求されており、多くの場合、データのキュレーションは必要ありません18。

後の研究では、より優れた特徴ベクトルを抽出する際に、自己教師あり対比学習パラダイムがますます追加されました。 これらのパラダイムでは、事前トレーニングされた CNN モデルは、対照的な学習フレームワークを使用して、抑制された方法で調整されます21。 これらのコンポーネントを MIL アプローチに追加すると、パフォーマンスが向上することが証明されています 22,23。 ただし、MIL フレームワークは基本的にパッチが独立して同一に配布されるものと想定しており、インスタンス間の相関関係を無視しています 19、24。 相関を無視すると、分類モデルの全体的なパフォーマンスに影響します。 代わりに、グラフ ニューラル ネットワークを使用して空間相関を取得することができ、これによりモデルのパフォーマンスが向上します25、26、27。

最近、Transformers28 は、GPT-329 などの自然言語処理タスクのトークンのシーケンスにコンテキストを組み込む機能を導入することにより、AI の分野で大きな進歩を遂げました。 自然言語処理におけるトランスフォーマーの成功に触発されて、Dosovitskiy et al.30 は、画像のパッチを入力として受け取る画像分類タスクの手法である Vision Transformer (ViT) を提案しました。 これにより、パッチ (トークン) のシーケンスをキャプチャし、位置埋め込みを使用して画像 (コンテキスト) の位置を考慮することができます。 位置関係 (コンテキスト情報) を考慮すると、特に自己教師あり対比モデルから得られた特徴を使用する場合、ViT が CNN よりも優れたパフォーマンスを発揮できることがわかります。 さらに、ビジョントランスフォーマーは、多くの CNN ベースのアプローチと比較して、必要なデータと計算リソースが大幅に少なくなります 30,31。 さらに、ノイズ、ぼやけ、アーティファクト、意味の変更、および配布範囲外のサンプルに対する相対的な回復力が、パフォーマンスの向上に貢献する可能性があります32。

医療画像では、トランスフォーマーは画像の分類、セグメンテーション、検出、再構成、強調、および登録タスクに適用されています32。 具体的には、組織学的画像において、ビジョントランスフォーマーは、乳がん転移の検出や、肺がん、腎臓がん、結腸直腸がんのがんサブタイプの分類など、さまざまな組織像関連タスクに適用され成功しています33,34。 多くの医療アプリケーションにおけるビジョン トランスフォーマーの成功と、パッチ間の相関関係を捕捉するグラフ ニューラル ネットワークの機能を考慮して、グラフ ニューラル ネットワークとトランスフォーマーの組み合わせを採用して BCC を検出および分類します。

テスト セット上の 5 つのグラフ変換モデルで構成されるアンサンブルの精度は、2 クラス、3 クラス、および 5 クラスの分類タスクでそれぞれ 93.5%、86.4%、および 72.0% でした。 さらに、健康な皮膚と腫瘍の検出感度はそれぞれ 96% と 91.9% に達しました。 テスト セットに対するアンサンブル モデルのパフォーマンスを表 1 にまとめ、関連する混同行列を図 1 に示します。図 2 に、テスト セットに対する個別の相互検証モデルの平均 ROC 曲線を示します。 ヒートマップを使用して、ラベルと高度に関連する WSI の領域を視覚化しました。 図 3 は、Graph-Transformer モデルによって正しく特定された、さまざまな BCC サブタイプの腫瘍領域を示しています。

テスト セット上の 3 つの異なる分類タスク (T) のアンサンブル モデルの混同行列。 (a) 2 つのクラス分類 (T1、腫瘍または腫瘍なし)、(b) 3 つのクラス分類 (T2、腫瘍なし、および 2 つのグレードの腫瘍)、(c) 5 つのクラス分類 (T3、腫瘍なし、および 4 つのグレードの腫瘍)。

さまざまな分類タスク (T) のテスト セットに基づく 5 分割相互検証モデルの平均 ROC 曲線。 (a) 2 クラス分類 (T1)、(b) 3 クラス分類 (T2)、(c) 5 クラス分類 (T3)。

クラス活性化マップ (行 2 と 3) および対応する H&E 画像 (行 1 と 4) の視覚化。 クラス活性化マップは、腫瘍の領域が強調された二項分類タスク (腫瘍なし、腫瘍) 用に構築されています。 4 つの BCC グレードすべての代表例を示します: (a) 表面的な低侵襲性、(b) 結節性の低侵襲性、(c) 中程度の侵襲性、(d) 高度な侵襲性。 行 3 と行 4 は、黒いボックスでマークされた領域からの拡大画像を表します。 モデルを実行した後、組織に焦点を当てるためにスライドがトリミングされています。

この論文では、BCC による抽出の WSI の検出と分類にグラフ トランスフォーマーを使用しました。 開発された深層学習手法は、腫瘍の検出と分類の両方において高い精度を示しました。 自動画像分析を使用すると、ワークフローの効率が向上する可能性があります。 腫瘍検出の感度が高いことを考慮すると、このモデルは病理学者が腫瘍を含むスライドを特定し、スライド上の腫瘍領域を示すのに役立ち、日常診療における診断プロセスに必要な時間を短縮できる可能性があります。 高精度の自動腫瘍グレーディングを使用すると、時間をさらに節約でき、病理医間および病理医内のばらつきを低減できる可能性があります。

私たちの研究は、深層学習アプローチを使用して WSI に BCC の 2 および 4 グレーディングを適用した最初の研究の 1 つです。 私たちの方法では、2、3 (2 グレード)、および 5 クラス (4 グレード) の分類で、それぞれ 0.964 ~ 0.965、0.932 ~ 0.975、0.843 ~ 0.976 という高い AUC 値に達しました。 以前、Campanella et al.18 は、広範囲の腫瘍性および非腫瘍性皮膚病変を含む 9,962 枚のスライドを含む合計 44,732 枚の WSI からなるかなり大規模なデータセットを使用し、そのうち 1,659 枚が BCC でした。 彼らは腫瘍検出において高い精度を達成し、最大 75% のスライドを病理学者の作業負荷から安全に取り除くことができることを示唆しました。 興味深いことに、Gao et al.35 は、WSI とスマートフォンで撮影した BCC の顕微鏡画像を比較し、両方のアプローチで高い感度と特異性を備えた腫瘍検出を行いました。 ただし、これらの研究では腫瘍の等級付けは適用されませんでした。 私たちの知る限り、BCC のグレーディングに関するオープンソースのデータセットはありません。 このため、この作業の結果をベースラインと比較することが困難になります。 私たちの研究の利点の 1 つは、データがオープン データ セットとして利用可能であり、これによりこの分野の進歩が可能になることです。

BCC 検出に関する別の研究では、AI の注意パターンが病理学者の注意パターンと比較され、ニューラル ネットワークが意思決定において結合組織を統合してより大きな組織領域に注意を分散させることが観察されました 36。 私たちの研究では、ラベルがスライド レベルで割り当てられた弱い教師あり学習を使用しました。 このアプローチでは、ピクセルごとに注釈が付けられた小さな領域に焦点を当てるのではなく、アルゴリズムに腫瘍間質を含むより大きな領域を自由に評価できるようになります。 さらに、スライド単位の注釈は、ピクセル単位の注釈よりも大幅に時間がかかりません。

私たちの研究の限界は、データセットのサイズがある程度制限されていることです。 クラスの数が増えると、パフォーマンスが大幅に低下します。 これは、トレーニング セット内のクラスごとの WSI の数が減少したことに起因する可能性があります。 たとえば、モデルが 5 クラス分類タスクで BCC サブタイプ Ia とサブタイプ Ib を区別することはより困難でしたが、3 クラス分類タスクで低攻撃性クラスと高攻撃性クラスを区別することは比較的容易でした (図 2)。データが増えると、パフォーマンスが向上する可能性が高くなります。

この研究では体系的な観察者間変動分析は行われませんでしたが、4 つの異なるグレード (5 クラス分類) へのデータセットの注釈付けに関与した 2 人の病理学者は、WSI の 6.7% で異なっていました。 これらの WSI の注釈は、3 番目の上級病理学者との合意に基づいて修正されましたが、実際の状況ではこれは当てはまりません。 この研究で提案されているようなツールを使用すると、病理医間のばらつきが軽減される可能性があります。 このテーマについてはさらなる研究が行われることが保証されています。

私たちの研究の限界は、さまざまなタスクにおけるデータセットの不均衡です。 腫瘍ごとに複数枚(1 ~ 18 枚のスライド)を含めました。 各スライドは個別に分類されました。 各腫瘍グループにできるだけ多くの WSI を含めることを目指しましたが、グループ間には差異がありました。 より進行性の腫瘍はより大きく、したがってより多くのスライドがあった。 また、同じ腫瘍内にいくつかの BCC サブタイプが存在するという事実も、各グループの WSI の数に影響を与えました。 同じ腫瘍からのいくつかのスライドを含めたので、すべてのスライドに腫瘍が表示されたわけではありません。 したがって、表 2 に示すように、合計 744 枚のスライドが健康な皮膚を表しています。これにより、特にタスク 2 と 3 でデータセットの不均衡が生じ、最大のグループは健康な皮膚でした。 さらに、少数の BCC 症例では腫瘍スライドが見られなかったという事実は、スキャンの品質が低いために一部のスライドを除去する必要があったためである可能性があります。

さらに、WSI の多くには複合サブタイプがあり、これらが同じスライド上に存在する場合もありました。 このような症例は、BCC では複数のタイプが混在する、つまり 2 つ以上の病理学的パターンを持つ症例が典型的です 37。 混合組織型症例の割合は、全症例の最大 43% に達する可能性があります 38。 混合 BCC ケースの最大 70% には、1 つ以上の攻撃的なサブタイプが含まれる可能性があります39。 WSI ごとの混合パターンのこのような特性にもかかわらず、表 1 に示すように、私たちのモデルは、3 クラス分類タスクでは 86.4%、5 クラス分類タスクでは 72.0% の精度でスライドごとに最悪の BCC サブタイプを検出できました。 。

さらに、各スライドには、抽出インデックス (抽出 ID に対応) を示すペンのマークが付いていました。このインデックスは、場合によっては WSI 上の組織と同じくらい大きくなる可能性があります。 データセットは患者指数に基づいて分割されているため、トレーニング セットのペン跡はテスト セットのペン跡とは異なり、モデルは手書き文字の類似性の影響を受けません。 ペンの跡はタイラーによって組織として識別されなかったため、トレーニング パッチには含まれませんでした。 さらに、WSI には、さまざまな色やアーチファクト、スライスのエッジ、不一致、散在する小さな組織、斑点、および穴がありました。 WSI 間のこうしたばらつきにもかかわらず、モデルは手書き文字を背景として扱い、その他のばらつきをノイズとして扱いました。

私たちの知る限り、この研究は、WSI での BCC のグレーディングに変圧器を使用する最初のアプローチです。 結果は、腫瘍の検出と BCC のグレーディングの両方において高い精度を示しています。 このようなアプローチの展開が成功すれば、組織学的診断プロセスの効率と堅牢性が向上する可能性があります。

このデータセットは、2019 年から 2020 年の期間にスウェーデンのヨーテボリにあるサールグレンスカ大学病院で遡及的に収集されました。 完全なデータセットには、479 個の BCC 切除からの 1,831 個の標識 WSI が含まれています (腫瘍あたり 1 ~ 18 枚のスライドガラス) (表 2)。スライドはスキャナ NanoZoomer S360 浜松ホトニクスを使用して 40 倍の倍率でスキャンされました。 次に、anonymize-slide40 と呼ばれるオープンソース パッケージを使用して、スライドのラベルが削除されました。

WSI のサイズは 71,424 ~ 207,360 ピクセルの範囲で、サイズは 1.1 GB ~ 5.3 GB (合計 5.6 TB) の範囲でした。 さらに、ほぼすべてのサンプルには、ガラス スライドごとに複数の切片レベルがありました。 スキャンする前に、ガラス スライドに文字「B」と、どのスライドが同じ腫瘍を表すかを示す最大 3 桁のマークが付けられました。

スキャンされたスライドは、スウェーデンの分類システムに従って、WSI レベルで 5 つのクラス (腫瘍なしおよび 4 段階の BCC 腫瘍) に注釈が付けられました。 腫瘍のいくつかの増殖パターンが検出された場合、WSI は考えられる最悪のサブタイプに従って分類されました。 注釈は 2 人の病理学者によって別々に実行されました。 2 人の主要なアノテーターの意見が異なる場合 (WSI の 6.7%)、3 人目の上級病理学者が招かれ、3 人の病理学者の合意として最終的なアノテーションの決定が行われました。

このデータセットは、3 つの分類タスクに使用するために設定されました。 最初のタスク (T1) は、二項分類 (腫瘍または腫瘍なし) によって腫瘍の存在を検出することでした。 2 番目のタスク (T2) は 3 つのクラス (WHO の等級付けシステムに従って、腫瘍なし、低リスク、および高リスク腫瘍) に分類されました。 3 番目のタスク (T3) は、データセットを 5 つのクラス (腫瘍なし、BCC の 4 つのグレード、低悪性度の表在性、低悪性度の結節性、中程度の悪性度、および高悪性度、スウェーデンの分類システムに準拠) に分類することでした。 2 段階の分類タスクでは、ラベルは低攻撃性 (Ia および Ib) および高攻撃性 (II および III) のケースに変換されました。 図 4 は、3 つの分類タスク (T1、T2、および T3 として示される) における BCC のパッチとそれに対応するクラスを示しています。

3 つの分類タスク (T) で使用される BCC サブタイプのサンプル: T1 (腫瘍または腫瘍なし)、T2 (腫瘍なしおよび 2 つのグレードの腫瘍)、および T3 (腫瘍なしおよび 4 つのグレードの腫瘍)。 「サバツベルグモデル」に準拠 7. 現在の分類タスクに応じて、各行のサンプルに異なるグレードの腫瘍が割り当てられます。

この手法の概要を図 5 に示します。WSI が大きいため、従来の機械学習モデルは WSI を直接取り込むことができませんでした。 したがって、WSI は最初にパッチにタイル化されました。 OpenSlide41 を使用して、WSI を 10 倍の倍率で重複なく 224 x 224 のパッチにタイル化しました。 組織面積が少なくとも 15% のパッチは保存され、その他のパッチは廃棄されました。 パッチの数は、WSI あたり 22 ~ 14,710 パッチの範囲でした。 トレーニング セット用に合計 520 万個のパッチが生成されました。 上で述べたように、色の違い、アーティファクトなどを含む WSI 間にばらつきがありました。パッチ間の違いにもかかわらず、タイリングの前後に画像処理は行われませんでした。

方法の概要 (Zheng et al.27 から改変)。 WSI はまずパッチにタイル化され、自己教師あり学習によって特徴が抽出されます。 抽出された特徴はグラフ ネットワークのノードになり、グラフ変換分類器への入力になります。

パッチがタイル化されると、自己教師あり学習フレームワークである SimCLR21 を使用して特徴が抽出されました。 対照的な学習アプローチを使用してデータが拡張され、サブ画像を使用してデータセットの一般的な表現が生成されました。 次に、アルゴリズムは同じ画像間の距離を減らし、異なる画像 (ネガティブ ペア) 間の距離を増やしました 21。 このステップでは、Resnet18 をバックボーンとして使用し、ホールドアウト テスト セットからのパッチを除くすべてのパッチをトレーニング セットとして使用して、各パッチの特徴ベクトルが抽出されました。 SimCLR のトレーニングには、重み減衰 10 ~ 6、バッチ サイズ 512 および 32 エポックの Adam オプティマイザーが使用されました。 初期学習率 10–4 は、コサイン アニーリングを使用してスケジュールされました。

自己教師あり対比学習から生成された特徴は、グラフ ニューラル ネットワークの構築に使用されました。 対照学習を用いて各パッチの特徴ベクトルを抽出した。 各パッチはエッジとコーナーによって最も近いパッチに接続されているため、タイリングによってパッチ間の相関関係が崩れます。 パッチ間の相関関係は通常、位置埋め込みを介して取得されます30。 組織学的パッチは 2D 空間で空間的に相関しているため、位置的な埋め込みはグラフ ネットワークを介してより適切にキャプチャできる可能性があります 27。

パッチは 4 つの辺と 4 つの角によって隣接するパッチに接続されているため、合計 8 つのエッジになります。 8 ノードの隣接行列のセットを使用して、WSI のグラフ表現が作成されました。 次に、隣接行列を介して取得された位置埋め込みを使用して、グラフ畳み込みネットワークが構築されます。 パッチの特徴ベクトルがグラフのノードになります。

Zheng et al.27 は、完全に接続されたグラフ、つまりスライドごとに単一の組織を使用した結果を示しました。 この研究では、WSI ごとに複数の組織を表す非接続グラフでも同じアプローチが機能することを示します。 データセット内のほぼすべての WSI にはスライドごとに複数の組織が含まれていたこと、つまり、非組織領域による個別の組織間に相関関係がなかったことは注目に値します。 これにより、図 6 に示すように、切り離されたグラフが生成されます。切り離されたグラフのコンポーネント間の距離および空間内での位置は、モデルのパフォーマンスに影響を与えないことに注意してください。

WSI とそのグラフ ネットワークの例。 (a) 6 つの組織切片を含む WSI、(b) グラフ ネットワークの 6 つの切断されたコンポーネント。 切断されたコンポーネントが空間にランダムに配置されます。 各ノードはパッチを表します (わかりやすくするためにパッチは図には示されていません)。

グラフ畳み込みネットワークが構築されると、そのネットワークは ViT に供給されます。 一般に、トランスフォーマーは、人間が画像やテキストの周囲の情報を無視して、特定の画像やテキストから重要な情報を抽出する方法を模倣する注意メカニズムを適用します42。 Self-attention28 では、入力特徴からマッピングされたクエリ、キー、および値のベクトルを使用する関数が導入されました。 これらのベクトルを使用して、多頭自己注意を適用して洗練された特徴を抽出し、個々の部分だけに焦点を当てるのではなく、画像全体を理解できるようにします。 さらに、セルフアテンション機能には、クラスの決定に使用される多層パーセプトロン (MLP) ブロックが付属しています。 この作業では、BCC サブタイプの分類に標準 ViT エンコーダー アーキテクチャとグラフ畳み込みネットワークを使用しました。

さらに、入力サイズによっては、ViT のトレーニングの計算コストが高くなる可能性があります。 パッチの数は、画像のサイズと WSI に対する組織のサイズに応じて大きくなる可能性があります。 その結果、多数のノードが発生し、トランスフォーマーへの入力として直接適用することが計算上困難になりました。 ViT が入力を消化できる範囲までノードの数を減らすために、プーリング層が追加されました。

トレーニングと検証を組み合わせたセットには 369 の抽出 (1435 WSI) がありました。 110 抽出 (397 WSI) の追加データセットを個別にスキャンして、ホールドアウト テスト セットを構成しました。 テスト セットは個別に処理され、SimCLR モデルとグラフ変換モデルの両方から保持されました。

トレーニングと検証では、類似したスライドからのデータ漏洩を避けるために、特定の抽出に関連するすべてのスライドが常に同じセットに配置されました。 そのため、抽出レベルでデータセットを分割する必要があり、その結果、相互検証の分割が不均一になってしまいました。 したがって、トレーニングには 5 重交差検証が使用されました。 相互検証フォールドからの 5 つのモデルの出力は、多数決によって 1 つのアンサンブル モデルに結合され、テスト セットに対する最終予測が提供されます。 このステップは、2 クラス、3 クラス、および 5 クラスの分類タスクに対して個別に実行されました (補足表 S1)。

モデルのトレーニングでは、すべてのタスクに同じハイパーパラメーターが使用されました。 モデルは、MLP サイズ 128、セルフ アテンション ブロック 3 で構成され、バッチ サイズ 4、100 エポック、Adam オプティマイザーの重み減衰 10–5、ステップ 40 および 80 で 10–1 ずつ減衰する学習率 10–3 でトレーニングされました。 。 トレーニングは DGX A100 上の 2 つの GPU で実行されました。 SimCLR モデルのトレーニングには約 3 日かかりました。 グラフ トランスフォーマーのトレーニングは、収束するまでに平均約 25 分かかりました。 テスト セット内の特定の WSI では、タイリングから推論までに約 30 秒かかりました。

予測結果を視覚化して解釈するために、グラフベースのクラス アクティベーション マッピング 27 が使用されました。 このメソッドは、事前に計算されたトランスフォーマーとグラフ関連マップを利用して、クラス ラベルから WSI のグラフ表現へのクラス アクティベーション マップを計算しました。 この方法を使用して、ヒートマップは、WSI ラベルに関連付けられた WSI の領域にオーバーレイされました。

現在の研究中に生成および/または分析されたデータセットは、https://doi.org/10.23698/aida/bccc で入手できます。

ニュージャージー州レベルル、イガリ・L.、KA・ライト、DC グリーンバーグ 英国における基底細胞癌の疫学: 部屋の中の象。 クリン。 経験値ダーマトール。 38、367–369 (2013)。

論文 CAS PubMed Google Scholar

ディカ、Eら。 基底細胞癌:包括的なレビュー。 内部。 J.Mol. 科学。 21、5572 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

キャメロン、MC 他基底細胞癌。 混雑する。 アカド。 ダーマトール。 80、321–339 (2019)。

論文 PubMed Google Scholar

ウォン、CSM 基底細胞癌。 BMJ 327、794–798 (2003)。

論文 CAS PubMed PubMed Central Google Scholar

ロー、JSら。 転移性基底細胞癌: 文献レビューを含む 12 例の報告。 混雑する。 アカド。 ダーマトール。 24、715–719 (1991)。

論文 CAS PubMed Google Scholar

エルダー DE、マッシ D.、スコリヤー、RA、ウィレムゼ、R. WHO 皮膚腫瘍分類第 4 版 (WHO、ベルリン、2018)。

Google スカラー

Jernbeck, J.、Glaumann, B.、および Glas, JE 基底細胞癌。 悪性度の高い種類の癌の組織学的等級付けの臨床評価]。 Lakartidningen 85、3467–70 (1988)。

CAS PubMed Google Scholar

Jagdeo, J.、Weinstock, MA、Piepkorn, M. & Bingham, SF ケラチノサイト癌の組織病理学的診断の信頼性。 混雑する。 アカド。 ダーマトール。 57、279–284 (2007)。

論文 PubMed Google Scholar

ムーン、DJ 他診療設定ごとの基底細胞癌サブタイプ報告の差異。 JAMAダーマトール。 155、854(2019)。

記事 PubMed PubMed Central Google Scholar

Al-Qarqaz、F. et al. 基底細胞癌の病理学に関するリクエストとレポートには重要な情報が不足しています。 J. 皮膚がん 2019、1–5 (2019)。

Google スカラー

ミグデン、M.ら。 2010 年から 2014 年までの米国のデータベースにある商業保険患者の進行性基底細胞癌の負担と治療パターン。J. Am. アカド。 ダーマトール。 77、55-62.e3 (2017)。

論文 PubMed Google Scholar

LeCun, Y.、Bengio, Y.、ヒントン, G. 深層学習。 ネイチャー 521、436–444 (2015)。

論文 ADS CAS PubMed Google Scholar

Niazi、MKK、Parwani、AV & Gurcan、MN デジタル病理学と人工知能。 ランセット・オンコル。 20、e253–e261 (2019)。

記事 PubMed PubMed Central Google Scholar

小村 D. & 石川 S. 病理学的診断のための機械学習アプローチ。 ヴィルヒョウのアーチ。 475、131–138 (2019)。

論文 CAS PubMed Google Scholar

Knuutila、JS et al. スライド画像全体の人工知能分析を利用した転移性原発性皮膚扁平上皮癌の同定。 科学。 議員第 12 号、1–14 (2022)。

記事 ADS Google Scholar

さあ、MCら。 皮膚黒色腫患者の無病生存率を予測するための、スライド全体の画像に基づく深層学習モデル。 科学。 議員 12、20366 (2022)。

論文 ADS CAS PubMed PubMed Central Google Scholar

オルセン、TGら。 皮膚病理学における 3 つの一般的な診断に適用された深層学習アルゴリズムの診断パフォーマンス。 J.パソール。 知らせる。 9、32 (2018)。

記事 PubMed PubMed Central Google Scholar

カンパネルラ、G. et al. スライド画像全体に対して弱教師あり深層学習を使用した、臨床グレードの計算病理学。 ナット。 医学。 25、1301–1309 (2019)。

論文 CAS PubMed PubMed Central Google Scholar

Carbonneau, M.-A.、Cheplygina, V.、Granger, E. & Gagnon, G. 複数インスタンス学習: 問題の特性とアプリケーションの調査。 パターン認識。 77、329–353 (2018)。

記事 ADS Google Scholar

Ilse, M.、Tomczak, J.、Welling, M. アテンションベースの深層複数インスタンス学習。 機械学習に関する国際会議 2127 ~ 2136 (2018 年)。

Chen, T.、Kornblith, S.、Norouzi, M. & Hinton, G. 視覚表現の対比学習のためのシンプルなフレームワーク。 機械学習に関する国際会議 1597 ~ 1607 年 (PMLR、2020)。

リー、J.ら。 複数のインスタンス学習を使用した病理組織画像の分類と位置特定のための多重解像度モデル。 計算します。 バイオル。 医学。 131、104253 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Li, B.、Li, Y.、Eliceiri、KW 自己教師あり対比学習によるスライド画像全体の分類のためのデュアルストリーム複数インスタンス学習ネットワーク。 コンピューター ビジョンとパターン認識に関する IEEE/CVF 会議議事録 (CVPR) 14318–14328 (2021)。

Zhou, ZH & Xu, JM マルチインスタンス学習と半教師あり学習の関係について。 ACM国際会議手順サー。 227、1167–1174 (2007)。

Google スカラー

Tu、M.、Huang、J.、He、X.、Zhou、B. グラフ ニューラル ネットワークによる複数インスタンス学習。 arXiv プレプリント arXiv:1906.04881 (2019)。

Adnan, M.、Kalra, S.、Tizhoosh, HR グラフ ニューラル ネットワークを使用した組織病理画像の表現学習。 コンピューター ビジョンとパターン認識 (CVPR) ワークショップに関する IEEE/CVF 会議議事録 988 ~ 989 (2020)。

Zheng、Y.ら。 スライド画像全体を分類するためのグラフ変換器。 arxiv.org (2022)。

Vaswani、A. et al. 必要なのは注意力だけです。 神経情報処理システムの進歩 30 (NIPS) (2017)。

ブラウン、TB et al. 言語モデルは少数回の学習です。 神経情報処理システムの進歩 33 (NeurIPS) (2020)。

Dosovitskiy、A. et al. 画像は 16x16 ワードの価値があります: 大規模な画像認識のためのトランスフォーマー。 arxiv.org (2020)。

Deininger、L. et al. デジタルパソロジーにおけるビジョントランスフォーマーとCNNの比較研究。 arxiv.org (2022)。

リー、J.ら。 Transformers で医療画像を変革しますか? 主要な特性、現在の進捗状況、将来の展望を比較レビューします。 arxiv.org (2022)。

Shao、Z.ら。 Transmil: スライド画像全体を分類するための、Transformer ベースの相関複数インスタンス学習。 議事録.neurips.cc (2021) にて。

Zeid, MA-E.、El-Bahnasy, K. & Abo-Youssef, SE ビジョントランスフォーマーを使用したマルチクラス結腸直腸癌組織画像分類。 2021 年の第 10 回インテリジェント コンピューティングおよび情報システムに関する国際会議 (ICICIS) 224–230 (IEEE、2021)。 https://doi.org/10.1109/ICICIS52592.2021.9694125。

ジャン、YQら。 スマートフォンで撮影したデジタル病理組織画像上で、ディープ ニューラル ネットワークを使用して基底細胞癌を認識します。 Br. J.Dermatol. 182、754–762 (2020)。

論文 CAS PubMed Google Scholar

Kimeswenger, S. et al. 人工ニューラル ネットワークと病理学者は、さまざまな組織学的パターンに基づいて基底細胞癌を認識します。 モッド。 パソル。 34、895–903 (2021)。

論文 PubMed Google Scholar

Crowson, AN 基底細胞癌:生物学、形態学、および臨床的意義。 モッド。 パソル。 19、S127–S147 (2006)。

論文 PubMed Google Scholar

Cohen, PR、Schulze, KE & Nelson, BR 混合組織型の基底細胞癌: 再発性皮膚癌の考えられる病因。 ダーマトール。 外科。 32、542–551 (2006)。

CAS PubMed Google Scholar

Kamyab-Hesari, K. et al. サブタイプ基底細胞癌におけるパンチ生検の診断精度。 Wiley オンライン ライブラリ 28、250–253 (2014)。

CAS Google スカラー

ギルバート、B. スライドを匿名化します。 https://github.com/bgilbert/anonymize-slide。

Goode, A.、Gilbert, B.、Harkes, J.、Jukic, D. & Satyanarayanan, M. OpenSlide: デジタル パソロジーのためのベンダー中立のソフトウェア基盤。 J.パソール。 知らせる。 4、27 (2013)。

記事 PubMed PubMed Central Google Scholar

Bahdanau, D.、Cho, KH、Bengio, Y. 整列と翻訳を共同で学習することによるニューラル機械翻訳。 第 3 回学習表現に関する国際会議、ICLR 2015: Conference Track Proceedings (2015)。

リファレンスをダウンロードする

この研究は、スウェーデン政府と郡議会との間の協定である ALF 協定 (Grant ALFGBG-973455) に基づくスウェーデン国家からの補助金によって資金提供されました。

ヨーテボリ大学が提供するオープンアクセス資金。

AI スウェーデン、ヨーテボリ、スウェーデン

映画ヤコブ

AI コンピテンス センター、サールグレンスカ大学病院、ヨーテボリ、スウェーデン

フィルモン・ヤコブ、ジュリア・T・スヴィレート、リサ・ショーブロム、マグナス・ケルベルグ

ヨーテボリ大学、サールグレンスカアカデミー生物医学研究所、臨床検査医学部門、ヨーテボリ、スウェーデン

ヤン・シアロフ、カイサ・ヴィリアムソン、ヌーラ・ネイタンマキ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

構想と設計:FY、JS、KV、JTS、NN 方法論の開発:FY、JTS データの取得:JS、KV、NN データセットへのアノテーション付け:JS、KV、NN、データの分析と解釈:FY、JTS、JS 、KV、NN 原稿執筆・査読・修正:FY、JS、KV、JTS、NN、LS、研究監修:NN、JTS、MK 資金獲得:NN、MK

Noora Neittaanmäki への連絡。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

ヤコブ、F.、シアロフ、J.、ヴィリアムソン、K. 他。 スライド全体の画像上でグラフトランスフォーマーを使用した、基底細胞癌の弱く監視された検出と分類。 Sci Rep 13、7555 (2023)。 https://doi.org/10.1038/s41598-023-33863-z

引用をダウンロード

受信日: 2023 年 1 月 20 日

受理日: 2023 年 4 月 20 日

公開日: 2023 年 5 月 9 日

DOI: https://doi.org/10.1038/s41598-023-33863-z

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。

共有