banner

ニュース

Sep 28, 2023

AIと非AIの比較検証

Scientific Reports volume 13、記事番号: 3439 (2023) この記事を引用

1082 アクセス

12 オルトメトリック

メトリクスの詳細

この記事に対する出版社の訂正は 2023 年 5 月 3 日に公開されました。

この記事は更新されました

脳磁気共鳴画像法 (MRI) スキャンの自動セグメンテーションとボリューム測定は、パーキンソン病 (PD) およびパーキンソンプラス症候群 (P-プラス) の診断に不可欠です。 診断パフォーマンスを向上させるために、脳 MRI セグメンテーションにディープラーニング (DL) モデルを採用し、そのパフォーマンスをゴールドスタンダードの非 DL 手法と比較しました。 私たちは、健康な対照 (\(n=105\)) と PD (\(n=105\))、多発性全身性萎縮症 (\(n=132\))、および進行性核上性麻痺 (\) の患者の脳 MRI スキャンを収集しました。 (n=69\)) は、2017 年 1 月から 2020 年 12 月までサムスン医療センターで行われました。ゴールドスタンダードの非 DL モデルである FreeSurfer (FS) を使用して、中脳、橋、尾状核、被殻、淡蒼球、およびそれらを、代表的な畳み込みニューラル ネットワーク (CNN) およびビジョン トランスフォーマー (ViT) ベースのモデルである DL モデルの注釈付きデータとみなしました。 DL アプローチによって速度を向上させながら、FS パフォーマンスをそのまま再現できる基準を決定するために、正常、PD、および P プラスのケースを区別するためのダイス スコアと曲線下面積 (AUC) が計算されました。 患者あたり 6 つの脳構造に対する CNN と ViT のセグメンテーション時間は、それぞれ 51.26 ± 2.50 秒と 1101.82 ± 22.31 秒で、FS (15,735 ± 1.07 秒) より 14 ~ 300 倍高速でした。 両方の DL モデルのダイス スコアは十分に高かったため (> 0.85)、疾患分類の AUC は FS の AUC に劣りませんでした。 すべての脳部位に基づく正常対 P プラスおよび PD 対 P プラス (多発性全身性萎縮症 - パーキンソン病型を除く) の分類では、DL モデルと FS は 0.8 を超える AUC を示し、DL モデルの臨床的価値がさらに実証されました。 FSへ。 DL は、脳のセグメンテーションと鑑別診断のパフォーマンスを損なうことなく、分析時間を大幅に短縮します。 私たちの発見は、臨床現場での DL 脳 MRI セグメンテーションの採用と脳研究の進歩に貢献する可能性があります。

パーキンソン病 (PD) の診断は主に臨床症状に基づいて行われます。 ただし、赤旗1と呼ばれる非定型症状の場合、多系統萎縮症(MSA)や進行性核上性麻痺(PSP)などのパーキンソンプラス症候群(Pプラス)の診断には脳磁気共鳴画像法(MRI)が不可欠です。 MRI は診断の精度を向上させ、病気の進行のモニタリングに使用できます2。 脳 MRI では、P-plus には現れるが PD2、3、4 には現れないさまざまな特徴が明らかになります。 たとえば、PSP 患者には、ハチドリ徴候として知られる顕著な中脳萎縮が見られます 5。 MSA パーキンソン病型 (MSA-P) では、被殻は萎縮しており、側縁が平坦で、T1 強調勾配エコー画像で低強度信号を示します。 MSA-小脳型(MSA-C)の患者は、橋および中小脳脚の主な萎縮を示し、その結果、中脳対橋の比率が増加し6、磁気共鳴パーキンソニズム指数が低下します7。 したがって、これらの脳構造の体積の定量的測定も評価されており、PDとP-plus8を区別する際の高い感度と特異性が示されています。

中脳領域の評価によって得られる診断感度と特異度は、PSP、MSA、PD9 の鑑別に一般に高いものの、この領域の視覚的評価は定量的ではなく、客観性に欠け、医師のスキルや画像取得に大きく依存します。 その結果、視覚的評価に基づく診断は、80% を下回る場合さえも、広範囲にわたる精度を示しています10、11、12。 脳 MRI の一貫した定量的分析を開発するために、中脳領域の容積測定が、正確な診断のための最適な予測因子として使用されてきました6、8、13、14。 したがって、脳画像のセグメンテーションは、ボリューム測定と診断のための予測モデルまたは自動機械学習 (ML) 手法に基づくほとんどの下流分析において重要な段階となっています。

訓練を受けた医師による脳 MRI スキャンの手動分割は骨の折れる作業であり、時間がかかり、脳の構造を正確に特定するには高度なスキルを備えた専門家が必要です。 これらの問題を克服するために、アトラスベースまたはディープラーニング (DL) 技術を使用したさまざまな自動化技術が開発されてきました。 脳の自動画像セグメンテーション モデルには限界がありますが 15、16、FreeSurfer (FS) 17 は比較的高い精度で脳構造を抽出できます。 したがって、FS は非 DL 自動セグメンテーション方法として広く採用されています 17、18、19、20、21。

脳構造のさまざまな自動セグメンテーション方法が開発されていますが、臨床現場での使用は限られており、通常は 1 回限りの研究で使用されます。 これは、医師による脳 MRI スキャンの単純な視覚的評価と比較して、自動セグメンテーション モデルのプロセスが時間がかかり複雑であることが原因です。 たとえば、セグメンテーションのための自動 FS では、MRI スキャンでキャプチャされた脳をセグメント化するのに患者 1 人あたり 4.5 時間以上かかります。 この複雑さの問題は、既存の自動セグメンテーション手法がアトラスベースの登録を使用するために発生します22、23、24、25。 実際、セグメンテーションをアトラスベースの位置合わせ問題として表現するにはかなりの時間がかかり、各テストサンプルの内部アトラスモデルに適した座標変換関数を得るために FS を最適化する必要があります。

複雑な方法を必要とせずに迅速なセグメンテーションと診断を行うための自動モデルは、臨床使用のために開発される必要があります。 DL セグメンテーションは、脳セグメンテーション 26、27、28 を含むさまざまな分野で開発され、使用されていますが、特定の神経変性疾患の脳 MRI の特定部分のセグメンテーション(例、脳幹下部構造パイプラインの中脳と橋の分離)の効率と精度に関する研究が行われています。まだ進歩しています。 既存の非 DL 手法とは異なり、DL は登録などの最適化プロセスを必要とせず、学習したパラメータに基づく順方向計算のみを使用してセグメンテーションを完了することで、分析速度を向上させることができます。 ただし、特に神経変性疾患のセグメント化脳 MRI において、DL が非 DL 法と比較してパフォーマンスの低下を示すかどうかを予測することは困難です。 私たちの研究は、脳MRIのセグメント化におけるDL法と非DL法の両方のパフォーマンスの比較を実証し、それらをパーキンソン病の診断に適用するため、重要です。 言い換えれば、この研究は、従来の研究のように AI と非 AI モデル間のセグメンテーションのパフォーマンスを単に比較するだけでなく、AI と非 AI モデルによる脳セグメンテーションを使用したパーキンソン病の鑑別診断を示すことで、さらに一歩進んだ26。

最近の DL セグメンテーション モデルは、畳み込みニューラル ネットワーク (CNN) アーキテクチャとビジョン トランスフォーマー (ViT) アーキテクチャに分類されます。 したがって、この研究では、各フレームワークの代表モデルである V-Net29 と UNet トランスフォーマー (UNETR)30 をそれぞれ採用して、ボリューム 3D 画像セグメンテーションを実行しました。 DL モデルは、神経変性疾患の診断のために MRI スキャンで脳構造をセグメント化するようにトレーニングされ、そのパフォーマンスが分析され、既存の非 DL モデル FS と比較されました。 正常、PD、および P-plus の症例を分類する際に重要な 6 つの脳構造 (被殻、淡蒼球、中脳、橋、尾状核、および第三脳室) がセグメント化されました。 その後、セグメント化された領域の体積を使用して、正常、PD、および P-plus のケースを区別しました。 図1に示すように、DLモデルの疾患鑑別精度とセグメンテーション時間を、DLセグメンテーションモデルをトレーニングするための基準(つまりグラウンドトゥルース)とみなされるFSのそれらと比較しました。 したがって、この比較分析による私たちの研究の主な貢献は次のとおりです。 (1) ゴールドスタンダード DL モデルが診断性能を損なうことなく FS 推論時間を大幅に短縮できることを実証し (表 1)、脳部位のセグメンテーション結果を首尾よく再現できます。神経変性疾患における FS (図 2)、(2) その結果、DL は現在の非 DL アプローチ (表 2 および 3) と比べてはるかに複雑ではないセグメンテーションと同等の神経変性疾患の自動診断を可能にすることを示し、実用化が約束されています。神経変性疾患の診断または研究における DL ベースの脳 MRI セグメンテーション(例:PD、P-plus、正常症例間の鑑別診断)。

研究の概要。 脳構造の抽出とセグメント化の解析時間と精度に関するパーキンソン症候群の診断性能を、DL モデルと FS で比較しました。 抽出された構造を個別または総合的に用いて疾患の診断を行った。

表 1 は、患者ごとに 6 つの脳構造をセグメント化するのに必要な時間を示しています。 セクション「脳構造のセグメンテーション: FS によるベースライン」で述べたように、FS は偵察パイプラインの残りの部分と完全な脳幹サブ構造パイプラインを順次処理します。 FS セグメンテーション時間では、セクション「脳構造セグメンテーション: FS によるベースライン」で説明した前処理 (つまり、元の MRI から頭蓋骨を除去した画像の抽出) に費やされた時間を削除しました。 表 1 の太字の値で示されているように、FS モデルと DL モデルは最終的なセグメンテーション結果を導き出すための入力として頭蓋骨ストライプ MRI スキャンを使用するため、結果として得られる時間は合計時間を公平に比較​​できます。前処理時間を含めると、CNNベースの V-Net と ViT ベースの UNETR は、FreeSurfer よりそれぞれ 14 倍と 7 倍高速でした。

(a) CNN ベースの V-Net (左の 3D 画像の 1 列目と 2 列目の赤で強調表示された領域) および FS (右の 3D 画像の 1 列目と 2 列目の青で強調表示された領域) の脳構造ごとのセグメンテーション結果。 (b) ViT ベースの UNETR (最初の列の左 3D 画像と 2 番目の列の赤で強調表示された領域) および FS (最初の列の右 3D 画像と 2 番目の列の青で強調表示された領域) の各脳構造のセグメンテーション結果。

FS の処理時間と比較するために、DL モデルの CPU 使用時間を追加しました。 CNN ベースの V-Net および ViT ベースの UNETR は、FS よりもかなり高速です。 平均すると、V-Net は 6 つの脳構造をセグメント化するのに 3.48 秒かかり、UNETR は GPU を使用して 48.14 秒、CPU を使用して 51.26 秒と 1101.82 秒かかりました。一方、FS は CPU を使用して約 15,735 秒かかり、V よりも約 307 秒と 14 倍遅かったです。 -Net と UNETR です。 CPU を使用して時間を計算したにもかかわらず、DL モデルは FS よりも 14 ~ 300 倍高速でした。 GPU ベースの DL モデルだけでなく、CPU 利用の DL モデルも、非 AI 手法 (つまり、FS) と比較して大幅なパフォーマンスを発揮することが実証されました。

V-Net、UNETR、FS のセグメンテーションと予測結果を図 2 に示します。3D 画像セグメンテーションのパフォーマンスを評価するために、Dice スコアが取得されました (補足表 S1)。 CNN および ViT ベースのモデルは、すべての脳構造で 0.85 を超える高い Dice スコアを示しました。 Dice スコアは、大脳基底核 (尾状核、被殻、淡蒼球) よりも中脳と橋の方が高かった。これはおそらく、脳幹が脳脊髄液に囲まれており、正確なセグメンテーションに強いコントラストを提供するためであると考えられる。 ViT ベースのモデルは、CNN ベースのモデルよりも高い Dice スコアを示し、その結果、ViT ベースのモデルよりもはるかに短いセグメンテーション時間が示されました (たとえば、図に示すように、V-Net では 51.26 秒、UNETR では 1101.82 秒)。表1)。 V-Net と UNETR をそれぞれ TensorFlow と PyTorch の異なる開発環境で評価しましたが、セグメンテーション速度に少なくとも 10 倍の差があることを考慮すると、CNN ベースの V-Net は ViT ベースの UNETR と速度の面で競合できると予想されます。私たちの実験。 さらに、表 2 に示すように、CNN ベースの V-Net は、実際の疾患分類において ViT ベースの UNETR と同様のパフォーマンスを示しました。

推定された体積を使用して、正常対 P プラス、正常対 PD、および PD 対 P プラスの症例に対して二項分類を実行しました。ここで、P プラスは、PSP、MSA-P、および MSA-C の症例で構成されていました。 表 2 にリストされているように、各モデルの脳構造の AUC が比較されました。表 2 には、中脳対橋比の AUC も示されています 31。

98 ケース(二値分類 7 ケース × 2 DL モデル × 脳構造 7 ケース)のうち、11 ケース(p 値が0.05未満)。 11 ケースのうちの半分以上 (つまり 7 ケース) では、DL モデル (つまり、CNN ベースの V-Net および ViT ベースの UNETR) の AUC も FS の AUC と同等でした。 この結果は、DL モデルが FS モデルのパフォーマンスをうまく再現している (つまり、FS と同様のパフォーマンスが得られている) ことを示しています。 さらに、CNN ベースの V-Net の症例のほとんどは、ViT ベースの UNETR の症例よりも疾患分類の AUC が低いことはありませんでした。

方法間の比較で最高の AUC は、正常または PD 対 MSA-C (0.91 ~ 0.94) の方が、正常または PD 対 PSP (0.75 ~ 0.89) よりも高かった。 脳構造の中で、中脳対橋の比は正常対MSA-C、PD対MSA-Cで最高のパフォーマンスを示し、一方、第三脳室と淡蒼球は正常対PSP、PD対MSA-Cで最高のパフォーマンスを示した。 PSP。 最高の AUC は、正常または PD と MSA-P (0.69 ~ 0.73) または PD (0.63) の分類において有意な差はありませんでした。

表 3 に示すように、DL モデルのほとんどの AUC は FS の AUC と大きく異なりませんでしたが、表 1 に示すように、モデルと FS の間のセグメンテーション速度にはかなりの違いが存在しました。 表 3 では、DL モデルの最高 AUC が各バイナリ分類の FS および DL モデルは太字で示されています。 PD vs. P-plus および正常 vs. P-plus 間の分類の最も高い AUC は、PD vs. MSA-P (AUC > 0.76) を除き、両方の DL モデルで 0.8 より高かった。 すべての最高 AUC において、FS モデルと DL モデルの間に有意差はありませんでした (p 値 0.05 以上)。

表 3 は、28 ケース (2 ML モデル × 2 DL モデル × 7 バイナリ分類) のうち、ほとんどのケース (つまり 24 ケース) に FS との有意差がなく (つまり、p 値が 0.05 を超える)、成功したことを証明していることを示しています。 DLモデルによるFSの性能の再現性。 表 2 にリストされているように、CNN ベースの V-Net は ViT ベースの UNETR よりも優れた AUC を達成しました。 14 ペアのケースのうち 9 ペアで、CNN ベースの V-Net が ViT ベースの UNETR を上回りました。 LR と XGBoost の両方の結果から、6 つの脳構造すべてを考慮した場合 (表 3)、個々の構造を考慮した場合 (表 2) よりも AUC が大幅に高くなることが確認されました。

私たちは 2 つの DL モデル、V-Net と UNETR を開発しました。これらは、FS よりも大幅に高速な脳セグメンテーションと同等の精度を示しました。 当社の DL モデルは、FS と比較してセグメンテーション時間を 14 ~ 300 倍短縮しました。 さらに、セグメント化された脳構造のボリュームを使用して、PD 症例と P-plus 症例の間の鑑別診断において堅牢な高いパフォーマンスを示しました。 DL モデルは、すべての脳構造とその脳構造の同時分析であっても、自動脳セグメンテーションと疾患診断において効率的 (すなわち、分析速度が FS より 14 ~ 300 倍速い) かつ効果的 (すなわち、ダイス スコアおよび AUC において FS に匹敵) でした。個々の分析。 したがって、提案された DL モデルは、臨床現場での自動脳セグメンテーションの適用を促進し、医学における効率的かつ正確な脳研究を促進する可能性があります。

自動化ツールは、パーキンソン病患者の鑑別診断における精度が高いにもかかわらず、臨床現場での脳セグメンテーションにはほとんど採用されていません 13,16。 これは主に、医師による脳 MRI スキャンの定性的視覚評価と比較して、自動脳セグメンテーションのプロセスが複雑で時間のかかることに起因しています。 したがって、自動セグメンテーション モデルは主に、定量的な脳測定を必要とする研究環境で使用されてきました。 それにもかかわらず、同様の精度で FS よりもはるかに高速なセグメンテーションを示した DL モデルを使用すると、臨床現場での応用が増える可能性があります。 DL モデルは、正確な脳画像分析を提供することで、PD または P-plus 症例の臨床診断の精度の向上に貢献する可能性があります。 さらに、多数の集団からの定量的な脳測定を必要とする臨床試験は、当社の高速で正確な DL モデルを使用して簡単に実施できます。 これまで、脳画像分析の方法は、FS などの自動セグメンテーション ツールを使用した場合でも、時間とリソースがかかりました。

V-net と UNETR は、CPU と GPU の両方で満足のいく精度で大幅に高速なセグメンテーションを示しましたが、CNN ベースの V-Net は、脳 MRI スキャンのボリューム測定に基づく診断の臨床現場でより適している可能性があります。 時間計測の公平性を図るため、前処理時間を除いて時間が計算されていることに注意してください。 FreeSurfer のセグメンテーション時間は、偵察パイプラインと脳幹下部構造パイプラインの登録ベースのセグメンテーションにかかる時間に対応します (補足図 S1)。 前処理時間を計算しても、CNN ベースの V-Net と ViT ベースの UNETR は、FreeSurfer よりそれぞれ 14 倍と 7 倍高速でした。 ViT ベースの UNETR は最新の DL モデルであり、高い Dice スコアを示しますが、学習パラメーターの数は V-Net の約 46 倍です。 表 1 に示すように、CPU を使用すると、14 ~ 22 倍の時間がかかる場合があります。 ただし、FS セグメンテーション時間と比較すると、DL モデルの処理時間が速く、FS と同等のパフォーマンスがあることは明らかです。 トレーニング可能なパラメーターの数に応じて計算の数が増加するため、グラフィックス プロセッシング ユニット (GPU) のメモリと処理能力の点でハードウェア要件が増加します。 したがって、ViT ベースの UNETR はトレーニングと評価にかなりの要求があり、高スペックの GPU を必要とする可能性があります。 CNN ベースの V-Net は、一般的に UNETR よりも高い AUC と、より低い Dice スコアを示しました。 ViT のパフォーマンスがさらに向上するまでは、GPU リソースの使用量が少ない CNN ベースの V-Net が臨床現場での最良の選択肢と思われます。

ゴールドスタンダードの機械学習ベースのアプローチを使用して、FreeSurfer のセグメンテーションと DL メソッドのセグメンテーションに基づく診断の AUC を示し、FreeSurfer と DL モデルのセグメンテーション結果の間に有意な差がないことを示しました。 当社の DL モデルは、診断性能を犠牲にすることなく FS よりも 14 ~ 300 倍高速であるため、臨床有効性の点で FS よりも優れています。 個々の脳構造を使用した二項分類では、各脳構造の AUC の相対順序は、以前に報告された結果と一致していました 10,32。 例えば、橋および中脳対橋の比は、正常対MSA-CおよびPD対MSA-C症例の分類において最も高いAUCを示した。 第三脳室と淡蒼球は、正常対PSP、PD対PSPの症例の分類において最も高いAUCを示した。 被殻は、PD および MSA-P 症例の分類において最も高い AUC を示しました。 PD と PSP の症例の分類では、第 3 脳室はより高い AUC を示しましたが、中脳は比較的低い AUC を示しました。 古典的な MRI 研究では PSP の中脳の萎縮が示されているにもかかわらず、中脳の単一測定では PSP を PD または MSA と区別できませんでした 33,34,35。 一方、第三心室は、PD から初期段階の PSP および後期段階の PSP を診断するための信頼できるマーカーであることが示されており 36、磁気共鳴パーキンソニズム指数の新しいバージョンに追加されました 37。

6 つの脳構造すべてに基づく二値分類では、すべてのモデルで AUC の大幅な改善が達成されました。 両方の DL モデルにおいて、PD 対 MSA-P の場合を除き、PD 対 P プラス、正常対 P プラスの症例の分類の最高 AUC は 0.8 を超えていました。 脳 MRI 症例に基づく PD 症例と MSA-P 症例の間の分類の AUC が比較的低いことも、以前の研究で報告されています 10,32。 臨床診断の限界は、PD 症例と MSA-P 症例の間で症状が重複しているため、これらの研究での AUC が比較的低いことに寄与している可能性があります。 PSP および MSA-P の臨床診断は、診断基準を考慮した場合でも、剖検で証明された診断と最も頻繁に一致しないことが報告されています 38。 脳の MRI スキャンでは正常症例と PD 症例の間に有意差は見つからず、その結果、これらの症例間の分類における AUC に有意な差は生じません。

私たちの研究にはいくつかの限界があります。 まず、PD、PSP、MSA-C の診断は病理学的に検証されていません。 代わりに、動作の専門家は、検証された臨床的コンセンサスに基づいて臨床診断を提供し、可能性の高い診断のみを提供しました。 第二に、我々は 6 つの脳構造、すなわち中脳、橋、延髄、被殻、淡蒼球、および第三脳室をセグメント化しましたが、PD と P-plus の間の異なる病理学的特徴を反映している可能性のある他の脳構造 (例、小脳、中小脳脚) を無視しました。 。 FS によって達成されるセグメンテーション精度が低いため、これらの構造は除外しました。 また、DL メソッドは、粗い特徴を優先的に学習します。これは、粗い特徴はトレーニング データの共通領域、つまり低周波領域であるためです。 これにより、FS よりも滑らかな画像が得られ、画像の外側の縁にある小さなアーティファクトが軽減されます。 ただし、より小さな変化が重要な小脳の場合は、手動による小脳のセグメンテーションと比較して、私たちの DL 方法が小脳の小脳回のセグメンテーションに適用できるかどうかを知るために、より具体的な研究が必要です。 それにもかかわらず、この研究に含まれる脳構造のみを使用した P-plus の鑑別診断は信頼できると報告されています 31。 3 番目に、メモリ制限を考慮して、出力形状を \(256 \times 256 \times 256\) から \(256 \times 256 \times 128\) にダウンスケールしました。これにより、情報損失が発生した可能性があります。 それにもかかわらず、Dice スコアは、情報損失の影響が無視できることを示唆していますが、ダウンスケールされた入力を使用すると、DL モデルでのトレーニングと推論が高速化されます。 第 4 に、FreeSurfer はセグメンテーション用の GPU (つまり CUDA) をサポートしていないため、DL モデル間の時間を比較することが困難になります。 CPU を使用してセグメンテーション時間を計算しましたが、それでも DL モデルの方が 14 ~ 300 倍高速であると結論付けられました。

脳 MRI スキャンの自動セグメンテーションは、運動障害を含む神経変性疾患を診断するための有力な方法となっています。 高性能の CNN および ViT ベースのモデルを使用することで、従来の FS セグメンテーションと同等の精度を実現しながら、脳深部構造のセグメンテーション時間を大幅に短縮しました。 DL の優れた性能にもかかわらず、PD および P-plus を含む神経変性疾患の鑑別診断に関して、DL の性能の比較分析および評価の定量的な結果はこれまで報告されていません。 費用対効果の高い CNN ベースのモデルは、最新の ViT ベースのモデルと比較して、セグメンテーションと鑑別診断の両方で満足のいくパフォーマンスを達成していることがわかりました。 当社の DL モデルは、迅速かつ正確な診断を可能にする患者と臨床医に優しいセグメンテーション手法の開発に貢献する可能性があり、神経変性疾患の DL 脳セグメンテーションと診断の導入を計画している病院に有意義な参考資料を提供する可能性があります。

この研究は、AI が既存の代表的な非 AI 手法と比べて診断性能においてより効果的であるかどうかを比較することに焦点を当てています。 したがって、本研究は技術の比較が目的であるため、本研究では臨床医との比較は行っていない。 機械学習手法と臨床医の間で診断の精度を比較することは、将来有望な研究となるでしょう。

このセクションでは、脳 MRI データ (セクション「データ準備」)、FS 実装 (セクション「脳構造セグメンテーション: FS によるベースライン」)、および DL メソッド実装 (セクション「脳構造セグメンテーションの DL モデル」) について説明します。神経変性疾患を診断するための主要な脳構造の体積分析。 図 1 は、FS モデルと DL モデル (つまり、それぞれ CNN と ViT DL アーキテクチャを表す修正 V-Net と UNETR) の評価と比較を考慮した研究プロセスの概要を示しています。 補足図S1は、全体的なパフォーマンスの比較の図を示しています。 私たちは、FS と同等のセグメンテーション パフォーマンスを持ちながら、より高速な処理を備えた DL モデルを開発しました。 DL モデルは、各脳構造の FS の結果 \(F_i \in [0,1]^{256 \times 256 \times 128}\) をモデル出力 \(V_i \in [0, 1]^{256 \times 256 \times 128}\) を入力として (\(i \ \{淡蒼球、\、被殻、\、尾状核、\、第三 \、脳室、\、中脳、\、橋 \}\))、解像度 (h、w、d) (高さ \(h=256\ )、幅 \(w=256\)、奥行き \(d=128\))。 6 つの脳構造の DL セグメンテーション結果は、3D バイナリ マスクとして保存されました (\(F_i\) と \(V_i\) は、それぞれ脳構造 i の FS マスクと DL モデル マスクを示します)。各マスク出力には、 0 と 1 (それぞれターゲットの脳構造の外側と内側の領域)。 FS または DL モデルによって予測される各脳構造またはすべての脳構造の絶対体積を計算することにより、PD、MSA-C、MSA-P、PSP、正常例の二項分類を実行し、曲線下面積 (AUC) を計算しました。セグメンテーションの。

この研究の著者全員は、すべての方法または実験がヘルシンキ宣言およびネイチャー・ポートフォリオ雑誌の方針によって提供される関連ガイドラインおよび規制に従って実施されたことを確認します。 この研究は、Samsung Medical Center の治験審査委員会によって承認されました (IRB 番号: SMC 2021-07-026)。 サムスン医療センターの治験審査委員会は、匿名化された遡及データを使用したため、患者の書面によるインフォームドコンセントを放棄しました。

私たちは、2017年1月から2020年12月までにサムスン医療センター神経内科の患者を遡及的にスクリーニングした。PD、MSAの可能性、またはPSPの可能性と診断された患者がこの研究に含まれていた。 各患者の診断は、以下の基準に基づいて運動障害の専門家によって決定されました。 PD は、[18F] N-(3-フルオロプロピル)-2β-カーボン エトキシ-3β-( 4-ヨードフェニル)ノルトロパン陽電子放射断層撮影法により、MSA40の二次コンセンサス診断およびPSP41の運動障害学会臨床診断基準に従って、MSAとPSPの可能性がそれぞれ診断された。 MSA 症例は、コンセンサスに達した後、さらに MSA-P または MSA-C に分類されました40。 脳MRIスキャンに影響を与える可能性のある、脳卒中や腫瘍を含む、付随的または構造的脳病変を有する患者は研究から除外された。 年齢が一致した健康な高齢者集団を対照群として含めました。 表 4 に示す、年齢、性別、および脳 MRI 検査が収集されるまでの罹患期間に関する人口統計情報。411 人の個人からのデータを分析し、DL モデルをトレーニングおよび評価するために 3 重交差検証を実行しました。 各グループは、105 人の健康な対照と 105 人の PD、69 人の PSP、69 人の MSA-C、および 63 人の MSA-P 症例で構成されました。

検証セットとテストセットのバイアスを軽減し、セットの構成(グループ内のケースの組み合わせ)の効果を分析するために、評価に 3 つの外側のフォールドを使用した交差検証を適用しました。 データはランダムに 3 つのセクション (1 つはテスト用、2 つはトレーニング用) に分割されました。 各グループは、正常例 35 例、PD 例 35 例、PSP 例 23 例、MSA-C 例 23 例、MSA-P 例 21 例で構成されました。

アキシャル脳 MRI スキャンは、T1 磁化で準備された勾配エコーの高速収集の標準プロトコルを使用して収集されました。反復/エコー時間は 11,000/125 ミリ秒、反転時間は 2800 ミリ秒、視野は 240 mm、収集マトリ​​ックス サイズは 100 mm です。 \(320 \times 249\)、エコー トレイン長 27、信号平均 1、スライス厚 5 mm、スライス間ギャップ 1.5 mm、スキャン時間 198 秒。

灰白質のパーキンソン症候群に関与する 6 つの脳構造、すなわち中脳、橋、被殻、淡蒼球、尾状核、および第三脳室を含めました。 これらの領域は、パーキンソン症候群の鑑別において最も高い感度と特異性を有すると報告されています13,16。 MRI スキャンのサイズを \(256 \times 256 \times 128\) (つまり、冠状面/矢状面/軸面のスライス数) に変更して、各構造をセグメント化しました。

FS は、Digital Imaging and Communications in Medicine (DICOM) または Neuroimaging Informatics Technology Initiative (NIfTI) ファイルを入力として受け入れます。 DICOM は、魅力的で柔軟ですが複雑な形式で、複数のハードウェア ツールとソフトウェア ツール間の相互運用性を提供します。 DICOM 形式はその複雑さを考慮して NIfTI 形式に変換されました42。 NIfTI は DICOM よりも簡単な形式であり、重要なメタデータを保存します。 さらに、ボリュームを単一のファイルとして維持し、単純なヘッダーの後の生データを使用するため、脳全体の画像については、NIfTI ファイルは DICOM ファイルよりも高速にロードおよび処理できます。 そこで、脳 MRI DICOM 形式のファイルを MRIcroGL を使用して NIfTI 形式のファイルに変換しました。

アトラスベースの自動セグメンテーションを使用して取得された脳構造の抽出は、自動 DL セグメンテーション モデルを確立する前のトレーニングと検証に必要です。 本研究では、これらの結果を DL グラウンドトゥルースラベルとして使用し、同じラベルを生成するための DL モデルの妥当性を評価しました。 アトラスベースの自動セグメンテーション (詳細は補足セクション A.2 を参照) の代表的な技術として、神経科学研究用に公開されており、高いセグメンテーション パフォーマンスを提供する FS (バージョン 7.2) を選択しました。 44. さらに、FS は CUDA をサポートしなくなったため、GPU を使用して時間を計算できなくなりました。

FS を用いて 6 つの脳構造をセグメント化して抽出するために、recon-all45 パイプラインと Brainstem Sub Structure パイプライン 46 を順次実行します。 Recon-all パイプラインは脳幹構造 (橋や中脳など) のセグメント化をサポートしていないため、両方のパイプラインを使用しました。 ただし、Brainstem Substructure パイプラインは recon-all パイプラインから前処理された入力を受け取るため、両方のパイプラインを実行する必要があります。 したがって、FS による 6 つの脳構造の抽出は、リコンオール パイプラインでの MRI スキャンの前処理と、脳幹サブ構造パイプラインでのセグメンテーションを伴うリコンオール パイプラインの残りのセグメンテーションに分けることができます。 これらのプロセスについては、「データの準備」セクションと「脳構造のセグメンテーション: FS によるベースライン」のセクションで説明します。

FS の偵察パイプラインにおける MRI スキャンの前処理は、主に (1) 動きの補正、(2) 正規化、および (3) 頭蓋骨の除去で構成されます。 さまざまなソース ボリュームが使用される場合、平均化の前にモーション補正が実行され、ボリューム間の小さなモーションの変動が補償されます。 FS は、ソフトウェアを使用して皮質表面モデルと白質と皮質灰白質の境界を構築し、患者の脳画像と自動的に照合します17。 さらに、強度の正規化が元のボリュームに適用されます。 ただし、強度の変動を調整すると、強度に基づくセグメンテーションが妨げられる可能性があります。 代わりに、すべてのボクセルの強度を白質の平均値 (110) にスケールします。

動きを補正し、データを正規化した後、FS は頭蓋骨を除去し、頭蓋骨を剥がした脳の MRI スキャンを提供します。 頭蓋内脳空洞 (皮膚、脂肪、筋肉、首、眼球など) を除去すると、人間の評価者のばらつき 47 が減少し、自動脳画像セグメンテーションが促進され、分析品質が向上する可能性があります。 したがって、脳 MRI スキャンは、頭蓋骨剥離として知られるプロセスで頭蓋外組織または脳以外の組織から脳を分離するために前処理する必要があります 48。 FS の開発者は、デフォルトで頭蓋内腔を隔離するための社内の自動頭蓋骨剥離アルゴリズムを考案し、適用しました。

この研究では、脳 MRI スキャンの前処理のステップ (つまり、動き補正を伴う頭蓋骨の剥離と脳 MRI スキャンの正規化) に約 20 分かかりました。 元の脳 MRI スキャンのサイズが \(256\times 256 \times 256\) であったのに対し、最終的な頭蓋骨を剥ぎ取った画像を \(256 \times 256 \times 128\) のサイズの NIfTI ファイルに変換しました。 DL モデルと効率的に比較できるように調整されています。

前処理 (セクション「脳構造のセグメンテーション: FS によるベースライン」) の後、FS は、偵察パイプラインの残りのプロセスと完全な脳幹サブ構造パイプラインを適用することにより、6 つの脳構造をセグメント化します。 頭蓋骨除去後、登録ベースのセグメンテーションは次のように進行します。 FS は、両半球の白質と灰白質の境界面を決定し、調整します。 次に、FS は軟膜表面を表す灰白質のエッジを検索します。 軟膜表面を使用すると、FS は溝堤と脳回隆起を拡張および膨張させます。 その後、それは再び球形に広がり、皮質を細分化します。 これらのプロセスを適用した後、FS は脳をセグメント化します。 偵察パイプラインは一部の脳構造 (つまり、被殻、尾状核、淡蒼球、第三脳室) を包含し、一方、脳幹下部構造パイプラインは中脳と橋をセグメント化します。

この研究では、最終的なセグメンテーションの結果は、同じ入力サイズ \(256 \times 256 \times 128\) を使用して評価されました。 セグメンテーション結果の元のサイズは \(256 \times 256 \times 256\) でしたが、DL モデルとの比較のために \(256 \times 256 \times 128\) に調整されました。 さらに、セグメンテーションを実行するために、FS を頭蓋骨剥離 MRI スキャンに適用された DL モデル (つまり、偵察パイプラインの前処理結果) に置き換えました。 置き換えにあたっては、DL 解析が FS 解析よりも高速であるか、DL のセグメンテーション結果が FS と比較して十分再現性があるかどうかを評価しました。 FS セグメンテーションと DL セグメンテーションの違いを図 2 に示します。

この研究では、DL モデルと FS を使用して、同じ頭蓋骨を剥がした画像 (つまり、セクション「脳構造のセグメンテーション: FS によるベースライン」で説明されているように、FS 再コンオール パイプラインによって前処理された画像) をセグメント化しました。 FS によって生成された頭蓋骨を除去した画像の元のサイズは \(256 \times 256 \times 256\) でしたが、GPU メモリが限られているため、DL セグメンテーション用に \(256 \times 256 \times 128\) に調整されました。 スカルストリッピング後のFSのセグメンテーション処理をDLに置き換えて、DLモデルの性能と解析時間を評価・比較しました。 FS は脳画像全体をセグメント化し、何時間もの処理を必要とするため、非効率である可能性があります。 実際、FS では、MRI スキャン全体の座標を変換して特定の脳構造をセグメント化するためにアトラスベースの位置合わせが必要となるため、この研究で検討した 6 つの脳構造をセグメント化するのに少なくとも 4.5 時間かかります。 したがって、FS が 6 つの脳構造のみをセグメント化した場合でも、処理時間を大幅に短縮することはできません。 一方、DL セグメンテーション (V-Net または UNETR を使用) では、6 つのターゲット脳構造をセグメント化するのに、ケースごとに 1 分から 18 分未満かかることが確認されました。 DL モデルは、非人工知能手法 (FS など) とは異なり、複雑な登録を必要としないため、処理効率を大幅に向上させることができます。 DL モデルの実装の詳細については、ここで説明します。 DL モデルとして、FS から提供されたセグメンテーション結果をラベルとして使用する CNN ベースの V-Net29 および ViT ベースの UNETR30 を採用しました (セクション「脳構造セグメンテーション: FS によるベースライン」)。 2 つのモデルは、FS セグメンテーションを再現するようにトレーニングされました。

V-Net を使用した CNN ベースの 3D セグメンテーションのアーキテクチャ。 ResBlock、MaxPooling、および UpConvolution を使用して、深さ、高さ、幅を削減しました。 図に示されている出力は、淡蒼球のセグメンテーションです。 (Conv 畳み込み層、BN バッチ正規化)。

V-Net は、前立腺を明らかにするために MRI ボリューム上でエンドツーエンド CNN をトレーニングした後、ボリューム全体をセグメント化するために使用されてきました 29,49,50。 V-Net のアーキテクチャは V 字型で、ネットワークの左側の部分が圧縮パスであるのに対し、右側の部分は元の入力サイズが回復されるまで特徴を解凍します。 ネットワークの左側の部分は、さまざまな解像度で動作するステージに分かれています。

この研究では、各ステップで 1 ~ 3 つの畳み込み層が使用されました。 残差関数は各レベルで学習されました。 残りの部分の入力は、畳み込み層と非線形演算で使用されました。 この出力はステージの最後の畳み込み層に追加されました。 非線形活性化関数として、修正線形単位 (ReLU) を使用しました。 畳み込みは圧縮パス全体に適用されました。 ネットワークの右側の部分は、左側の部分と同様の残差関数を学習しました。 V-Net は有望なセグメンテーション結果を示しており、アプリケーションでこのモデルを使用するとパフォーマンスが向上しました。 モデルは利用可能なメモリに応じて調整されました。 提案されたアーキテクチャを図 3 に示します。左側の部分では、残差ブロック (ResBlock) と最大プーリング (MaxPooling) が使用されています。 ResBlock は、入力サイズ \(256 \times 256 \times 128\) のすべてのブロックに適用されました。 一方、3D MaxPooling は、解像度を下げるためにフィーチャ マップの深さ、高さ、幅を減らしました。 右側の部分も ResBlock を使用していますが、MaxPooling を UpConvolution に置き換えています。これは、3D アップサンプリング、バッチ正規化、ReLU アクティベーション、畳み込み層 (\(5 \times 5\times 5\) フィルター、同じパディング、ストライド 1) で構成されています。 アップサンプリングにより特徴マップの解像度が向上し、バッチ正規化によりネットワーク全体の収束が向上しました51。

セグメンテーション用にさまざまな解像度でスキップ接続を介して CNN ベースのデコーダに直接接続された ViT ベースの UNETR のアーキテクチャ。 (Deconv デコンボリューション レイヤー、Conv コンボリューション レイヤー、BN バッチ正規化、MLP 多層パーセプトロン)。

UNETR30 は、3D 医療画像セグメンテーション用のトランスフォーマー アーキテクチャです。 UNETR を脳腫瘍のセグメンテーションとして使用した研究はありますが 52、脳の部位のセグメンテーションについては研究が行われていませんでした。 エンコーダとデコーダに U 字型アーキテクチャを採用しながら、エンコーダとしてトランスフォーマを使用して入力ボリュームのシーケンス表現を学習し、グローバルなマルチスケール情報をキャプチャします。 提案されたアーキテクチャを図 4 に示します。UNETR は、スキップ接続を介してデコーダに接続されたトランスのスタックで構成されるエンコーダを使用して、縮小と拡張のパスをたどりました。 エンコーダーは 3D パッチを直接使用し、スキップ接続を介して CNN ベースのデコーダーに接続されました。 3D 入力ボリュームは、均一な重複しないパッチに分割され、線形レイヤーを使用してサブスペースに投影されました。 位置の埋め込みがシーケンスに適用され、トランスフォーマーへの入力として使用されました。 トランスフォーマー内のさまざまなレベルでエンコードされた表現が取得され、スキップ接続を介してデコーダーに送信され、セグメンテーションの結果が取得されます。

DL モデルの場合、入力は脳マスクと、MRI スキャンでの対応する患者のセグメント化された脳構造で構成され、次元 \(256 \times 256 \times 128\) の配列にマージされました。 各脳構造のグラウンド トゥルースは、FS を使用してセグメント化されました。 評価のために、テスト データの 3 重交差検証を適用して、Dice スコアと Dice loss を計算しました。 V-Net を TensorFlow と Keras に実装し、100 エポック間トレーニングしました。 UNETR の場合、PyTorch と MONAI53 が適用され、モデルは 20,000 回の反復でトレーニングされました。 どちらのモデルも Python 言語を使用し、NVIDIA Tesla V100 DGXS GPU を使用してバッチ サイズ 1、初期学習率 0.0001 でトレーニングされました。 CPUにはIntel(R) Xeon(R) CPU E5-2698 v4 @ 2.20Ghzを使用しました。

V-Net (または UNETR) および FS 出力と予想されるセグメンテーションを比較することにより、Dice スコアを使用して評価モデルの精度を評価しました。 ダイス スコアは、参照セグメンテーション マスクと予測セグメンテーション マスク間の重複を測定します。 ダイス スコア 1 は 2 つのバイナリ ピクチャ間の完全な空間的対応を示し、スコア 0 は相関がないことを示します。 Dice 損失を使用して、対応する構造のテスト セットに対する 3 つの外側の相互検証のパフォーマンスを決定しました。 \(F_i\) と \(V_i\) がそれぞれ、脳構造ごとのグラウンドトゥルース マスクとその予測である場合 (つまり、それぞれ FS セグメンテーション マスク \(F_i\) とその DL 予測マスク \(V_i\) 、図 1) に示すように、各脳構造 \(i \in\) \(\{\)淡蒼球、被殻、尾状核、第三脳室、中脳、橋\(\}\) の Dice スコア 54 は次のように導出されます。

ここで、 \(\circ {}\) はアダマール積 (つまり、成分ごとの乗算) を表し、 \(||\cdot ||_{1}\) は L1 ノルム (つまり、すべての絶対値の合計) を表します。コンポーネント)。 また、評価のためにセグメンテーション時間を計測した。

DL モデル (CNN ベースの V-Net または ViT ベースの UNETR) または FS によって予測された 6 つのセグメント化された脳構造 (橋、被殻、淡蒼球、中脳、尾状核、第三脳室) から絶対容積を取得しました。 。 個々の脳構造の絶対体積に基づいて、疾患の二項分類、正常対 P プラス、正常対 PD、および PD 対 P プラスの AUC を計算しました。 AUC は、各脳構造の予測絶対容積と各症例の間の相関によって生成された受信機動作特性曲線に基づいて計算されました。

疾患の二項分類は、6 つのセグメント化された脳構造を個別にまたは集合的に使用して実行されました。 個々の分析では、個々の構造の絶対体積を取得することにより、しきい値ベースの二値分類を通じて AUC が導出されました。 すべての構造を包括的に分析するために、6 つのボリュームを入力として疾患の二値分類を実行する ML 分類アルゴリズムをさらに検討しました。 分類アルゴリズムには、二項ロジスティック回帰 (LR) と極度勾配ブースティング (XGBoost) が使用されました。 LR は、ML 分類で広く使用されている統計モデルです55、56、57。 XGBoost は、勾配ブースティングベースの手法の中でも高度な結果を生み出す確立された手法です 58 (たとえば、XGBoost は、2015 年までに Kaggle に投稿された 29 の ML タスクのうち 17 を獲得することに成功しました 59)。 どちらの方法でも、DL モデルと FS によって得られた AUC を 3 重交差検証によって評価しました。

著者らは、この研究結果を裏付ける主要なデータが論文内で入手可能であることを宣言します。 サムスン医療センターからの生データセットは患者のプライバシーを保護するために保護されていますが、対応する治験審査委員会から承認が得られる限り、合理的な要求に応じて利用可能になります。 データの利用可能性についてのリクエストについては、Jong Hyeon Ahn ([email protected]) までご連絡ください。

DL モデルに使用されたコードは、GitHub: https://github.com/kskim-phd/AI_vs_FS で入手できます。

この論文の訂正が公開されました: https://doi.org/10.1038/s41598-023-33774-z

Berg, D. et al. 前駆性パーキンソン病の MDS 研究基準。 ムーヴム。 障害。 30、1600 ~ 1611 年。 https://doi.org/10.1002/mds.26431 (2015)。

記事 Google Scholar

Meijer, FJA、Goraj, B.、Bloem, BR & Esselink, RAJ パーキンソン病の診断精密検査における脳 MRI の臨床応用。 J.パーク。 ディス。 7、211–217。 https://doi.org/10.3233/JPD-150733 (2017)。

記事 Google Scholar

渡辺博史 ほか多系統萎縮症の臨床的および画像的特徴: 早期かつ臨床的に確定診断するための課題。 J.モヴェム。 障害。 11、107。https://doi.org/10.14802/jmd.1802 (2018)。

記事 Google Scholar

Whitwell、JL et al. PSP での診断のための放射線バイオマーカー: 私たちはどこにいるのか、どこにいる必要があるのか​​? ムーヴム。 障害。 32、955–971。 https://doi.org/10.1002/mds.27038 (2017)。

記事 Google Scholar

Jankovic, J.、Hallett, M.、Okun, MS、Comella, CL & Fahn, S. 運動障害の原則と実践 電子書籍 (Elsevier Health Sciences、アムステルダム、2021)。

Google スカラー

Hussl、A. et al. 進行性核上性麻痺をパーキンソン病および多系統萎縮症のパーキンソン病変型と区別するための、磁気共鳴パーキンソニズム指数および中脳橋面積比の診断精度。 ムーヴム。 障害。 25、2444–2449。 https://doi.org/10.1002/mds.23351 (2010)。

記事 Google Scholar

Quattron, A. et al. 進行性核上性麻痺とパーキンソン病および多系統萎縮症のパーキンソン病変型とを区別するための MR 画像指標。 放射線学 246、214–221。 https://doi.org/10.1148/radiol.2453061703 (2008)。

論文 PubMed Google Scholar

Paviour, DC、Price, SL、Jahanshahi, M.、Lees, AJ & Fox, NC 地域の脳容積により PSP、MSA-P、PD が区別される: MRI に基づく臨床放射線学的相関。 ムーヴム。 障害。 21、989–996。 https://doi.org/10.1002/mds.20877 (2006)。

記事 Google Scholar

ザニーニ、S.ら。 進行性核上性麻痺とパーキンソン病を区別するための MR マーカーの精度。 ニューロイメージクリニック。 11、736–742。 https://doi.org/10.1016/j.nicl.2016.05.016 (2016)。

記事 PubMed PubMed Central Google Scholar

マッシー、LA et al. 進行性核上性麻痺および多系統萎縮症における従来の磁気共鳴画像法。 ムーヴム。 障害。 27、1754 ~ 1762 年。 https://doi.org/10.1002/mds.24968 (2012)。

記事 Google Scholar

シュラグ、A.ら。 日常的な MRI による非定型パーキンソン症候群の鑑別。 神経学 54、697–697。 https://doi.org/10.1212/WNL.54.3.697 (2000)。

論文 CAS PubMed Google Scholar

キム、イェ、カン、SY、マ、H.-I.、ジュ、Y.-S. & Kim, YJ 調整可能な診断妥当性を備えたハチドリのサインの視覚的評価スケール。 J.パーク。 ディス。 5、605–612。 https://doi.org/10.3233/JPD-150537 (2015)。

記事 Google Scholar

Saeed, U.、Lang, AE & Masellis, M. パーキンソン病および非定型パーキンソン症候群におけるニューロイメージングの進歩。 フロント。 ニューロール。 1189、572976。https://doi.org/10.3389/fneur.2020.572976 (2020)。

記事 Google Scholar

メラー、L. et al. パーキンソン症候群における手動 MRI 形態計測。 ムーヴム。 障害。 32、778–782。 https://doi.org/10.1002/mds.26921 (2017)。

記事 Google Scholar

Despotović, I.、Goossens, B. & Philips, W. 人間の脳の MRI セグメンテーション: 課題、方法、および応用。 計算します。 数学。 方法 医学。 https://doi.org/10.1155/2015/450341 (2015)。

記事 PubMed PubMed Central Google Scholar

Fawzi, A.、Achuthan, A. & Belaton, B. 近年の脳画像セグメンテーション: 物語的なレビュー。 Brain Sci.https://doi.org/10.3390/brainsci11081055 (2021)。

記事 PubMed PubMed Central Google Scholar

フィッシュル、B.フリーサーファー。 ニューロイメージ 62、774–781。 https://doi.org/10.1016/j.neuroimage.2012.01.021 (2012)。

論文 PubMed Google Scholar

デューイ、J. 他マルチサイト研究による HIV 感染患者の皮質下構造の自動支援手動測定と比較した、MRI ベースの自動容積測定ソフトウェアの信頼性と妥当性。 ニューロイメージ 51、1334 ~ 1344 年。 https://doi.org/10.1016/j.neuroimage.2010.03.033 (2010)。

論文 PubMed Google Scholar

Eggert, LD、Sommer, J.、Jansen, A.、Kircher, T. & Konrad, C. 人間の脳の実際およびシミュレートされた構造磁気共鳴画像における自動灰白質セグメンテーション経路の精度と信頼性。 PLOS ONEhttps://doi.org/10.1371/journal.pone.0045081 (2012)。

記事 PubMed PubMed Central Google Scholar

メイヤー、KN et al. 2 ~ 3 歳の小児における自動脳容積測定法と立体学との比較。 神経放射線学 58、901–910。 https://doi.org/10.1007/s00234-016-1714-x (2016)。

論文 PubMed Google Scholar

Klauschen, F.、Goldman, A.、Barra, V.、Meyer-Lindenberg, A.、Lundervold, A. 自動脳 MR 画像セグメンテーションおよびボリューム測定法の評価。 ハム。 脳マップ。 30、1310–1327。 https://doi.org/10.1002/hbm.20599 (2009)。

論文 PubMed Google Scholar

Pham, DL、Xu, C. & Prince, JL 医用画像セグメンテーションの現在の手法。 アンヌ。 バイオメッド牧師。 工学 2、315–337。 https://doi.org/10.1146/annurev.bioeng.2.1.315 (2000)。

論文 CAS PubMed Google Scholar

Christensen, GE、Joshi, SC & Miller, MI 脳の解剖学的構造の体積変換。 IEEEトランス。 医学。 画像 16、864–877。 https://doi.org/10.1109/42.650882 (1997)。

論文 CAS PubMed Google Scholar

Collins, DL、Holmes, CJ、Peters, TM & Evans, AC 自動 3-D モデルベースの神経解剖学的セグメンテーション。 ハム。 脳マップ。 3、190–208。 https://doi.org/10.1002/hbm.460030304 (1995)。

記事 Google Scholar

イオシフェスク、DV et al. MRI 皮質下の脳構造を測定するための自動登録アルゴリズム。 ニューロイメージ 6、13 ~ 25。 https://doi.org/10.1006/nimg.1997.0274 (1997)。

論文 CAS PubMed Google Scholar

McClure, P. et al. ベイジアン ディープ ニューラル ネットワークを使用した脳セグメンテーションで何がわかっているかを知る。 フロント。 Neuroinform.https://doi.org/10.3389/fninf.2019.00067 (2019)。

記事 PubMed PubMed Central Google Scholar

Rastogi, D.、Johri, P.、Tiwari, V. 2D-Vnet 深層学習アーキテクチャを使用した脳腫瘍のセグメンテーションと腫瘍予測。 2021 年には、第 10 回システム モデリングと研究動向の進歩に関する国際会議 (SMART)https://doi.org/10.1109/smart52563.2021.9676317 (2021) に開催されます。

ハタミザデ、A.ら。 Swin UNETR: MRI 画像内の脳腫瘍のセマンティック セグメンテーション用の Swin トランスフォーマー。 国際 MICCAI 脳障害ワークショップ、272–284 (Springer、2022)。

ミレタリ、F.、ナヴァブ、N.、アフマディ、S.-A. V-Net: 体積医療画像セグメンテーション用の完全畳み込みニューラル ネットワーク。 2016 年の第 4 回 3D ビジョン (3DV) 国際会議、565–571、https://doi.org/10.1109/3DV.2016.79 (2016)。

ハタミザデ、A.ら。 Unetr: 3D 医療画像セグメンテーション用のトランスフォーマー。 コンピューター ビジョンとパターン認識に関する IEEE/CVF 会議議事録、574–584 (2022)。

Chougar, L. et al. 臨床現場での磁気共鳴画像法を使用したパーキンソン症候群の自動分類。 ムーヴム。 障害。 36、460–470。 https://doi.org/10.1002/mds.28348 (2021)。

記事 CAS Google Scholar

Sjöström, H.、Granberg, T.、Hashim, F.、Westman, E. & Svenningsson, P. 自動化された脳幹容積測定は、パーキンソン病の診断に役立ちます。 公園。 関連。 障害。 79、18–25 (2020)。

記事 Google Scholar

Brooks, DJ & Seppi, K. 多系統萎縮症の診断のための神経画像診断基準の提案。 ムーヴム。 障害。 24、949–964。 https://doi.org/10.1002/mds.22413 (2009)。

記事 Google Scholar

Hotter, A.、Esterhammer, R.、Schocke, MF、Seppi, K. パーキンソン病の鑑別診断における高度な MR 画像技術の可能性。 ムーヴム。 障害。 24、S711–S720。 https://doi.org/10.1002/mds.22648 (2009)。

記事 Google Scholar

大場 博 ほか進行性核上性麻痺に対する新しくて信頼性の高い MRI 診断。 神経学 64、2050–2055。 https://doi.org/10.1212/01.WNL.0000165960.04422.D0 (2005)。

論文 CAS PubMed Google Scholar

Quattron, A. et al. 臨床現場で進行性核上性麻痺と新規パーキンソン病を早期に区別するための新しい MRI 手段:国際研究。 ムーヴム。 障害。 36、681–689。 https://doi.org/10.1002/mds.28364 (2021)。

記事 CAS Google Scholar

Quattron, A. et al. 進行性核上性麻痺パーキンソン病とパーキンソン病を区別するための新しい MR 画像指標。 公園。 関連。 障害。 54、3-8。 https://doi.org/10.1016/j.parkreldis.2018.07.016 (2018)。

記事 Google Scholar

Rizzo、G. et al. パーキンソン病の臨床診断の正確さ:系統的レビューとメタ分析。 神経学 86、566–576。 https://doi.org/10.1212/WNL.0000000000002350 (2016)。

論文 PubMed Google Scholar

Hughes, AJ、Daniel, SE、Kilford, L. & Lees, AJ 特発性パーキンソン病の臨床診断の正確さ: 100 例を対象とした臨床病理学的研究。 J.Neurol. 脳神経外科。 精神医学 55、181–184。 https://doi.org/10.1136/jnnp.55.3.181 (1992) https://jnnp.bmj.com/content/55/3/181.full.pdf。

論文 CAS PubMed PubMed Central Google Scholar

ギルマン、S.ら。 多系統萎縮症の診断に関する 2 番目のコンセンサス ステートメント。 神経学 71、670–676。 https://doi.org/10.1212/01.wnl.0000324625.00404.15 (2008) https://n.neurology.org/content/71/9/670.full.pdf。

論文 CAS PubMed PubMed Central Google Scholar

Höglinger、GU et al. 進行性核上性麻痺の臨床診断:運動障害学会の基準。 ムーヴム。 障害。 32、853–864。 https://doi.org/10.1002/mds.26987 (2017)。

記事 Google Scholar

Whitcher, B.、Schmid, VJ & Thorton, A. RJ Stat における DICOM および NIfTI データ標準の使用ソフトウェア。 44、1-29。 https://doi.org/10.18637/jss.v044.i06 (2011)。

記事 Google Scholar

Heinen、R. et al. さまざまな MRI 磁場強度にわたる脳容積測定の自動化手法の堅牢性。 PLoS ONEhttps://doi.org/10.1371/journal.pone.0165719 (2016)。

記事 PubMed PubMed Central Google Scholar

Velasco-Annis, C.、Akhondi-Asl, A.、Stamm, A. & Warfield, SK 脳 MRI セグメンテーション アルゴリズムの再現性: ローカル マップ PSTAPLE、FreeSurfer、および FSL-first の経験的比較。 J. ニューロイメージング 28、162–172。 https://doi.org/10.1111/jon.12483 (2017)。

論文 PubMed Google Scholar

全てを偵察する。

イグレシアス、J.E. et al. MRI における脳幹構造のベイジアン セグメンテーション。 ニューロイメージ 113、184–195。 https://doi.org/10.1016/j.neuroimage.2015.02.065 (2015)。

論文 PubMed Google Scholar

Kleesiek、J. et al. 深部 MRI 脳抽出: 頭蓋骨剥離のための 3D 畳み込みニューラル ネットワーク。 ニューロイメージ 129、460–469。 https://doi.org/10.1016/j.neuroimage.2016.01.024 (2016)。

論文 PubMed Google Scholar

Kalavathi、P. & Prasath、VBS MRI 頭部スキャン画像の頭蓋骨剥離の方法: レビュー。 J.ディグ。 画像化 29、365–379。 https://doi.org/10.1007/s10278-015-9847-8 (2015)。

記事 Google Scholar

ボッケッタ、M. et al. 自動脳幹セグメンテーションは、非定型パーキンソン症候群における異なる関与を検出します。 J.モヴェム。 障害。 13、39–46。 https://doi.org/10.14802/jmd.19030 (2020)。

記事 Google Scholar

Manjón、JV et al. pBrain: パーキンソン病関連の脳構造セグメンテーションのための新しいパイプライン。 ニューロイメージクリニック。 25、102184。https://doi.org/10.1016/j.nicl.2020.102184 (2020)。

記事 PubMed PubMed Central Google Scholar

Ioffe, S. & Szegedy, C. バッチ正規化: 内部共変量シフトを減らすことでディープ ネットワーク トレーニングを加速します。 https://doi.org/10.48550/ARXIV.1502.03167 (2015)。

ハタミザデ、A.ら。 Swin unetr: MRI 画像における脳腫瘍のセマンティック セグメンテーション用の Swin トランスフォーマー。 BrainLes@MICCAI(2022)にて。

コンソーシアム、M. Monai: AI のための医療オープン ネットワーク。 技術。 代表者https://doi.org/10.5281/zenodo.6903385 (2022)。

シェラー、MJ 他医学におけるフェデレーテッド ラーニング: 患者データを共有せずに多施設のコラボレーションを促進します。 科学。 代表者https://doi.org/10.1038/s41598-020-69250-1 (2020)。

記事 PubMed PubMed Central Google Scholar

Austin, PC、Tu, JV、Ho, JE、Levy, D. & Lee, DS 疾患の分類と予測のためのデータマイニングと機械学習の文献からの方法の使用: 心不全のサブタイプの分類を検討するケーススタディ。 J.クリン. エピデミオール。 66、398–407。 https://doi.org/10.1016/j.jclinepi.2012.11.008 (2013)。

記事 PubMed PubMed Central Google Scholar

Thabtah, F.、Abdelhamid, N.、Peebles, D. ロジスティック回帰分析に基づく機械学習による自閉症分類。 健康情報科学。 システム https://doi.org/10.1007/s13755-019-0073-5 (2019)。

記事 PubMed PubMed Central Google Scholar

Nusinovici, S. et al. ロジスティック回帰は、主要な慢性疾患の予測において機械学習と同様に優れていました。 J.クリン. エピデミオール。 122、56–69。 https://doi.org/10.1016/j.jclinepi.2020.03.002 (2020)。

論文 PubMed Google Scholar

Friedman, JH Greedy 関数近似: 勾配ブースティング マシン。 アン。 統計 29、1189–1232。 https://doi.org/10.1214/aos/1013203451 (2001)。

記事 MathSciNet MATH Google Scholar

オガンリー、A. & ワン、Q.-G. 慢性腎臓病診断用の XGBoost モデル。 IEEE/ACM トランス。 計算します。 バイオル。 バイオインフォーム。 17、2131–2140。 https://doi.org/10.1109/TCBB.2019.2911071 (2020)。

論文 PubMed Google Scholar

リファレンスをダウンロードする

この研究は、韓国政府(MSIT)が資金提供する韓国国立研究財団(NRF)助成金(2021R1F1A106153511)、韓国政府(科学情報通信省、貿易省)が資金提供する韓国医療機器開発基金助成金によって支援されました。 、産業エネルギー省、保健福祉省、食品医薬品安全省) (202011B08-02、KMDF_PR_20200901_0014-2021-02)、産業通商資源部 (MOTIE) の資金による技術革新プログラム (20014111) による、韓国)、およびサムスン医療センターの未来医療 20*30 プロジェクト(SMX1210791)による。 資金提供者は一部の著者に給与という形で支援を提供したが、研究計画、データ収集と分析、出版の決定、原稿の準備には追加の関与はしなかった。 著者の具体的な役割については、対応するセクションで報告されています。

Joomee Song と Juyoung Hahm の著者も同様に貢献しました。

韓国、成均館大学医学部、サムスン医療センター、神経科および神経科学センター

ザ・ベスト・オブ・ジュミ・ソン、ジニョン・ユン、ジン・ファン・チョ、ジョン・ヒョン・アン

韓国、ソウル、サムスン医療センター未来医学研究所医療AI研究センター

ハム・ジュヨン、イ・ジス、リム・チェヨン、チョン・ミョンジン、キム・ギョンス

コロンビア大学生物統計学部

ハム・ジュヨン

米国メリーランド州カレッジパーク、メリーランド大学電気・コンピュータ工学科

イ・ジス

韓国ソウル、成均館大学SAIHST医療機器管理研究部

チェヨン・リム

韓国ソウル、成均館大学医学部サムスン医療センター放射線科

チョン・ミョンジン

韓国ソウル、成均館大学医学部データコンバージェンス・未来医学科

チョン・ミョンジン&キム・ギョンス

米国マサチューセッツ州ボストン、マサチューセッツジェネラルブリガムアンドハーバード医科大学放射線科

キム・ギョンス

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

(1) 研究プロジェクト: A. 構想と設計、B. データの取得、C. データの分析と解釈。 (2) 原稿: A. 初稿の執筆、B. 査読および批評。 (3) その他: A. 統計分析、B. 資金の獲得、C. 技術サポート、D. 研究の監督、E. データ収集の監督。 JS:1A、1B、1C、2A、2B、JH:1C、2A、2B、3A、3C、JL:2B、3A、3C、CYL:3C、MJC:3B、3C、JY:1B、2B、JWC: 1B、2C、3E、JHA: : 1B、1C、2B、3D、3E、KK: 1A、1C、2A、2B、3A、3C、3D。

ジョン・ヒョンアンまたはギョンス・キムへの通信。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

この記事の元のオンライン版は改訂されました。この記事の元のバージョンでは、最初の投稿に含まれていた補足ファイルが補足情報セクションから省略されました。 正しい補足情報ファイルが元の記事に付属するようになりました。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Song, J.、Hahm, J.、Lee, J. 他パーキンソン症候群を診断するための MRI ボリューム測定における AI と非 AI 法の比較検証。 Sci Rep 13、3439 (2023)。 https://doi.org/10.1038/s41598-023-30381-w

引用をダウンロード

受信日: 2022 年 10 月 15 日

受理日: 2023 年 2 月 21 日

公開日: 2023 年 3 月 1 日

DOI: https://doi.org/10.1038/s41598-023-30381-w

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。

共有