Interval cancer, sensitivity, and specificity comparing AI-supported mammography screening with standard double reading without AI in the MASAI study: a randomised, controlled, non-inferiority, single-blinded, population-based, screening-accuracy trial.
Gommers J, Hernström V, Josefsson V, Sartor H, Schmidt D, Hjelmgren A, et al.
Lancet. 2026 Jan 31;407(10527):505-514.
PMID: 41620232 DOI: 10.1016/S0140-6736(25)02464-X
【 MASAI試験(ランダム化比較非劣性単盲検・住民対象の検診精度研究)でのAI支援マンモグラフィ検診群とAI支援無しの標準的二重読影群における中間期癌、感度、特異度の比較 】
< 背景・目的 >
人工知能(AI)が乳癌検出を向上させ、読影の負担を軽減することでマンモグラフィ検診を改善できることを示唆するエビデンスはあるが、中間期癌(2回の検診の間、または前回の検診から2年以内に診断された、検診で検出されなかった乳癌)に対する影響は不明であった。本研究は、AI支援マンモグラフィ検診と、AI支援無しの標準的二重読影における中間期癌発生率を比較することを目的とした。
< 方法 >
このスウェーデンでのランダム化比較非劣性単盲検地域集団ベース検診精度試験において、参加者はAI支援マンモグラフィ検診(介入群)とAI支援無しの標準的二重読影(対照群)に1:1の割合で割り付けられた。
介入群では、AIを使用して放射線科医による「単独読影」または「二重読影」に振り分けるトリアージを行った。
具体的には、商用AI読影支援システム(Transpara v1.7.0)が画像毎に悪性リスクを1〜10のスコアで示し、スコア1〜9の画像は1名、リスクがもっとも高い「スコア10」の画像は2名で読影するというトリアージが行われた。
主要評価項目は中間期癌発生率(非劣性マージン20%)、副次評価項目は年齢・乳房構成・乳癌の種類(非浸潤・浸潤)別の中間期がんの特徴、感度、特異度である。
< 結果 >
2021年4月12日から2022年12月7日の間に、105,934名の女性が介入群または対照群にランダムに割り付けられ、うち19名が解析から除外となった。年齢中央値は介入群で53.8歳、対照群で53.7歳であった。
中間期癌発生率
中間期癌発生率(1000人あたり)は介入群、対照群でそれぞれ1.55(95% CI 1.23–1.92)及び1.76(95% CI 1.42–2.15)であり、比率は0.88(95% CI 0.65–1.18; p=0.41)と非劣性が示された。
記述統計
介入群での中間期癌は、対照群に比べ、浸潤癌、T2以上(長径>20mm)の腫瘍、非Luminal A サブタイプが少ない傾向にあった。(すなわち予後不良の特徴を有する中間期癌が少ないと言える。)
感度
介入群の方が対照群よりも有意に高く(80.5 % vs 73.8%: p=0.031)、この傾向は浸潤癌においては年齢層や乳房構成にかかわらず見られたが、非浸潤癌では見られなかった。
特異度
両群ともに98.5%と有意差は認められなかった(95% CI 98·4-98·6: p=0.88)。
< 結論 >
AI支援マンモグラフィ検診は、標準的な二重読影と比較して、中間期癌発生率における非劣性、予後不良な特性を持つ中間期癌の減少、特異度を同程度に保ちつつ感度の向上を示すなど一貫して良好な結果であった。本試験の先行論文(1,2)においては、偽陽性を増やすことなく癌検出率を29%向上させ、検診読影負担の44%軽減も達成している。AI支援マンモグラフィ検診は標準的な二重読影よりも効率的に検診精度を向上させ、臨床実装を検討し得るものである。