banner
Heim / Blog / Künstliche Intelligenz in der Histopathologie von Eierstockkrebs: eine systematische Überprüfung
Blog

Künstliche Intelligenz in der Histopathologie von Eierstockkrebs: eine systematische Überprüfung

Aug 07, 2023Aug 07, 2023

npj Precision Oncology Band 7, Artikelnummer: 83 (2023) Diesen Artikel zitieren

Details zu den Metriken

Diese Studie bewertet die Qualität veröffentlichter Forschungsergebnisse unter Einsatz künstlicher Intelligenz (KI) zur Diagnose oder Prognose von Eierstockkrebs anhand histopathologischer Daten. Bis zum 19. Mai 2023 wurde eine systematische Suche in PubMed, Scopus, Web of Science, Cochrane CENTRAL und WHO-ICTRP durchgeführt. Einschlusskriterien erforderten, dass KI für prognostische oder diagnostische Schlussfolgerungen in histopathologischen Bildern von menschlichem Eierstockkrebs verwendet wurde. Das Risiko einer Verzerrung wurde mithilfe von PROBAST bewertet. Informationen zu jedem Modell wurden tabellarisch aufgeführt und zusammenfassende Statistiken wurden gemeldet. Die Studie wurde auf PROSPERO (CRD42022334730) registriert und die Berichtsrichtlinien von PRISMA 2020 wurden befolgt. Bei der Suche wurden 1.573 Datensätze identifiziert, von denen 45 für die Aufnahme geeignet waren. Diese Studien umfassten 80 Modelle von Interesse, darunter 37 Diagnosemodelle, 22 Prognosemodelle und 21 weitere diagnostisch relevante Modelle. Zu den allgemeinen Aufgaben gehörten die Vorhersage des Behandlungsansprechens (11/80), die Klassifizierung des Malignitätsstatus (10/80), die Quantifizierung der Färbung (9/80) und die histologische Subtypisierung (7/80). Die Modelle wurden unter Verwendung von 1–1375 histopathologischen Objektträgern von 1–776 Patientinnen mit Eierstockkrebs entwickelt. In allen Studien wurde ein hohes oder unklares Risiko einer Verzerrung festgestellt, was am häufigsten auf begrenzte Analysen und unvollständige Berichterstattung zur Teilnehmerrekrutierung zurückzuführen war. Zur Anwendung von KI auf histopathologische Bilder für diagnostische oder prognostische Zwecke bei Eierstockkrebs wurden nur begrenzte Forschungsarbeiten durchgeführt, und es wurde nachgewiesen, dass keines der Modelle für die praktische Umsetzung geeignet ist. Zu den Schlüsselaspekten zur Beschleunigung der klinischen Umsetzung gehören die transparente und umfassende Berichterstattung über Datenherkunft und Modellierungsansätze sowie eine verbesserte quantitative Bewertung mithilfe von Kreuzvalidierung und externen Validierungen. Diese Arbeit wurde vom Engineering and Physical Sciences Research Council finanziert.

Eierstockkrebs ist die achthäufigste bösartige Erkrankung bei Frauen weltweit1. Es ist bekanntermaßen schwierig zu erkennen und zu diagnostizieren, da die Vorsorgeuntersuchungen ineffektiv sind2 und unspezifische Symptome auftreten, die denen der Menopause ähneln3. Die Krankheit umfasst primäre bösartige Tumoren der Eierstöcke, Eileiter und des Peritoneums und breitet sich zum Zeitpunkt der Diagnose häufig bereits im Bauchraum aus (FIGO4 Stadium 3). Dieses typische späte Diagnosestadium macht Eierstockkrebs zu einer besonders tödlichen Krankheit: Die 314.000 neuen Fälle, die jedes Jahr diagnostiziert werden, bedeuten weltweit 207.000 Todesfälle pro Jahr1.

Bei den meisten Eierstockkrebsarten handelt es sich um Karzinome (Krebserkrankungen epithelialen Ursprungs), die überwiegend in fünf histologische Subtypen unterteilt werden können: hochgradig serös, niedriggradig serös, klarzellig, endometrioid und schleimig. Nicht-epithelialer Eierstockkrebs kommt viel seltener vor und umfasst Keimzell-, Geschlechtsstrang-Stroma- und mesenchymale Tumoren. Die Subtypen des Eierstockkrebses unterscheiden sich morphologisch und prognostisch und bieten unterschiedliche Behandlungsmöglichkeiten5. Hochgradiges seröses Karzinom ist die häufigste Form von Eierstockkrebs und macht etwa 70 % aller Fälle aus6.

Die Histopathologie, die Untersuchung von Gewebeproben auf zellulärer Ebene, ist der Goldstandard für die Diagnose von Eierstockkrebs. Pathologen interpretieren in der Regel mit Hämatoxylin und Eosin (H&E) gefärbtes Gewebe, obwohl die Interpretation ein subjektiver, zeitaufwändiger Prozess sein kann und einige Aufgaben ein hohes Maß an Abweichungen zwischen den Beobachtern aufweisen7,8,9. Bei der Beurteilung schwieriger Fälle können allgemeine Pathologen Unterstützung von Experten für gynäkologische Pathologie in Anspruch nehmen und/oder ergänzende Tests wie die Immunhistochemie (IHC) verwenden. Überweisungen und Zusatztests können für die Genauigkeit des Diagnoseprozesses von entscheidender Bedeutung sein, führen jedoch zu längeren und teureren Ergebnissen. Weltweit ist die Nachfrage nach Pathologen weitaus größer als das Angebot, wobei die Zahl der Pathologen in den einzelnen Ländern erheblich variiert10 und Länder mit einer besseren Versorgung immer noch nicht in der Lage sind, die Nachfrage zu decken11.

Traditionell haben Pathologen Glasobjektträger mit einem Lichtmikroskop analysiert. Allerdings wird immer häufiger ein digitaler Arbeitsablauf implementiert, bei dem Pathologen gescannte Bilder ganzer Objektträger (WSIs) mithilfe eines Computers überprüfen. Während die Einführung der digitalen Pathologie wahrscheinlich durch Effizienzvorteile vorangetrieben wurde12, hat sie eine Chance für die Entwicklung automatisierter Tools zur Unterstützung von Pathologen geschaffen. Diese Tools zielen häufig darauf ab, die Genauigkeit, Effizienz, Objektivität und Konsistenz der Diagnose zu verbessern. Solche Tools könnten dazu beitragen, den weltweiten Fachkräftemangel an Pathologen zu lindern, den Diagnosedurchsatz zu erhöhen und die Nachfrage nach Überweisungen und Zusatztests zu verringern. Dies ist ein zunehmend aktives Forschungsgebiet13 und bei einigen bösartigen Erkrankungen beginnen diese Systeme, klinischen Nutzen zu erzielen14.

In dieser Studie haben wir systematisch die gesamte Literatur überprüft, in der Techniken der künstlichen Intelligenz (KI) (die sowohl traditionelle Methoden des maschinellen Lernens (ML) als auch Deep-Learning-Methoden umfassen) auf digitale Pathologiebilder zur Diagnose oder Prognose von Eierstockkrebs angewendet wurden. Dazu gehörten Forschungsarbeiten, die sich auf einen einzelnen diagnostischen Faktor wie den histologischen Subtyp konzentrierten, und Studien, die computergestützte Diagnoseaufgaben wie die Tumorsegmentierung durchführten. Die Übersicht charakterisiert den Stand des Fachgebiets, beschreibt, welche diagnostischen und prognostischen Aufgaben angegangen wurden, und bewertet Faktoren, die für den klinischen Nutzen dieser Methoden relevant sind, wie etwa das Risiko einer Verzerrung. Obwohl Eierstockkrebs eine besonders schwer zu erkennende und zu diagnostizierende Krankheit ist und es an verfügbaren Pathologen mangelt, wurden KI-Modelle für diese Krankheit noch nicht in die klinische Praxis implementiert. Ziel dieser Überprüfung ist es, Erkenntnisse und Empfehlungen auf der Grundlage veröffentlichter Literatur bereitzustellen, um den klinischen Nutzen zukünftiger Forschung zu verbessern, einschließlich der Verringerung des Risikos von Verzerrungen, der Verbesserung der Reproduzierbarkeit und der Erhöhung der Generalisierbarkeit.

Wie in Abb. 1 dargestellt, ergaben die Literaturrecherchen insgesamt 1573 Datensätze, von denen 557 Duplikate waren. Neunhundertdreißig Datensätze wurden bei der Durchsicht von Titeln und Abstracts ausgeschlossen, und 41 wurden aufgrund der vollständigen Durchsicht der Papiere ausgeschlossen, darunter drei Datensätze, für die keine vollständigen Artikel erhältlich waren. Die restlichen 45 Studien wurden in die Überprüfung einbezogen, davon 11 Konferenzbeiträge und 34 Zeitschriftenbeiträge. Alle akzeptierten Studien wurden ursprünglich durch Suchen in Forschungsdatenbanken identifiziert, wobei keine Datensätze aus Studienregistern die Einschlusskriterien erfüllten. Während die Suchanfragen bereits Literatur aus dem Jahr 1949 ergaben, wurden alle Forschungsarbeiten, die die Einschlusskriterien erfüllten, seit 2010 veröffentlicht, wobei über 70 % der einbezogenen Literatur seit 2020 veröffentlicht wurden. Die Studienmerkmale sind in Tabelle 1 aufgeführt. Die 45 akzeptierten Artikel enthalten 80 interessante Modelle, Einzelheiten dazu sind in Tabelle 2 aufgeführt.

PRISMA 2020-Flussdiagramm des Studienidentifizierungs- und Auswahlprozesses für die systematische Überprüfung. Die Aufzeichnungen wurden nur nach Titeln und Abstracts gesichtet, und die Berichte wurden anhand des Volltextinhalts bewertet. ZENTRALES Zentralregister kontrollierter Studien. WHO-ICTRP Internationale Plattform zur Registrierung klinischer Studien der Weltgesundheitsorganisation.

Die Ergebnisse der PROBAST-Bewertungen sind in Tabelle 3 aufgeführt. Während einige Studien mehrere Modelle von Interesse enthielten, enthielt keines davon Modelle mit unterschiedlichen Risiko-Verzerrungs-Scores für einen Abschnitt der PROBAST-Bewertung, sodass pro Artikel eine Risiko-Verzerrungs-Analyse dargestellt wird . Alle Modelle zeigten entweder ein hohes Gesamtrisiko für Verzerrungen (37/45) oder ein unklares Gesamtrisiko für Verzerrungen (8/45). Jedes Hochrisikomodell hatte im Analyseabschnitt einen Hochrisikowert (37/45), wobei einige auch ein hohes Risiko für Teilnehmer (6/45), Prädiktoren (11/45) oder Ergebnisse (13/45) aufwiesen. . Weniger als die Hälfte der Studien erreichte in allen Bereichen ein geringes Verzerrungsrisiko (21/45), wobei die niedrigsten Risiken in den Abschnitten „Ergebnisse“ (16/45) und „Prädiktoren“ (9/45) zu finden waren. Fast alle Arbeiten wiesen in mindestens einem Bereich ein unklares Risiko einer Verzerrung auf, am häufigsten in den Bereichen Teilnehmer (36/45) und Prädiktoren (25/45). Qualitative Zusammenfassungen sind in Abb. 2 dargestellt.

Die PROBAST-Ergebnisse zum Risiko von Verzerrungen wurden für die 45 in dieser Rezension enthaltenen Arbeiten zusammengefasst.

Die Anzahl der Teilnehmer an internen Datensätzen variierte je nach Größenordnung, wobei jede Studie 1–776 Patientinnen mit Eierstockkrebs umfasste und eine Studie insgesamt über 10.000 Patientinnen mit einem Spektrum von 32 bösartigen Erkrankungen umfasste15. Die meisten Untersuchungen verwendeten nur Daten zu den fünf häufigsten Subtypen des Eierstockkarzinoms, obwohl eine aktuelle Studie auch die Verwendung von Tumoren des Geschlechtsstrangstromas umfasste16. Nur eine Studie umfasste explizit eine prospektive Datenerhebung, und zwar nur für eine kleine Teilmenge, die nicht für die externe Validierung verwendet wurde17.

Wie in Abb. 3 dargestellt, war die Anzahl der verwendeten pathologischen Objektträger oft viel größer als die Anzahl der eingeschlossenen Patienten, wobei in drei Studien über 1000 Objektträger von Eierstockkrebspatientinnen verwendet wurden18,19,20. In den meisten Studien handelte es sich bei den Modellentwicklungsproben um WSIs, die reseziertes oder biopsiertes Gewebe enthielten (34/45), bei anderen handelte es sich um einzelne TMA-Kernbilder (Tissue Microarray) (5/45) oder vorgeschnittene digitale Pathologiebilder (3/45). . Die meisten Studien verwendeten H&E-gefärbtes Gewebe (33/45) und andere verwendeten verschiedene IHC-Färbungen (11/45), wobei keine zwei Veröffentlichungen über die Verwendung derselben IHC-Färbungen berichteten. Einige Studien umfassten multimodale Ansätze, bei denen Genomik-17,21,22,23,24, Proteomik21,24, Transkriptomik24 und Radiomics17-Daten neben histopathologischen Daten verwendet wurden.

Histogramme, die die Anzahl der Patientinnen mit Eierstockkrebs zeigen, und b Histopathologie-Objektträger mit Eierstockkrebs, die bei der Modellentwicklung verwendet wurden. Viele dieser Werte sind aufgrund unvollständiger Berichterstattung unsicher, wie in Tabelle 2 dargestellt.

Die am häufigsten verwendete Datenquelle war der Cancer Genome Atlas (TCGA) (18/45), ein Projekt, aus dem über 30.000 digitale Pathologiebilder von 33 bösartigen Erkrankungen öffentlich verfügbar sind. Die Eierstockkrebs-Untergruppe, TCGA-OV25, enthält 1481 WSIs aus 590 Fällen von serösem Eierstockkarzinom (meistens, aber nicht ausschließlich hochgradig), mit entsprechenden genomischen, transkriptomischen und klinischen Daten. Dazu gehören Objektträger aus acht Rechenzentren in den Vereinigten Staaten, wobei die meisten Objektträger gefrorene Gewebeschnitte (1374/1481) anstelle von formalinfixierten, in Paraffin eingebetteten (FFPE) Schnitten enthalten. Weitere wiederkehrende Datenquellen waren das Repository des University of British Columbia Ovarian Cancer Research Program (OVCARE)26,27,28, die Transcanadian-Studie29,30 und klinische Aufzeichnungen der Mayo Clinic31,32, des Tri-Service General Hospital33,34,35 und Memorial Sloan Kettering Cancer Center17,36. Alle anderen Forscher verwendeten entweder eine eindeutige Datenquelle (12/45) oder gaben die Herkunft ihrer Daten nicht an (8/45). TCGA-OV, OVCARE und die Transcanadian-Studie sind allesamt multizentrische Datensätze. Abgesehen davon berichteten nur wenige Studien über die Verwendung multizentrischer Daten17,24,28,37,38,39. Nur zwei Studien berichteten über die Verwendung mehrerer Diascanner, wobei jedes Dia auf einem von zwei verfügbaren Scannern gescannt wurde27,28. Zu den Ländern, aus denen die Daten stammten, gehörten Kanada, China, Finnland, Frankreich, Deutschland, Italien, Japan, die Niederlande, Südkorea, Taiwan, das Vereinigte Königreich und die Vereinigten Staaten von Amerika.

In den 45 enthaltenen Artikeln gab es insgesamt 80 interessante Modelle, wobei jeder Artikel 1–6 solcher Modelle enthielt. Es gab 37 Diagnosemodelle, 22 Prognosemodelle und 21 weitere Modelle, die diagnostisch relevante Informationen vorhersagten. Zu den Ergebnissen des Diagnosemodells gehörten die Klassifizierung des Malignitätsstatus (10/37), des histologischen Subtyps (7/37), des primären Krebstyps (5/37), des genetischen Mutationsstatus (4/37) und des Grads der Tumor-Stroma-Reaktion (3/37). ), Grad (2/37), transkriptomischer Subtyp (2/37), Stadium (1/37), Status der Mikrosatelliteninstabilität (1/37), Status des epithelial-mesenchymalen Übergangs (1/37) und Status des homologen Rekombinationsmangels ( 1/37). Zu den prognostischen Modellen gehörten die Vorhersage des Behandlungsansprechens (11/23), des Gesamtüberlebens (6/23), des progressionsfreien Überlebens (3/23) und des Wiederauftretens (2/23). Die anderen Modelle führten Aufgaben aus, die Pathologen bei der Analyse pathologischer Bilder unterstützen könnten, einschließlich der Messung der Menge/Intensität der Färbung, der Erstellung von Segmentierungsmasken und der Klassifizierung von Gewebe-/Zelltypen.

Es wurden verschiedene Modelle verwendet, wobei die häufigsten Typen Convolutional Neural Network (CNN) (41/80), Support Vector Machine (SVM) (10/80) und Random Forest (6/80) waren. Zu den CNN-Architekturen gehörten GoogLeNet40, VGG1619,32, VGG1926,28, InceptionV333,34,35,38, ResNet1817,27,28,39,41,42, ResNet3443, ResNet5016,44,45, ResNet18236 und MaskRCNN32. Neuartige CNNs verwendeten typischerweise mehrere standardisierte Blöcke mit Faltungs-, Normalisierungs-, Aktivierungs- und/oder Pooling-Schichten22,46,47, wobei zwei Studien auch Aufmerksamkeitsmodule umfassten20,35. Eine Studie generierte ihre neuartige Architektur mithilfe eines Topologieoptimierungsansatzes auf einem Standard-VGG1623.

Die meisten Forscher teilen ihre Originalbilder in Patches auf, die separat verarbeitet werden sollen, wobei die Patchgrößen zwischen 60×60 und 2048×2048 Pixel liegen, wobei die häufigsten 512×512 Pixel (19/56) und 256×256 Pixel (12/56) sind. . Es wurde eine Reihe von Techniken zur Merkmalsextraktion eingesetzt, darunter sowohl handgefertigte/vordefinierte Merkmale (23/80) als auch Merkmale, die automatisch vom Modell gelernt wurden (51/80). Zu den handgefertigten Merkmalen gehörte eine Fülle von strukturellen, chromatischen sowie zellulären und nuklearen morphologischen Merkmalen. Handgefertigte Features wurden häufig als Eingaben für klassische ML-Methoden wie SVM und Random-Forest-Modelle verwendet. Gelernte Merkmale wurden typischerweise mithilfe eines CNN extrahiert, das häufig auch zur Klassifizierung verwendet wurde.

Trotz der häufigen Verwendung von Patches machten die meisten Modelle Vorhersagen auf WSI-Ebene (29/80), TMA-Kernebene (18/80) oder Patientenebene (6/80), was eine Aggregation von Informationen auf Patch-Ebene erforderte. Es wurden zwei unterschiedliche Aggregationsansätze verwendet: einer für die Aggregation vor der Modellierung und einer für die Aggregation nach der Modellierung. Der erstere Ansatz erfordert die Generierung von Features auf Folienebene vor der Modellierung, der letztere erfordert die Aggregation von Modellausgaben auf Patch-Ebene, um Vorhersagen auf Folienebene zu treffen. Merkmale auf Folienebene wurden mithilfe von Summierung16, Mittelung21,24,36, aufmerksamkeitsbasierter gewichteter Mittelung20,41,42,44,45, Verkettung15,30 sowie komplexeren Einbettungsansätzen unter Verwendung von Fisher-Vektorkodierung29 und k-means-Clustering48 generiert. Die Modellausgaben auf Patch-Ebene wurden aggregiert, um Vorhersagen auf Folienebene zu generieren, indem das Maximum22,35, der Median43 oder der Durchschnitt23 ermittelt, Abstimmungsstrategien27,34 oder ein zufälliger Gesamtstrukturklassifizierer28 verwendet wurden. Bei diesen Ansätzen handelt es sich allesamt um Beispiele für Multiple-Instance-Learning (MIL), obwohl nur wenige Modelle von Interesse mit dieser Terminologie gemeldet wurden22,41,42,44.

Die meisten Studien umfassten zu irgendeinem Zeitpunkt eine Segmentierung, wobei viele davon die Tumor-/Färbungssegmentierung als Modellergebnis analysierten32,36,37,47,49,50,51,52,53,54. Einige andere Studien nutzten die Segmentierung, um Regionen zu bestimmen, die für die weitere Modellierung von Interesse sind, indem sie entweder einfach Gewebe vom Hintergrund trennten15,18,44,45 oder Tumorsegmentierung nutzten, um die relevantesten Geweberegionen auszuwählen33,34,35,55,56. Eine Studie nutzte auch die Segmentierung, um einzelne Zellen für die Klassifizierung zu erkennen57. Einige Studien nutzten die Segmentierung auch zur Bestimmung handgefertigter Merkmale in Bezug auf die Menge und Morphologie verschiedener Gewebe, Zellen und Kerne17,18,21,24,30,31.

Während aufmerksamkeitsbasierte Ansätze bereits seit mehreren Jahren auf andere bösartige Erkrankungen angewendet werden58,59, wurden sie nur in den jüngsten Studien zu Eierstockkrebs20,28,33,34,35,41,42,44,45 und in keiner der Methoden beobachtet beinhaltete Selbstaufmerksamkeit, eine immer beliebter werdende Methode bei anderen bösartigen Erkrankungen60. Die meisten Modelle waren deterministisch, obwohl auch versteckte Markov-Bäume51, probabilistische Boosting-Bäume52 und Gaußsche Mischungsmodelle61 verwendet wurden. Abgesehen von der üblichen Verwendung von Bildern mit niedriger Auflösung zum Erkennen und Entfernen von Nicht-Gewebebereichen wurden Bilder typischerweise mit einer einzigen Auflösung analysiert, wobei nur sechs Arbeiten Mehrfachvergrößerungstechniken in ihren interessierenden Modellen enthielten. Vier dieser kombinierten Merkmale mit unterschiedlichen Auflösungen für die Modellierung29,30,36,48 und die anderen beiden verwendeten unterschiedliche Vergrößerungen für die Auswahl informativer Gewebebereiche und für die Modellierung33,34. Von den Papieren, für die es bestimmt werden konnte, waren die häufigsten Modellierungsvergrößerungen x20 (35/41) und x40 (7/41). Nur wenige Modelle integrierten histopathologische Daten mit anderen Modalitäten (6/80). Zu den multimodalen Ansätzen gehörten die Verkettung separat extrahierter unimodaler Merkmale vor der Modellierung21,23,24, die Zusammenführung unimodaler Vorhersagen aus separaten Modellen17 und ein Lehrer-Schüler-Ansatz, bei dem beim Modelltraining mehrere Modalitäten, aber nur histopathologische Daten verwendet wurden wurde zur Vorhersage verwendet22.

Die Analysen waren begrenzt, wobei weniger als die Hälfte der Modellergebnisse mit Kreuzvalidierung bewertet wurden (39/80) und nur sehr wenige extern anhand unabhängiger Eierstockkrebsdaten validiert wurden (7/80), trotz kleiner interner Kohortengrößen. Zu den Kreuzvalidierungsmethoden gehörten k-Faltung (22/39) mit 3–10 Falten, Monte Carlo (12/39) mit 3–15 Wiederholungen und Kreuzvalidierungen unter Auslassen eines Patienten (5/39). Einige andere Arbeiten beinhalteten eine Kreuzvalidierung des Trainingssatzes zur Auswahl von Hyperparametern, verwendeten jedoch nur einen kleinen, noch nicht sichtbaren Testsatz aus derselben Datenquelle zur Auswertung. Extern validierte Modelle wurden alle mit WSIs trainiert, wobei die Validierungen entweder auf TMA-Kernen (2/7) oder WSIs aus unabhängigen Datenquellen (5/7) durchgeführt wurden, wobei zwei davon explizit unterschiedliche Scanner zur Digitalisierung interner und externer Daten verwendeten27,28. Einige der beschriebenen Methoden wurden extern anhand von Daten zu nicht-ovariellen Malignomen validiert, aber keine davon enthielt Daten zu Eierstockkrebs in irgendeiner Form und wurde daher nicht in die Überprüfung einbezogen. Es gab jedoch eine Methode, die nur mit gastrointestinalen Tumordaten trainierte und extern mit Eierstocktumordaten validierte16.

Die meisten Klassifizierungsmodelle wurden anhand von Genauigkeit, ausgewogener Genauigkeit und/oder Fläche unter der Receiver Operating Characteristic Curve (AUC) bewertet, mit einer Ausnahme, bei der nur ein p-Wert angegeben wurde, der den Zusammenhang zwischen histologischen Merkmalen und transkriptomischen Subtypen basierend auf einem Kruskal– Wallis-Test19. Einige Modelle wurden auch anhand des F1-Scores bewertet, den wir jedoch nicht tabelliert haben (in Abb. 3), da die anderen Metriken konsistenter angegeben wurden. Die Leistung des Überlebensmodells wurde typischerweise mithilfe der AUC angegeben, zusammen mit anderen Metriken wie p-Wert, Genauigkeit, Hazard Ratios und C-Index, der der AUC ähnelt, aber eine Zensur erklären kann. Die Segmentierungsmodelle wurden fast alle unterschiedlich bewertet, wobei verschiedene Studien über AUC, Genauigkeit, Würfelkoeffizient, Schnittmenge über Vereinigung, Sensitivität, Spezifität und qualitative Bewertungen berichteten. Alle Regressionsmodelle wurden mithilfe des Bestimmtheitsmaßes (R2-Statistik) bewertet. Bei einigen Modellen wurde die Leistung pro Patient39,61, pro Subtyp16 oder pro Klasse15,24,32,57 aufgeschlüsselt, ohne dass eine aggregierte, ganzheitliche Messung der Modellleistung erfolgte.

Über die Variabilität der Modellleistung wurde nicht häufig berichtet (33/94), und wenn sie gemeldet wurde, war sie oft unvollständig. Dazu gehörten Fälle, in denen unklar war, was die Intervalle darstellten (95 %-Konfidenzintervall, eine Standardabweichung, Variation usw.) oder die genauen Grenzen des Intervalls nicht klar waren, da die Ergebnisse zwar aufgezeichnet, aber nicht explizit angegeben wurden. Innerhalb der gesamten Überprüfung gab es nur drei Beispiele, bei denen während der externen Validierung Variabilität gemeldet wurde27,38,39, von denen nur eines eindeutig sowohl die Grenzen als auch den Typ des Intervalls angab38. In keiner der Studien wurde eine bayesianische Form der Unsicherheitsquantifizierung durchgeführt. Die gemeldeten Ergebnisse sind in Tabelle 2 aufgeführt. Direkte Vergleiche zwischen der Leistung verschiedener Modelle sollten jedoch aufgrund der Vielfalt der Daten und Validierungsmethoden, die zur Bewertung verschiedener Modelle verwendet werden, des Fehlens von Variabilitätsmaßen und des durchweg hohen Risikos einer Verzerrung mit Vorsicht betrachtet werden. und die Heterogenität der gemeldeten Kennzahlen.

Es wurde festgestellt, dass bei der überwiegenden Mehrheit der veröffentlichten Forschungsergebnisse zu KI für diagnostische oder prognostische Zwecke in der Histopathologie von Eierstockkrebs aufgrund von Problemen in den durchgeführten Analysen ein hohes Risiko für Verzerrungen besteht. Die Forscher nutzten häufig eine begrenzte Datenmenge und führten Analysen an einer einzelnen Zugtest-Datenaufteilung durch, ohne Methoden zur Berücksichtigung von Überanpassung und Modelloptimismus (Kreuzvalidierung, Bootstrapping, externe Validierung) zu verwenden. Diese Einschränkungen treten häufig in der gynäkologischen KI-Forschung unter Verwendung anderer Datentypen auf. Jüngste Überprüfungen deuten auf einen geringen klinischen Nutzen hin, der durch überwiegend retrospektive Studien mit begrenzten Daten62,63 und begrenzten Methoden mit schwacher Validierung verursacht wird, wodurch die Gefahr besteht, dass die Modellleistung überschätzt wird64,65.

Zu den robusteren Analysen gehörte eine Studie, in der mehrere relevante Metriken mithilfe von 10 Wiederholungen der Monte-Carlo-Kreuzvalidierung an einem Satz von 406 WSIs bewertet wurden, wobei für jede Metrik Standardabweichungen angegeben wurden26. Weitere positive Beispiele waren die Verwendung sowohl interner Kreuzvalidierung als auch externer Validierung für dasselbe Ergebnis, was eine strengere Analyse ermöglichte28,34,39. Obwohl externe Validierungen selten waren, boten die durchgeführten Validierungen einen echten Einblick in die Generalisierbarkeit des Modells, mit einer deutlichen Leistungseinbuße bei allen externen Validierungssätzen außer einem28. Die einzige Studie, die eine hohe Generalisierbarkeit zeigte, umfasste den größten Trainingssatz aller extern validierten Ansätze, umfasste eine umfassendere Datenkennzeichnung als viele ähnliche Studien und implementierte eine Kombination aus drei Farbnormalisierungsansätzen, was darauf hindeutet, dass diese Faktoren die Generalisierbarkeit verbessern könnten.

Studien wiesen aufgrund unvollständiger Berichterstattung häufig ein unklares Risiko einer Verzerrung innerhalb der Teilnehmer- und Prädiktorenbereiche von PROBAST auf. Zu den häufig fehlenden Informationen gehörten, wo die Patienten rekrutiert wurden, wie viele Patienten eingeschlossen waren, wie viele Proben/Bilder verwendet wurden, ob Patienten/Bilder ausgeschlossen wurden und mit welchen Methoden das Gewebe verarbeitet und digitalisiert wurde. Die Berichterstattung über Open-Access-Datensätze war oft mangelhaft. Es wurde festgestellt, dass nur bei drei Arbeiten ein geringes Risiko einer Verzerrung für die Teilnehmer bestand. Diese enthielten klare und vernünftige Patientenrekrutierungsstrategien und Auswahlkriterien, die als positive Beispiele für andere Forscher angesehen werden können37,43,56. Informationen zu den Prädiktoren (Histopathologiebilder und daraus abgeleitete Merkmale) wurden im Allgemeinen besser berichtet, es fehlten jedoch häufig wichtige Details, was bedeutete, dass unklar war, ob alle Gewebeproben auf ähnliche Weise verarbeitet wurden, um das Risiko einer Verzerrung aufgrund visueller Heterogenität zu vermeiden. Es wurde festgestellt, dass bei der Angabe von Patientenmerkmalen häufig ein hohes Risiko für Verzerrungen bestand. Viele Studien umfassten sehr kleine Mengen von Patienten mit spezifischen Unterschieden zur Mehrheit (z. B. weniger als 20 Patienten mit einem anderen Krebssubtyp als die Mehrheit), was das Risiko falscher Korrelationen und Ergebnisse birgt, die nicht auf die breitere Bevölkerung übertragbar sind.

In Studien, in denen offen zugängliche Daten verwendet wurden, war die Berichterstattung besonders spärlich, was möglicherweise darauf hindeutet, dass sich Forscher mit KI-Schwerpunkt nicht genügend Zeit nahmen, um diese Datensätze zu verstehen und sicherzustellen, dass ihre Forschung klinisch relevant war. Beispielsweise haben viele der Forscher, die TCGA-Daten verwendeten, gefrorene Gewebeschnitte einbezogen, ohne zu kommentieren, ob dies angemessen war, obwohl Pathologen sie nicht für die optimale diagnostische Qualität halten. In einem Artikel wurden TCGA-Daten angemessener behandelt, mit einer klaren Erläuterung der positiven und negativen Aspekte des Datensatzes und völlig getrennten Modellen für FFPE- und gefrorene Gewebeschnitte15.

Die gemeinsame Nutzung von Code kann dazu beitragen, die Auswirkungen unvollständiger Berichterstattung abzumildern und die Reproduzierbarkeit drastisch zu verbessern, aber nur 19 der 45 Artikel haben dies getan, wobei einige davon unvollständig oder unzugänglich zu sein scheinen. Die besseren Code-Repositorys enthielten eine detaillierte Dokumentation zur Unterstützung der Reproduzierbarkeit, einschließlich Informationen zur Umgebungseinrichtung16,19, Übersichten über die enthaltenen Funktionen17,36,42 und Codebeispiele, die zur Generierung gemeldeter Ergebnisse verwendet wurden57.

Es wurde festgestellt, dass bei zwei Arbeiten große Diskrepanzen zwischen den gemeldeten Daten und dem Studiendesign auftraten, was auf ein viel größeres Risiko einer Verzerrung hinweist als bei anderen Untersuchungen46,54. In einem Artikel46 wurde berichtet, dass TCGA-OV-Daten für die Subtypisierung mit 5 Klassen verwendet wurden, obwohl dieser Datensatz nur hochgradige seröse und niedriggradige seröse Karzinome umfasste. In der anderen Arbeit54 wurde berichtet, dass TCGA-OV-Daten für die Klassifizierung auf Objektträgerebene in Eierstockkrebs- und Nicht-Eierstockkrebs-Klassen unter Verwendung von PAS-gefärbtem Gewebe verwendet wurden, obwohl TCGA-OV nur H&E-gefärbte Eierstockkrebs-Objektträger enthielt.

Während das Überprüfungsprotokoll darauf ausgelegt war, Vorurteile zu reduzieren und die Menge der einbezogenen relevanten Forschungsergebnisse zu maximieren, gab es einige Einschränkungen. Diese Rezension beschränkt sich auf veröffentlichte Literatur in englischer Sprache. KI-Forschung kann jedoch in anderen Sprachen veröffentlicht oder als Vorabdruck ohne Veröffentlichung in peer-reviewten Fachzeitschriften verfügbar gemacht werden, wodurch diese Rezension unvollständig ist. Während der Großteil des Überprüfungsprozesses von mehreren unabhängigen Forschern durchgeführt wurde, wurde die Duplikaterkennung nur von einem einzigen Forscher durchgeführt, was die Möglichkeit von Fehlern in diesem Schritt des Überprüfungsprozesses erhöht, die zu falschen Ausschlüssen führen. Aufgrund der erheblichen Zeitspanne zwischen der ersten und der endgültigen Literaturrecherche (ca. 12 Monate) kam es möglicherweise zu Inkonsistenzen bei den Interpretationen, sowohl bei der Datenextraktion als auch bei der Bewertung des Risikos von Verzerrungen. Schließlich konzentrierte sich diese Übersicht nur auf lichtmikroskopische Bilder menschlicher histopathologischer Proben im Zusammenhang mit Eierstockkrebs und hat daher möglicherweise nützliche Literatur außerhalb dieses Bereichs übersehen.

Der Bereich der KI in der histopathologischen Diagnose von Eierstockkrebs wächst rasant. Seit Anfang 2020 wurden mehr Forschungsergebnisse veröffentlicht als in allen Jahren zuvor zusammen. Die früheste Forschung, die zwischen 2010 und 2013 veröffentlicht wurde, nutzte handgefertigte Funktionen, um klassische ML-Methoden wie SVMs zu trainieren. Diese Modelle wurden zur Segmentierung49,50,51,53, zur Malignitätsklassifizierung18,52, zur Einstufung21 und zur Vorhersage des Gesamtüberlebens21 verwendet. Die meisten dieser frühen Studien konzentrierten sich auf IHC-gefärbtes Gewebe (5/7), das in späteren Forschungsarbeiten weitaus seltener verwendet wurde (6/38).

Das Fachgebiet war in den folgenden Jahren relativ ruhig, da zwischen 2014 und 2019 nur sechs Artikel veröffentlicht wurden, von denen die Hälfte denselben Hauptautor hatte29,30,48. Diese Modelle verwendeten immer noch traditionelle ML-Klassifikatoren, obwohl einige erlernte Funktionen anstelle der traditionellen handgefertigten Funktionen verwendeten. Die entwickelten Modelle wurden für die histologische Subtypisierung29,30,48 und die Zell-/Gewebeklassifizierung40,57,66 verwendet.

Seit 2020 wurde ein viel größeres Volumen an Forschungsergebnissen veröffentlicht, von denen sich die meisten mit der Verwendung tiefer neuronaler Netze zur automatischen Merkmalsextraktion und -klassifizierung befassten, während eine Minderheit traditionelle Modelle des maschinellen Lernens nutzte17,24,31,61,67. Neuere Forschungen haben ein breiteres Spektrum diagnostischer Ergebnisse untersucht, einschließlich der Klassifizierung des primären Krebstyps15,54, des Mutationsstatus24,36,44, des Status des homologen Rekombinationsmangels42, des Ausmaßes der Tumor-Stroma-Reaktion32, der transkriptomischen Subtypen19,24, der Mikrosatelliteninstabilität24 und der Epithel- mesenchymaler Übergangsstatus41. In der neueren Literatur wurden auch drei weitere prognostische Ergebnisse vorhergesagt: progressionsfreies Überleben17,43,56, Rückfall43,44 und Ansprechen auf die Behandlung19,22,33,34,35.

Trotz der Fortschritte bei einigen spezifischen Ergebnissen gab es keinen offensichtlichen Gesamttrend bei der Größe der verwendeten Datensätze im Laufe der Zeit, weder im Hinblick auf die Anzahl der Folien noch auf die Anzahl der Teilnehmer. Ebenso gab es keine Belege dafür, dass die neuere Forschung strengere interne Validierungen beinhaltete, obwohl die Häufigkeit externer Validierungen zugenommen hat – keine Forschung vor 2021 beinhaltete eine externe Validierung mit Daten zu Eierstockkrebs, aber sieben kürzlich veröffentlichte Studien taten dies16,24,27,28 ,34,38,39. Während diese externen Validierungen in der Regel auf kleine Datenmengen beschränkt waren, zeigt die Einbeziehung externer Validierungen einen Fortschritt gegenüber früheren Forschungen. Solche Validierungen sind für den klinischen Nutzen dieser Modelle von wesentlicher Bedeutung, da die Implementierung in der realen Welt Robustheit gegenüber verschiedenen Quellen visueller Heterogenität erfordert, wobei Variationen zwischen verschiedenen Rechenzentren und innerhalb von Rechenzentren im Laufe der Zeit auftreten. Da dieses Feld weiter ausgereift ist, hoffen wir, dass weitere Studien gründliche Validierungen mit größeren, qualitativ hochwertigen unabhängigen Datensätzen durchführen werden, einschließlich klar dokumentierter Protokolle für die Patientenrekrutierung und -auswahl, die Erstellung pathologischer Objektträger und die Digitalisierung. Dies wird dazu beitragen, die Verzerrungen, die eingeschränkte Reproduzierbarkeit und die eingeschränkte Generalisierbarkeit zu reduzieren, die in den meisten bestehenden Forschungsarbeiten in diesem Bereich festgestellt wurden.

Ein großer Teil der veröffentlichten Arbeiten lieferte nicht genügend klinische und pathologische Informationen, um das Risiko einer Verzerrung einzuschätzen. Es ist wichtig, dass KI-Forscher die Datenherkunft gründlich melden, um das Ausmaß der Heterogenität im Datensatz zu verstehen und zu verstehen, ob dies im Studiendesign angemessen berücksichtigt wurde. Modellierungs- und Analysemethoden müssen ebenfalls ausführlich berichtet werden, um die Zuverlässigkeit und Reproduzierbarkeit zu verbessern. Für Forscher kann es hilfreich sein, auf Checklisten für die Berichterstattung zurückzugreifen, wie z. B. die transparente Berichterstattung über ein multivariables Vorhersagemodell für die individuelle Prognose oder Diagnose (TRIPOD)68, um sicherzustellen, dass sie alle relevanten Details ihrer Studien verstanden und berichtet haben. In vielen Studien ist nicht klar, wie KI in den klinischen Arbeitsablauf passen würde oder ob es Einschränkungen bei der Anwendung dieser Methoden gibt. KI-Forscher sollten sicherstellen, dass sie den klinischen Kontext ihrer Daten und potenziellen Modelle verstehen, bevor sie Forschung betreiben, um Voreingenommenheit zu reduzieren und den Nutzen zu erhöhen. Idealerweise beinhaltet dies regelmäßige Interaktionen mit erfahrenen Klinikern, einschließlich Histopathologen und Onkologen.

Um die Reproduzierbarkeit weiter zu verbessern, empfehlen wir Forschern, nach Möglichkeit Code und Daten verfügbar zu machen. Es ist relativ einfach, Code zu veröffentlichen und Dokumentation zu erstellen, um die Benutzerfreundlichkeit zu verbessern, und es gibt bei der Veröffentlichung von Forschungsergebnissen nur wenige Nachteile. Die Bereitstellung von Daten ist aufgrund von Datensicherheitsanforderungen und potenziellen Speicherkosten oft schwieriger, kann jedoch Vorteile bieten, die über die primäre Forschung der ursprünglichen Autoren hinausgehen. Die digitale Pathologieforschung bei Eierstockkrebs ist derzeit durch den Mangel an öffentlich zugänglichen Daten begrenzt, was zu einer übermäßigen Abhängigkeit von TCGA führt und viele Forscher dazu veranlasst, ähnliche, aber unterschiedliche Datensätze sorgfältig zusammenzustellen. Diese Datensätze enthalten oft nur wenig von der Heterogenität, die in multizentrischen Multi-Scanner-Daten beobachtet wird, was es für Forscher schwierig macht, robuste Modelle zu trainieren oder die Generalisierbarkeit zu beurteilen. Bei der Einbeziehung heterogener Daten handelt es sich oft um kleine Datenmengen, die sich von der Mehrheit unterscheiden, was das Risiko von Verzerrungen und Verzerrungen mit sich bringt, anstatt zur Lösung dieser Probleme beizutragen. TCGA-basierte Studien sind hierfür anfällig, da es erhebliche Unterschiede zwischen TCGA-Folien gibt, die aus verschiedenen Datenzentren stammen69, wobei viele dieser Zentren jedoch nur geringe Datenmengen bereitstellen. Viele Forscher sind auf Open-Access-Daten angewiesen, es besteht jedoch ein erheblicher Mangel an geeigneten Open-Access-Histopathologiedaten für Eierstockkrebs. Die Bereitstellung solcher Daten mit detaillierten Protokollen zur Beschreibung der Datenerstellung ermöglicht es Forschern, gründlichere Analysen durchzuführen und die Generalisierbarkeit und klinische Implementierbarkeit des Modells erheblich zu verbessern.

Damit KI einen klinischen Nutzen erzielen kann, ist es wichtig, dass robustere Validierungen durchgeführt werden, insbesondere angesichts der Einschränkungen der verfügbaren Datensätze. Wir empfehlen Forschern, immer gründliche Analysen durchzuführen und dabei Kreuzvalidierung, Bootstrapping und/oder externe Validierungen zu verwenden, um sicherzustellen, dass die Ergebnisse robust sind und tatsächlich die Fähigkeit ihrer Modelle widerspiegeln, auf unsichtbare Daten zu verallgemeinern, und nicht einfach verursacht werden zufällig. Dies sollte die Angabe der Variabilität der Ergebnisse umfassen (normalerweise in einem Konfidenzintervall von 95 %), insbesondere beim Vergleich mehrerer Modelle, um zu unterscheiden, ob ein Modell tatsächlich besser als ein anderes ist oder ob der Unterschied auf Zufall zurückzuführen ist. Auch statistische Tests können für diese Auswertungen hilfreich sein. Eine weitere Möglichkeit zur Erfassung der Variabilität ist die Bayes'sche Unsicherheitsquantifizierung, mit der aleatorische (inhärente) und epistemische (Modellierungs-)Unsicherheit getrennt werden können.

Die aktuelle Literatur auf diesem Gebiet kann weitgehend als Modell-Prototyping mit homogenen retrospektiven Daten charakterisiert werden. Forscher berücksichtigen selten die Realität der Mensch-Maschine-Interaktion und glauben möglicherweise, dass diese Modelle ein Ersatz für Pathologen sind. Allerdings führen diese Modelle eng begrenzte Aufgaben innerhalb der Pathologie-Pipeline aus und berücksichtigen nicht den klinischen Kontext über ihre begrenzten Trainingsdatensätze und isolierten Aufgaben hinaus. Wir glauben, dass diese Modelle als Hilfsmittel für Pathologen nützlicher (und realistischer in der Umsetzung) wären und Sekundärmeinungen oder neuartige Zusatzinformationen liefern würden. Während sich die aktuelle Forschung in der Regel auf die Beurteilung der Modellgenauigkeit ohne Eingriff des Pathologen konzentriert, könnten unterschiedliche Studiendesigns eingesetzt werden, um den praktischen Nutzen dieser Modelle als Hilfsmittel besser zu beurteilen. Beispielsweise könnten Usability-Studien untersuchen, welche Modelle für Pathologen in der Praxis am zugänglichsten und aussagekräftigsten sind, und prospektive Studien könnten etwaige Vorteile für die Diagnoseeffizienz und die Patientenergebnisse quantifizieren und die Robustheit von Modellen in der Praxis untersuchen. Angesichts des begrenzten Angebots an Pathologen weltweit ist es besonders wichtig, die Auswirkungen von KI auf die Effizienz der Diagnose zu verstehen. Daher wird diese Art der Forschung der klinischen Übersetzung erheblich zugute kommen.

Um den klinischen Nutzen zu verbessern, sollten Forscher ihre Daten verstehen und sicherstellen, dass die geplante Forschung vor der Modellierung klinisch relevant ist. Idealerweise sollten sie Kliniker während des gesamten Projekts einbeziehen. Sie sollten auch unterschiedliche Studiendesigns in Betracht ziehen, einschließlich Usability-Studien und/oder prospektive Studien. Bei der Bewertung von Modellen sollten Forscher gründliche Analysen mittels Kreuzvalidierung, externer Validierung und/oder Bootstrapping durchführen. Bei der Berichterstattung über Forschungsergebnisse sollten Forscher den Kontext aller histopathologischen Daten klar darlegen, einschließlich der Art und Weise, wie Patienten rekrutiert/ausgewählt wurden und wie Gewebeproben verarbeitet wurden, um digitale Pathologiebilder zu erstellen. Schließlich sollten Forscher den gesamten Code offen zugänglich machen und Daten nach Möglichkeit verfügbar machen.

Die Suche wurde in den drei Forschungsdatenbanken PubMed, Scopus und Web of Science sowie in zwei Studienregistern, dem Cochrane Central Register of Controlled Trials (CENTRAL) und der International Clinical Trial Registry Platform (WHO-ICTRP) der Weltgesundheitsorganisation, durchgeführt. Die Forschungsdatenbanken umfassen nur Zeitschriften und Konferenzberichte, die einem Peer-Review unterzogen wurden, um die Integrität der enthaltenen Forschungsergebnisse sicherzustellen. Die ersten Durchsuchungen wurden am 25.04.2022 durchgeführt und zuletzt am 19.05.2023 wiederholt. Die Suchstrategie bestand aus drei unterschiedlichen Aspekten: künstliche Intelligenz, Eierstockkrebs und Histopathologie. Für jeden Aspekt wurden mehrere relevante Begriffe mit dem OR-Operator kombiniert (z. B. „künstliche Intelligenz“ ODER „maschinelles Lernen“) und diese dann mit dem AND-Operator kombiniert, um sicherzustellen, dass die abgerufenen Forschungsergebnisse alle drei Aspekte erfüllten. Für jede Suchmaschine wurde der größtmögliche Satz an Suchfeldern verwendet, mit Ausnahme von Scopus, wo Einschränkungen eingeführt wurden, um eine Suche innerhalb der Zitationsliste jedes Artikels zu vermeiden, die in den anderen Suchmaschinen kein verfügbares Feld ist. Die Begriffe „ML“ und „KI“ wurden aufgrund der Vielfalt ihrer möglichen Bedeutungen auf bestimmte Bereiche beschränkt. Um eine möglichst gründliche Literaturrecherche zu gewährleisten, wurden bei der Suche keine Einschränkungen hinsichtlich des Veröffentlichungsdatums oder der Artikelart vorgenommen.

Viele KI-Ansätze basieren auf statistischen Modellen, beispielsweise der logistischen Regression, die die Grenzen zwischen den Disziplinen verwischen können. Bei der Durchführung von Suchvorgängen wurde eine zuvor beschriebene Methodik übernommen70, bei der typische KI-Ansätze nach Namen gesucht wurden (z. B. neuronale Netze) und bei anderen Methoden danach gesucht wurde, ob die Autoren ihre Arbeit als künstliche Intelligenz bezeichneten. Ausführliche Informationen zur Suchimplementierung für jede Datenbank finden Sie in der Ergänzenden Anmerkung 1. Das Überprüfungsprotokoll wurde bei PROSPERO registriert, bevor die Suchergebnisse auf Aufnahme überprüft wurden (CRD42022334730).

Ein Forscher (JB) entfernte manuell doppelte Arbeiten mit Hilfe der Referenzierungssoftware EndNote X9. Zwei Forscher (JB, KA) überprüften dann unabhängig voneinander Artikel auf Aufnahme in zwei Phasen, die erste basierend auf Titel und Zusammenfassung, die zweite basierend auf dem Volltext. Meinungsverschiedenheiten wurden von einem dritten Forscher (NR oder NMO) besprochen und schlichtet. Studien im WHO-ICTRP verfügen nicht über zugehörige Abstracts, daher standen für diese Studien nur Titel für das erste Screening zur Verfügung.

Die Einschlusskriterien erforderten, dass die Forschung den Einsatz mindestens eines KI-Ansatzes evaluierte, um diagnostische oder prognostische Schlussfolgerungen aus humanen histopathologischen Bildern aus vermuteten oder bestätigten Fällen von Eierstockkrebs zu ziehen. Es wurden nur Studien einbezogen, bei denen KI-Methoden direkt auf die digitalen Pathologiebilder oder auf Merkmale angewendet wurden, die automatisch aus den Bildern extrahiert wurden. Grundlegende Aufgaben wie Segmentierung und Zellzählung wurden einbezogen, da diese von Pathologen für die computergestützte Diagnose genutzt werden können. Es wurden nur konventionelle Lichtmikroskopbilder berücksichtigt, andere Bildgebungsmodalitäten wie Fluoreszenz- und Hyperspektralbildgebung wurden ausgeschlossen. Veröffentlichungen, die keine Primärforschung beinhalteten, wurden ausgeschlossen (z. B. Übersichtsartikel). Nicht englischsprachige Artikel und Forschungsarbeiten, bei denen die Vollversion des Manuskripts nicht zugänglich war, wurden ausgeschlossen.

Ein Modell in einer eingeschlossenen Studie wurde als Modell von Interesse angesehen, wenn es dieselben Einschlusskriterien erfüllte. Wenn mehrere Modelle mit demselben Ergebnis verglichen wurden, wurde das Modell von Interesse als das neu vorgeschlagene Modell angenommen, wobei bei der Validierung das Modell mit der besten Leistung herangezogen wurde, wenn dies unklar war. Wenn in derselben Studie mehrere Modellergebnisse bewertet wurden, wurde für jedes Modellergebnis ein Modell von Interesse verwendet, unabhängig von etwaigen Ähnlichkeiten der Modellierungsansätze. Dasselbe Modellergebnis bei unterschiedlichen Präzisionsebenen (z. B. Patch-Ebene, Objektträgerebene, Patientenebene) wurde nicht als unterschiedliche Modellergebnisse angesehen. Modelle mussten nicht völlig unabhängig sein. Beispielsweise hätte die Ausgabe eines interessierenden Modells als Eingabe eines anderen interessierenden Modells verwendet werden können, unter der Bedingung, dass die Modellleistung für jedes Modell separat bewertet wurde.

Das Verzerrungsrisiko wurde für interessierende Modelle mithilfe des Prediction model Risk Of Bias ASsessment Tool (PROBAST)71 bewertet, wobei das Verzerrungsrisiko die Möglichkeit ist, dass gemeldete Ergebnisse durch Einschränkungen im Studiendesign, in der Durchführung und in der Analyse verzerrt werden. Es umfasst 20 Leitfragen, die in vier Bereiche kategorisiert sind (Teilnehmer, Prädiktoren, Ergebnis und Analyse), die entweder als „hohes Risiko“ oder „geringes Risiko“ oder als „unklar“ zusammengefasst werden, falls nicht genügend Informationen für eine umfassende Bewertung vorliegen und keine der verfügbaren Informationen weist auf ein hohes Risiko einer Verzerrung hin. Daher deutet ein unklares Risiko einer Verzerrung nicht auf methodische Mängel, sondern auf eine unvollständige Berichterstattung hin.

Der Teilnehmerbereich umfasst die Rekrutierung und Auswahl von Teilnehmern, um sicherzustellen, dass die Studienpopulation konsistent und repräsentativ für die Zielpopulation ist. Zu den relevanten Details gehören die Strategie zur Teilnehmerrekrutierung (wann und wo Teilnehmer rekrutiert wurden), die Einschlusskriterien und wie viele Teilnehmer rekrutiert wurden.

Der Bereich Prädiktoren umfasst die konsistente Definition und Messung von Prädiktoren, was in diesem Bereich typischerweise die Erstellung digitaler Pathologiebilder betrifft. Dazu gehören Methoden zum Fixieren, Färben, Scannen und digitalen Bearbeiten von Gewebe vor der Modellierung.

Der Ergebnisbereich umfasst die angemessene Definition und konsistente Bestimmung von Ground-Truth-Labels. Dazu gehören die Kriterien, die zur Bestimmung der Diagnose/Prognose verwendet werden, das Fachwissen aller Personen, die diese Bezeichnungen bestimmen, und ob die Bezeichnungen unabhängig von etwaigen Modellergebnissen bestimmt werden.

Der Analysebereich umfasst statistische Überlegungen bei der Bewertung der Modellleistung, um gültige und nicht übermäßig optimistische Ergebnisse sicherzustellen. Dazu gehören viele Faktoren, wie z. B. die Anzahl der Teilnehmer am Testsatz für jedes Ergebnis, die verwendeten Validierungsansätze (Kreuzvalidierung, externe Validierung, Bootstrapping usw.), die zur Leistungsbewertung verwendeten Metriken und die zur Überwindung des Problems verwendeten Methoden Auswirkungen von Zensur, konkurrierenden Risiken/Störfaktoren und fehlenden Daten. Die durch einige dieser Faktoren verursachten Risiken hängen miteinander zusammen. Beispielsweise wird das Risiko einer Verzerrung durch die Verwendung eines kleinen Datensatzes durch Kreuzvalidierung etwas gemindert, was die effektive Größe des Testsatzes erhöht und zur Bewertung der Variabilität verwendet werden kann, wodurch der Optimismus verringert wird in den Ergebnissen. Darüber hinaus hängt das durch die Verwendung eines kleinen Datensatzes verursachte Risiko von der Art des vorhergesagten Ergebnisses ab. Beispielsweise sind für eine robuste Analyse der 5-Klassen-Klassifizierung mehr Daten erforderlich als für die binäre Klassifizierung. Darüber hinaus müssen ausreichende Daten innerhalb aller relevanten Patientenuntergruppen vorliegen. Wenn beispielsweise mehrere Subtypen von Eierstockkrebs einbezogen werden, darf es keinen Subtyp geben, der nur von wenigen Patientinnen vertreten wird. Aufgrund dieser miteinander verbundenen Faktoren gibt es keine strengen Kriterien zur Bestimmung der angemessenen Größe eines Datensatzes, obwohl weniger als 50 Proben pro Klasse oder weniger als 100 Proben insgesamt wahrscheinlich als Hochrisiko gelten und mehr als 1000 Proben insgesamt wahrscheinlich sind als risikoarm einzustufen.

Aufgrund inkonsistenter Methoden besteht häufig das Risiko einer Verzerrung. Inkonsistenzen in den Teilnehmer- und Prädiktordomänen können zu Heterogenität in den visuellen Eigenschaften digitaler Pathologie-Folien führen, was zu falschen Korrelationen führen kann, entweder durch Zufall oder systematische Unterschiede zwischen Untergruppen im Datensatz. Unterschiedliche Daten können während des Trainings von Vorteil sein, um die Generalisierbarkeit des Modells bei der Verwendung großer Datensätze zu verbessern. Dies muss jedoch genau kontrolliert werden, um systematische Verwirrung zu vermeiden. Eine inkonsistente Bestimmung des Ergebnisses kann dazu führen, dass die Ergebnisse einer Studie aufgrund falscher Korrelationen in den Grundwahrheitsbezeichnungen unzuverlässig oder aufgrund falscher Bestimmung der Bezeichnungen ungültig sind.

Während PROBAST einen Rahmen zur Bewertung von Verzerrungsrisiken bietet, gibt es bei der Interpretation von Signalfragen ein gewisses Maß an Subjektivität. Daher wurde jedes Modell von drei unabhängigen Forschern (JB, KA, NR, KZ, NMO) analysiert, wobei mindestens ein Informatiker und ein Kliniker an der Risikobewertung für jedes Modell beteiligt waren. Die PROBAST-Anwendbarkeit der Forschungsanalyse wurde nicht umgesetzt, da sie für ein so vielfältiges Spektrum möglicher Forschungsfragen ungeeignet ist.

Die Datenextraktion wurde unabhängig von zwei Forschern (JB, KA) mithilfe eines Formulars durchgeführt, das 81 Felder in den Kategorien „Übersicht“, „Daten“, „Methoden“, „Ergebnisse“ und „Verschiedenes“ enthielt. Mehrere dieser Bereiche wurden während der Datenextraktion mit Zustimmung beider Forscher hinzugefügt oder geklärt und rückwirkend auf die gesamte akzeptierte Literatur angewendet. Das endgültige Datenextraktionsformular ist unter www.github.com/scjjb/OvCaReview verfügbar und in der Ergänzungstabelle 1 zusammengefasst.

Informationen wurden aus Volltextartikeln sowie gegebenenfalls aus Referenzen und ergänzenden Materialien gesucht. Schlussfolgerungen wurden nur dann gezogen, wenn beide Forscher davon überzeugt waren, dass die Informationen korrekt waren, und Meinungsverschiedenheiten wurden durch Diskussion gelöst. Felder, die nicht sicher ausgefüllt werden konnten, wurden als unklar gekennzeichnet.

Alle extrahierten Daten wurden in zwei Tabellen zusammengefasst, jeweils eine für Merkmale auf Studien- und Modellebene. In diese Tabellen wurden nur interessante Modelle aufgenommen. Der Begriff Modellergebnis bezieht sich auf die Modellausgabe, unabhängig davon, ob es sich um ein klinisches Ergebnis (Diagnose/Prognose) handelte oder um ein diagnostisch relevantes Ergebnis, das für eine computergestützte Diagnose verwendet werden könnte, beispielsweise für die Tumorsegmentierung. Die Datensynthese umfasste aufgrund der Vielfalt der einbezogenen Methoden und Modellergebnisse keine Metaanalyse. Die PRISMA 2020-Richtlinien für die Berichterstattung über systematische Überprüfungen wurden befolgt, wobei Checklisten in den Ergänzungstabellen 2 und 3 bereitgestellt werden.

Die Autoren erklären, dass die wichtigsten Daten, die die Ergebnisse dieser Studie stützen, im Artikel und seinen ergänzenden Informationsdateien verfügbar sind. Weitere Daten sind auf Anfrage beim entsprechenden Autor erhältlich.

Sung, H. et al. Globale Krebsstatistik 2020: Globocan-Schätzungen der Inzidenz und Mortalität weltweit für 36 Krebsarten in 185 Ländern. CA Cancer J. Clin. 71, 209–249 (2021).

Artikel PubMed Google Scholar

Menon, U. et al. Populationsscreening und Mortalität auf Eierstockkrebs nach Langzeit-Follow-up im UK Collaborative Trial of Ovarian Cancer Screening (UKCTOCS): einer randomisierten kontrollierten Studie. Lancet 397, 2182–2193 (2021).

Artikel PubMed PubMed Central Google Scholar

Ebell, MH, Culp, MB & Radke, TJ Eine systematische Überprüfung der Symptome für die Diagnose von Eierstockkrebs. Bin. J. Vorher. Med. 50, 384–394 (2016).

Artikel PubMed Google Scholar

Berek, JS, Renz, M., Kehoe, S., Kumar, L. & Friedlander, M. Krebs des Eierstocks, der Eileiter und des Peritoneums: Aktualisierung 2021. Int. J. Gynecol. Obstet. 155, 61–85 (2021).

Artikel Google Scholar

Köbel, M. et al. Ovarialkarzinom-Subtypen sind unterschiedliche Krankheiten: Implikationen für Biomarker-Studien. PLoS Med. 5, e232 (2008).

Artikel PubMed PubMed Central Google Scholar

Prat, J. Stadieneinteilung für Eierstock-, Eileiter- und Bauchfellkrebs. Int. J. Gynecol. Obstet. 124, 1–5 (2014).

Artikel Google Scholar

Matsuno, RK et al. Vereinbarung zum Tumorgrad des Ovarialkarzinoms: Analyse von Archivgeweben aus der Überwachung, Epidemiologie und Endergebnisse des Restgewebedepots. Cancer Causes Control 24, 749–757 (2013).

Artikel PubMed PubMed Central Google Scholar

Köbel, M. et al. Die Bestimmung des Ovarialkarzinom-Histotyps ist hoch reproduzierbar und wird durch den Einsatz der Immunhistochemie verbessert. Histopathology 64, 1004–1013 (2014).

Artikel PubMed Google Scholar

Barnard, ME et al. Pathologe und Pathologie berichten über Übereinstimmung hinsichtlich der Merkmale von Eierstocktumoren in den Gesundheitsstudien der Krankenschwestern. Gynäkologie. Onkol. 150, 521–526 (2018).

Artikel PubMed PubMed Central Google Scholar

Wilson, ML et al. Zugang zu pathologischen und labormedizinischen Dienstleistungen: eine entscheidende Lücke. Lancet 391, 1927–1938 (2018).

Artikel PubMed Google Scholar

Royal College of Pathologists. Deckung der Pathologienachfrage: Personalzählung in der Histopathologie. https://www.rcpath.org/static/952a934d-2ec3-48c9-a8e6e00fcdca700f/Meeting-Pathology-Demand-Histopathology-Workforce-Census-2018.pdf (2018).

Baidoshvili, A. et al. Bewertung der Vorteile der Implementierung digitaler Pathologie: Zeiteinsparungen in der Laborlogistik. Histopathology 73, 784–794 (2018).

Artikel PubMed Google Scholar

Stenzinger, A. et al. Künstliche Intelligenz und Pathologie: von den Prinzipien zur Praxis und zukünftigen Anwendungen in der Histomorphologie und molekularen Profilierung. Semin. Krebsbiol. 84, 129–143 (2022).

Artikel CAS PubMed Google Scholar

Raciti, P. et al. Die klinische Validierung der durch künstliche Intelligenz unterstützten Pathologiediagnose zeigt erhebliche Fortschritte bei der diagnostischen Genauigkeit bei der Erkennung von Prostatakrebs. Bogen. Pathol. Labor. Med. https://doi.org/10.5858/arpa.2022-0066-OA (2022).

Kalra, S. et al. Konsens zur Pan-Krebs-Diagnose durch Suche in archivierten histopathologischen Bildern mithilfe künstlicher Intelligenz. npj Ziffer. Med. 3, 31 (2020).

Artikel PubMed PubMed Central Google Scholar

Meng, Z. et al. Ein auf Deep Learning basierendes System, das für das Screening auf gastrointestinale Stromatumoren trainiert ist, kann mehrere Arten von Weichteiltumoren identifizieren. Bin. J. Pathol. 193, 899–912 (2023).

Artikel PubMed Google Scholar

Boehm, KM et al. Multimodale Datenintegration mittels maschinellem Lernen verbessert die Risikostratifizierung von hochgradigem serösem Eierstockkrebs. Nat. Krebs 3, 723–733 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Kothari, S., Phan, JH, Osunkoya, AO & Wang, MD Biologische Interpretation morphologischer Muster in histopathologischen Ganzdiabildern. In Proceedings of the ACM Conference on Bioinformatics, Computational Biology and Biomedicine 218–225 (ACM, 2012).

Yu, KH et al. Entschlüsselung der Histopathologie seröser Ovarialkarzinome und der Platinreaktion durch Faltungs-Neuronale Netze. BMC Med. 18, 1–14 (2020).

Artikel Google Scholar

Liu, T., Su, R., Sun, C., Li, Expertensystem. Appl. 206, 117643 (2022).

Artikel Google Scholar

Poruthoor, A., Phan, JH, Kothari, S. & Wang, MD Erforschung genomischer, proteomischer und histopathologischer Bilddatenintegrationsmethoden für die klinische Vorhersage. Im Jahr 2013 IEEE China Summit und International Conference on Signal and Information Processing 259–263 (IEEE, 2013).

Yaar, A., Asif, A., Raza, SEA, Rajpoot, N. & Minhas, F. Bereichsübergreifender Wissenstransfer zur Vorhersage der Chemosensitivität bei Eierstockkrebspatientinnen. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops 928–929 (IEEE, 2020).

Ghoniem, RM, Algarni, AD, Refky, B. & Ewees, AA Multimodales evolutionäres Deep-Learning-Modell für die Diagnose von Eierstockkrebs. Symmetrie 13, 643 (2021).

Artikel Google Scholar

Zeng, H., Chen, L., Zhang, M., Luo, Y. & Ma, X. Die Integration histopathologischer Bilder und mehrdimensionaler Omics-Analysen sagt molekulare Merkmale und Prognosen bei hochgradigem serösem Eierstockkrebs voraus. Gynäkologie. Onkol. 163, 171–180 (2021).

Artikel CAS PubMed Google Scholar

Holback, C. et al. Die Sammlung des Krebsgenomatlas Eierstockkrebs (TCGA-OV) (Version 4) [Datensatz]. Das Archiv für Krebsbildgebung. https://wiki.cancerimagingarchive.net/pages/viewpage.action?pageId=7569497 (2016).

Levine, AB et al. Synthese von Bildern aus der Krebspathologie in diagnostischer Qualität durch generative gegnerische Netzwerke. J. Pathol. 252, 178–188 (2020).

Artikel CAS PubMed Google Scholar

Boschman, J. et al. Der Nutzen der Farbnormalisierung für die KI-basierte Diagnose von Hämatoxylin- und Eosin-gefärbten Pathologiebildern. J. Pathol. 256, 15–24 (2022).

Artikel CAS PubMed Google Scholar

Farahani, H. et al. Deep-Learning-basierte Histotypdiagnose von Pathologiebildern des gesamten Ovarialkarzinoms. Mod. Pathol. 35, 1983–1990 (2022).

Artikel CAS PubMed Google Scholar

BenTaieb, A., Li-Chang, H., Huntsman, D. & Hamarneh, G. Automatische Diagnose von Eierstockkarzinomen durch spärliche Gewebedarstellung mit mehreren Auflösungen. In Medical Image Computing and Computer-Assisted Intervention–MICCAI 2015: 18. Internationale Konferenz, München, Deutschland, 5.–9. Oktober 2015, Tagungsband, Teil I 18 629–636 (Springer, 2015).

BenTaieb, A., Nosrati, MS, Li-Chang, H., Huntsman, D. & Hamarneh, G. Klinisch inspirierte automatische Klassifizierung von Ovarialkarzinom-Subtypen. J. Pathol. Informatik 7, 28 (2016).

Artikel Google Scholar

Jiang, J. et al. Auf digitaler Pathologie basierende Untersuchung morphologischer Merkmale auf Zell- und Gewebeebene bei serösem Borderline-Eierstocktumor und hochgradigem serösem Eierstockkrebs. J. Pathol. Informatik 12, 24 (2021).

Artikel Google Scholar

Jiang, J. et al. Die rechnergestützte Auswertung der Tumorstroma-Reaktion führte zu neuartigen prognoseassoziierten Fibrose- und molekularen Signaturentdeckungen bei hochgradigem serösem Ovarialkarzinom. Vorderseite. Med. 9, 994467 (2022).

Artikel Google Scholar

Wang, C.-W. et al. Eine schwach überwachte Deep-Learning-Methode zur Steuerung der Behandlung von Eierstockkrebs und zur Identifizierung eines wirksamen Biomarkers. Krebserkrankungen 14, 1651 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, C.-W. et al. Schwach überwachtes Deep Learning zur Vorhersage der Behandlungswirksamkeit bei Eierstockkrebs anhand histopathologischer Bilder. Berechnen. Med. Imaging Graphics 99, 102093 (2022).

Artikel Google Scholar

Wang, C.-W. et al. Interpretierbares aufmerksamkeitsbasiertes Deep-Learning-Ensemble für die personalisierte Behandlung von Eierstockkrebs ohne manuelle Anmerkungen. Berechnen. Med. Imaging Graphics 107, 102233 (2023).

Artikel Google Scholar

Ho, DJ et al. Tiefgreifende, interaktive, lernbasierte Segmentierung von Eierstockkrebs-gefärbten Bildern ganzer Objektträger zur Untersuchung morphologischer Muster der Brca-Mutation. J. Pathol. Informatik 14, 100160 (2023).

Artikel Google Scholar

Paijens, ST et al. Prognostische bildbasierte Quantifizierung von cd8cd103-T-Zell-Untergruppen bei Patienten mit hochgradigem serösem Eierstockkrebs. Oncoimmunology 10, 1935104 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Shin, SJ et al. Stiltransferstrategie zur Entwicklung einer generalisierbaren Deep-Learning-Anwendung in der digitalen Pathologie. Berechnen. Methodenprogramme Biomed. 198, 105815 (2021).

Artikel PubMed Google Scholar

Mayer, RS et al. Wie man mit absichtlichen Fehlern lernt: Noisy-Ensembles zur Überwindung schlechter Gewebequalität für Deep Learning in der Computerpathologie. Vorderseite. Med. 9, 959068 (2022).

Artikel Google Scholar

Du, Y. et al. Klassifizierung von Tumorepithel und Stroma durch Nutzung von Bildmerkmalen, die von tiefen Faltungs-Neuronalen Netzen gelernt wurden. Ann. Biomed. Ing. 46, 1988–1999 (2018).

Artikel PubMed PubMed Central Google Scholar

Hu, Y. et al. Vorhersage molekularer Merkmale aus der Gewebemorphologie durch selbstinteraktives Multi-Instanz-Lernen. In Medical Image Computing and Computer Assisted Intervention – MICCAI 2022: 25. Internationale Konferenz, Singapur, 18.–22. September 2022, Proceedings, Teil II 130–139 (Springer, 2022).

Lazard, T. et al. Deep Learning identifiziert morphologische Muster des homologen Rekombinationsmangels bei luminalen Brustkrebserkrankungen anhand ganzer Objektträgerbilder. Cell Rep. Med. 3, 100872 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Yokomizo, R. et al. O3c-Glasklasse: ein Rahmen für maschinelles Lernen zur prognostischen Vorhersage von klarzelligem Ovarialkarzinom. Bioinformatik Biol. Insights 16, 11779322221134312 (2022).

Artikel Google Scholar

Nero, C. et al. Deep-Learning zur Vorhersage der Brca-Mutation und des Überlebens anhand digitaler H&E-Objektträger von epithelialem Eierstockkrebs. Int. J. Mol. Wissenschaft. 23, 11326 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Wu, M. et al. Erforschung prognostischer Indikatoren in den pathologischen Bildern von Eierstockkrebs auf der Grundlage eines tiefen Überlebensnetzwerks. Vorderseite. Genet. 13, 1069673 (2023).

Artikel PubMed PubMed Central Google Scholar

Kasture, KR, Choudhari, D. & Matte, PN Vorhersage und Klassifizierung von Eierstockkrebs mithilfe eines erweiterten tiefen Faltungs-Neuronalen Netzwerks. Int. J. Eng. Trends Technol. 70, 310–318 (2022).

Artikel Google Scholar

Kowalski, PA, Błoniarz, J. & Chmura, Ł. Faltungs-Neuronale Netze bei der Erkennung von Eierstockkrebs. In Computational Intelligence and Mathematics for Tackling Complex Problems 2 55–64 (Springer, 2022).

BenTaieb, A., Li-Chang, H., Huntsman, D. & Hamarneh, G. Ein strukturiertes latentes Modell für die Subtypisierung von Ovarialkarzinomen anhand histopathologischer Objektträger. Med. Bild Anal. 39, 194–205 (2017).

Artikel PubMed Google Scholar

Dong, J., Li, J., Lu, J. & Fu, A. Automatische Segmentierung für immunhistochemische Bilder von Eierstockkrebs basierend auf dem Chroma-Kriterium. Im Jahr 2010 2nd International Conference on Advanced Computer Control, vol. 2 147–150 (IEEE, 2010).

Dong, J., Li, J., Fu, A. & Lv, H. Automatische Segmentierung für immunhistochemische Bilder von Eierstockkrebs basierend auf dem YUV-Farbraum. Im Jahr 2010 International Conference on Biomedical Engineering and Computer Science 1–4 (IEEE, 2010).

Signolle, N., Revenu, M., Plancoulaine, B. & Herlin, P. Wavelet-basierte Multiskalen-Textursegmentierung: Anwendung auf die Charakterisierung von Stromakompartimenten auf virtuellen Objektträgern. Signalprozess. 90, 2412–2422 (2010).

Artikel Google Scholar

Janowczyk, A., Chandran, S., Feldman, M. & Madabhushi, A. Lokale morphologische Skala: Anwendung zur Segmentierung tumorinfiltrierender Lymphozyten bei Eierstockkrebs-Tmas. In Medical Imaging 2011: Image Processing, vol. 7962 827–840 (SPIE, 2011).

Janowczyk, A. et al. Hochdurchsatz-Biomarker-Segmentierung auf Eierstockkrebs-Gewebe-Microarrays über hierarchische normalisierte Schnitte. IEEE Trans. Biomed. Ing. 59, 1250–1252 (2012).

Ramasamy, S. & Kaliyaperumal, V. Ein hybridisierter Kanalauswahlansatz mit tiefem Faltungs-Neuronalnetzwerk für eine effektive Vorhersage von Eierstockkrebs in Bildern mit periodischer Säure-Schiff-Färbung. Parallelitätsberechnung. Üben. Exp. 35, e7568 (2023).

Artikel Google Scholar

Gentles, L. et al. Integration computergestützter automatisierter Analysealgorithmen in die Entwicklung und Validierung immunhistochemischer Biomarker bei Eierstockkrebs. J. Clin. Pathol. 74, 469–474 (2021).

Artikel CAS PubMed Google Scholar

Laury, AR, Blom, S., Ropponen, T., Virtanen, A. & Carpén, OM Eine auf künstlicher Intelligenz basierende Bildanalyse kann das Ergebnis bei hochgradigem serösem Karzinom allein anhand der Histologie vorhersagen. Wissenschaft. Rep. 11, 19165 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Heindl, A. et al. Mikroumgebungs-Nischendivergenz prägt die morphologische Plastizität von BRCA1-fehlreguliertem Eierstockkrebs. Nat. Komm. 9, 3917 (2018).

Artikel PubMed PubMed Central Google Scholar

Ilse, M., Tomczak, J. & Welling, M. Aufmerksamkeitsbasiertes tiefes Lernen mit mehreren Instanzen. In International Conference on Machine Learning 2127–2136 (PMLR, 2018).

Lu, MY et al. Dateneffiziente und schwach überwachte Computerpathologie auf Bildern ganzer Dias. Nat. Biomed. Ing. 5, 555–570 (2021).

Artikel PubMed PubMed Central Google Scholar

He, K. et al. Transformatoren in der medizinischen Bildanalyse: ein Rückblick. Intel. Med. 3, 59–78 (2022).

Elie, N. et al. Auswirkungen automatisierter Methoden zur quantitativen Bewertung der Immunfärbung: hin zur digitalen Pathologie. Vorderseite. Onkol. 12, 931035 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Shrestha, P. et al. Eine systematische Übersicht über den Einsatz künstlicher Intelligenz in der gynäkologischen Bildgebung – Hintergrund, Stand der Technik und zukünftige Richtungen. Gynäkologie. Onkol. 166, 596–605 (2022).

Zhou, J., Cao, W., Wang, L., Pan, Z. & Fu, Y. Anwendung künstlicher Intelligenz bei der Diagnose und prognostischen Vorhersage von Eierstockkrebs. Berechnen. Biol. Med. 146, 105608 (2022).

Artikel PubMed Google Scholar

Fiste, O., Liontos, M., Zagouri, F., Stamatakos, G. & Dimopoulos, MA Anwendungen des maschinellen Lernens bei gynäkologischem Krebs: eine kritische Überprüfung. Krit. Rev. Oncol. Hämatol. 179, 103808 (2022).

Xu, H.-L. et al. Leistung künstlicher Intelligenz bei der bildbasierten Identifizierung von Eierstockkrebs: eine systematische Überprüfung und Metaanalyse. EClinicalMedicine 53, 101662 (2022).

Artikel PubMed PubMed Central Google Scholar

Lorsakul, A. et al. Automatisierte Vollbildanalyse von Multiplex-Hellfeld-ihc-Bildern für Krebszellen und karzinomassoziierte Fibroblasten. In Medical Imaging 2017: Digital Pathology, vol. 10140 41–46 (SPIE, 2017).

Salguero, J. et al. Auswahl von Trainingsproben für die Klassifizierung von Eierstockkrebs mithilfe eines halbüberwachten Clustering-Ansatzes. In Medical Imaging 2022: Digital and Computational Pathology, vol. 12039 20–24 (SPIE, 2022).

Collins, GS, Reitsma, JB, Altman, DG & Moons, KG Transparente Berichterstattung über ein multivariables Vorhersagemodell für individuelle Prognosen oder Diagnosen (Tripod): die Tripod-Erklärung. Ann. Praktikant. Med. 162, 55–63 (2015).

Artikel PubMed Google Scholar

Dehkharghanian, T. et al. Verzerrte Daten, verzerrte KI: Tiefe Netzwerke sagen den Aufnahmeort von TCGA-Bildern voraus. Diag. Pathol. 18, 1–12 (2023).

Artikel Google Scholar

Dhiman, P. et al. Methodische Durchführung prognostischer Vorhersagemodelle, die mithilfe maschinellen Lernens in der Onkologie entwickelt wurden: eine systematische Überprüfung. BMC Med. Res. Methodol. 22, 101 (2022).

Artikel PubMed PubMed Central Google Scholar

Wolff, RF et al. Probast: ein Tool zur Bewertung des Verzerrungsrisikos und der Anwendbarkeit von Vorhersagemodellstudien. Ann. Praktikant. Med. 170, 51–58 (2019).

Artikel PubMed Google Scholar

Köbel, M. et al. Die Diagnose des Ovarialkarzinom-Zelltyps ist hoch reproduzierbar: eine transkanadische Studie. Bin. J. Surg. Pathol. 34, 984–993 (2010).

Artikel PubMed Google Scholar

Referenzen herunterladen

Für diese Forschung gab es keine direkte Finanzierung. JB wird vom UKRI Engineering and Physical Sciences Research Council (EPSRC) [EP/S024336/1] unterstützt. KA und PA werden vom Tony Bramall Charitable Trust unterstützt. AS wird von Innovate UK über das National Consortium of Intelligent Medical Imaging (NCIMI) [104688], Cancer Research UK [C19942/A28832] und Leeds Hospitals Charity [9R01/1403] unterstützt. Die Geldgeber hatten keinen Einfluss auf den Inhalt dieser Forschung. Zum Zweck des offenen Zugangs hat der Autor eine Creative Commons Attribution (CC BY)-Lizenz auf alle vom Autor akzeptierten Manuskriptversionen angewendet, die sich aus dieser Einreichung ergeben.

Diese Autoren haben diese Arbeit gemeinsam betreut: Nicolas M. Orsi, Nishant Ravikumar.

Centre for Computational Imaging and Simulation Technologies in Biomedicine (CISTIB), School of Computing, University of Leeds, Leeds, Großbritannien

Jack Breen & Nishant Ravikumar

Leeds Institute of Medical Research an der St. James's, School of Medicine, University of Leeds, Leeds, Großbritannien

Katie Allen, Advanced Practice, Andrew Scarsbrook und Nicholas M. Orsi

Leeds Cancer Centre, St. James's University Hospital, Leeds, Großbritannien

Kieran Zucker & Geoff Hall

Abteilung für Radiologie, St. James's University Hospital, Leeds, Großbritannien

Pratik Adusumilli & Andrew Scarsbrook

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

JB erstellte das Studienprotokoll mit Feedback und Beiträgen aller anderen Autoren. JB, KA, KZ, NMO und NR führten die Risikobewertung für Bias durch. JB und KA führten eine Datenextraktion durch. JB analysierte die extrahierten Daten und verfasste das Manuskript mit Feedback und Beiträgen aller anderen Autoren.

Korrespondenz mit Jack Breen.

GH erhält Forschungsgelder von IQVIA. NMO erhält Forschungsgelder von 4D Path. Die anderen Autoren erklären keine konkurrierenden Interessen.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Breen, J., Allen, K., Zucker, K. et al. Künstliche Intelligenz in der Histopathologie von Eierstockkrebs: eine systematische Überprüfung. npj Precis. Einmal. 7, 83 (2023). https://doi.org/10.1038/s41698-023-00432-6

Zitat herunterladen

Eingegangen: 31. März 2023

Angenommen: 01. August 2023

Veröffentlicht: 31. August 2023

DOI: https://doi.org/10.1038/s41698-023-00432-6

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt