banner
Heim / Blog / Können klinische Entscheidungsunterstützungssysteme eine Bereicherung für die medizinische Ausbildung sein? Ein experimenteller Ansatz
Blog

Können klinische Entscheidungsunterstützungssysteme eine Bereicherung für die medizinische Ausbildung sein? Ein experimenteller Ansatz

Aug 06, 2023Aug 06, 2023

BMC Medical Education Band 23, Artikelnummer: 570 (2023) Diesen Artikel zitieren

319 Zugriffe

Details zu den Metriken

Die diagnostische Genauigkeit ist einer der wichtigsten Eckpfeiler einer angemessenen und erfolgreichen medizinischen Entscheidungsfindung. Klinische Entscheidungsunterstützungssysteme (CDSSs) werden in letzter Zeit eingesetzt, um die diagnostischen Überlegungen des Arztes zu erleichtern. Bisher ist jedoch wenig über die potenziellen Vorteile von CDSS für Medizinstudenten in einem Bildungsumfeld bekannt. Der Zweck unserer Studie bestand darin, den Nutzen von CDSSs für Medizinstudenten bei der Beurteilung ihrer diagnostischen Leistungen und den Einfluss solcher Software auf das Vertrauen der Studenten in ihre eigenen diagnostischen Fähigkeiten zu untersuchen.

Anhand von Papierfällen mussten die Studierenden zwei verschiedene Patienten mithilfe eines CDSS bzw. konventioneller Methoden wie z. B. Lehrbüchern diagnostizieren. Bei beiden Patienten handelte es sich um eine gemeinsame Erkrankung, in der einen Situation war das klinische Erscheinungsbild typisch (Tonsillitis), in der anderen Situation (Lungenembolie) zeigte sich der Patient jedoch atypisch. Wir haben eine 2x2x2 Cluster-randomisierte kontrollierte Studie zwischen und innerhalb von Probanden verwendet, um die diagnostische Genauigkeit bei Medizinstudenten zu bewerten, auch durch Änderung der Reihenfolge der verwendeten Ressourcen (CDSS zuerst oder zweitens).

Medizinstudierende im 4. und 5. Jahr schnitten in beiden Fällen mit konventionellen Methoden oder dem CDSS gleich gut ab (t(164) = 1,30; p = 0,197). Die diagnostische Genauigkeit und das Vertrauen in die korrekte Diagnose waren bei der typischen Präsentationsbedingung höher als bei der atypischen Präsentationsbedingung (t(85) = 19,97; p < 0,0001 und t(150) = 7,67; p < 0,0001). Diese Ergebnisse widerlegen Unsere Haupthypothese ist, dass Studierende mit herkömmlichen Methoden genauere Diagnosen stellen als mit dem CDSS.

Medizinstudenten im 4. und 5. Jahr schnitten bei der Diagnose von zwei Fällen häufiger Krankheiten mit typischem oder atypischem klinischem Erscheinungsbild mit konventionellen Methoden oder einem CDSS gleich gut ab. Die Studierenden beherrschten die Diagnose einer häufigen Krankheit mit typischem Erscheinungsbild, unterschätzten in diesem Szenario jedoch ihr eigenes Faktenwissen. Außerdem waren sich die Studierenden ihrer eigenen diagnostischen Grenzen bewusst, wenn sie mit einem anspruchsvollen Fall mit atypischem Erscheinungsbild konfrontiert wurden, für den die Verwendung eines CDSS scheinbar keine zusätzlichen Erkenntnisse lieferte.

Peer-Review-Berichte

Die diagnostische Genauigkeit ist einer der wichtigsten Eckpfeiler einer angemessenen und erfolgreichen medizinischen Entscheidungsfindung [1, 2]. Bereits Studierende der Medizin werden nach und nach mit der entscheidenden Fähigkeit vertraut gemacht, eigene Diagnosen zu stellen [3, 4] und diese kritisch zu beurteilen [5, 6]. Die didaktischen Ansätze, die den Studierenden beibringen, wie sie zu diagnostischen Schlussfolgerungen gelangen können, unterscheiden sich sicherlich in Abhängigkeit von Faktoren wie Zeit, Land und medizinischer Einrichtung [7, 8]. Darüber hinaus haben technologische Innovationen auch dazu beigetragen, dass sich die Verfahren in der Lehre zur korrekten Diagnosestellung verändert haben [9]. Ein Beispiel für technologische Unterstützung wären digitalisierte klinische Entscheidungsunterstützungssysteme (CDSS), die mittlerweile sowohl von Ärzten [10] als auch von Patienten [11] in großem Umfang genutzt werden. Der potenzielle Nutzen von CDSS bei der Vermittlung diagnostischer Prozesse für Medizinstudenten wird in dieser Studie weiter untersucht.

CDSSs sind Software, die eine unpersönliche Unterstützung bei der medizinischen Entscheidungsfindung bieten soll, um diagnostische Prozesse zu erleichtern [12]. Prototypen aktueller CDSS wurden bereits in den 1950er Jahren entwickelt [13, 14]. Im Laufe der Zeit wurde diese Software immer weiter verfeinert, insbesondere durch die Weiterentwicklung digitaler Technologien und durch den Einsatz künstlicher Intelligenz auf der Grundlage riesiger Datenmengen [15, 16] anstelle reduktionistischer Diagnosealgorithmen allein. Durch das Aufkommen von Smartphones [17] sind CDSSs heute in Form von Symptomprüfgeräten für die breite Öffentlichkeit leicht zugänglich [18]. Angesichts der breiten Verbreitung solcher CDSSs wurden ihre Leistung und der potenzielle Nutzen in der medizinischen Praxis im Allgemeinen bereits ausführlich untersucht [19, 20]. Auch Berner et. al. fanden beim Vergleich der Leistung von vier CDSSs in über 100 anspruchsvollen Fällen eine Genauigkeit von 52 % bis 71 %, was bedeutet, dass diese Systeme aus einer Auswahl vordefinierter möglicher Diagnosen die richtige Diagnose lieferten [21]. Im Laufe der Zeit nahm die Genauigkeit von CDSSs zu, wie Graber und Mathew zeigten, die eine Genauigkeit von 98 % berichteten, gemessen an der Benennung der richtigen Diagnose in den ersten 30 möglichen Diagnosen in über 50 verschiedenen schwierigen Fällen [22]. Allerdings scheint es eine Diskrepanz zu geben, wenn es um die ungewöhnliche Darstellung von Krankheiten geht. Als Beispiel nennen Hill et al. fanden heraus, dass Symptomprüfer bei häufigen Erscheinungen bei 42 % die richtige Diagnose zuerst auflisteten, im Gegensatz zu nur 4 % bei ungewöhnlichen Erscheinungen [23]. Bemerkenswert ist, dass die Genauigkeit von Symptomprüfgeräten im letzten Jahrzehnt offenbar stagniert hat [24].

Da digitalisierte CDSSs in naher Zukunft von großer Bedeutung zu sein scheinen, haben wir uns gefragt, ob die Verwendung von CDSSs auch für Medizinstudenten von Vorteil wäre, wenn sie ihre diagnostischen Entscheidungskompetenzen und den mit der diagnostischen Entscheidungsfindung verbundenen Prozess entwickeln. Daher sollten CDSSs als Lehrinstrument betrachtet werden, das Medizinstudenten zusätzliche Möglichkeiten zur medizinischen Entscheidungsfindung bietet [25]. Bisher gibt es jedoch kaum oder sogar widersprüchliche Beweise dafür, ob diese Software diese Versprechen letztendlich erfüllen wird [26, 27].

Nach unserem besten Wissen ist unsere Studie die erste, die den Nutzen von CDSSs in der medizinischen Ausbildung im Hinblick auf den Einfluss eines CDSS auf die diagnostische Genauigkeit der Studierenden und ihr Vertrauen in ihre eigenen Diagnosen als Ergebnis ihres Entscheidungsprozesses untersucht. Die meisten Studien, in denen unterstützende Geräte für die medizinische Entscheidungsfindung eingesetzt werden, konzentrieren sich fast ausschließlich auf seltene Krankheiten oder schwierige, wenn nicht sogar ungewöhnliche Fälle [21]. Im Gegensatz dazu haben wir uns für häufige Krankheiten entschieden, von denen eine mit typischen Anzeichen und Symptomen auftrat, die andere mit einem atypischen Erscheinungsbild. Unser Ziel war es, die Ergebnisse angemessen gegenüberzustellen und vergleichen zu können. Da wir den potenziellen Nutzen von CDSSs in einem Bildungsumfeld untersuchen wollten, brauchten wir Krankheiten, mit denen die Schüler vertraut sind und die den Stand ihres Wissens widerspiegeln. Wir entschieden uns für den gängigen und allgemein akzeptierten Ansatz, klinische Fallvignetten zu verwenden, um die Genauigkeit und das Vertrauen der Studierenden zu testen [28, 29].

Wir erwarteten von den Studierenden, dass sie den Fall mit der typischen Darstellung einer häufigen Erkrankung mit größerer diagnostischer Genauigkeit lösen als den Fall mit der atypischen Darstellung, unabhängig davon, ob sie konventionelle Methoden wie oben definiert oder ein CDSS verwendeten. Unsere Haupthypothese war, dass Diagnosen mit herkömmlichen Methoden im Durchschnitt genauer waren als Diagnosen mit einem CDSS, da die Studierenden mit den CDSSs und ihrem Ansatz zur angemessenen Verwendung dieser Software noch nicht vertraut waren. Darüber hinaus haben wir die Hypothese aufgestellt, dass Studierende größeres Vertrauen in ihre eigene diagnostische Genauigkeit haben würden, wenn sie sich auf CDSS verlassen, da ihnen in dieser frühen Phase ihrer Karriere als zukünftige Ärzte die persönliche Erfahrung in der medizinischen Entscheidungsfindung fehlt.

Die Studie wurde beim Open Science Framework vorregistriert [30]. Die Ethikkommission der Charité stimmte der Studie zu.

Wir haben Medizinstudenten im 4. und 5. Studienjahr (Semester 7 bis 10) untersucht. Das Medizinstudium an unserer Universität dauert insgesamt sechs Jahre, wobei das letzte Jahr ein Praxisjahr ist. Da wir über ein integriertes Curriculum verfügen, gibt es keine strikte Trennung zwischen präklinischen und klinischen Studien. Wir haben nur fortgeschrittenere Studierende einbezogen, da die Aufgabe, diagnostische Aussagen zu treffen, für Studierende zu Beginn ihres Studiums viel zu anspruchsvoll wäre. Auf diese Weise haben wir eine relativ homogene Stichprobe von Studierenden erstellt. Die Beurteilung erfolgte im Rahmen von Peer-Teaching-Tutorials, die drei Stunden dauerten. Den Studierenden wird ein breites Spektrum an Wahlpflichtfächern angeboten, aus denen sie entsprechend ihren eigenen Interessen aktiv wählen können. Am Ende unseres Studiums erhielten die Studierenden vier Tutorial-Credit-Points, von denen sie in den ersten fünf Studienjahren 60 Credits erwerben müssen. Leistungspunkte haben keinen Einfluss auf die Noten der Studierenden. Jedes Tutorium war auf 20 Teilnehmer begrenzt, um eine angemessene Betreuung zu gewährleisten und die aktive Teilnahme der Teilnehmer von April 2020 bis November 2020 sicherzustellen. Studierende, die unsere Einschlusskriterien für die Studie nicht erfüllten, wurden jedoch nicht vom Tutorium selbst ausgeschlossen. In allen unseren Kursen hielten die gleichen zwei Dozenten, eine studentische Peer-Lehrerin im 4. Jahr ihres Medizinstudiums und eine erfahrene Dozentin, das Tutorial in einem digitalen Format über Microsoft Teams ab, da die Vorschriften bezüglich der CoViD-19-Pandemie dies nicht zuließen physikalische Einstellung. Die Tutorien werden an unserer Hochschule grundsätzlich von studentischen Peer-Teachern gehalten. Im Fall unserer Studie haben wir einen erfahrenen Dozenten hinzugezogen, der alle mit der Studie verbundenen Aspekte erläutert, um den sachlichen Unterricht durch den studentischen Peer-Teacher von den technischen Details der Studie zu trennen. Die Schüler wurden gebeten, ihre Kameras eingeschaltet zu lassen, um sowohl eine Klassenzimmeratmosphäre als auch die Aufsicht zu gewährleisten. Zu Beginn eines Kurses führten die Dozenten die teilnehmenden Studenten in die Verwendung des CDSS ein, um eine funktionierende Anwendung sicherzustellen. Nachdem sich alle Teilnehmer mit dem CDSS vertraut gemacht hatten, wurde einer der Papierhüllen zusammen mit einem Fragebogen mithilfe der Software Unipark® zur Verfügung gestellt. Wir stellten den Studierenden vor ihrer Teilnahme ein Informationsblatt zur Verfügung und gaben ihnen Zeit für Fragen. Darin haben wir die Studierenden darüber informiert, dass ihre Teilnahme freiwillig ist und dass ein vorzeitiger Abbruch des Studiums keine negativen Folgen nach sich zieht, d. h. die Studierenden erhalten weiterhin ihre Credit Points für das Tutorium. Wir haben die Studierenden auch darüber informiert, dass ihre Daten ohne die Möglichkeit einer späteren Identifizierung von Personen erhoben werden und dass sie in anonymisierter Form veröffentlicht werden können.

An einem Pilotdurchlauf der Studie nahmen 34 Medizinstudierende (73 % weiblich) im Alter von M = 25,29 Jahren (SD = 4,15 Jahre) im Semester M = 8,31 (SD = 1,82) teil. Der potenzielle Nutzen des CDSS im Allgemeinen wurde vor der Studie nicht mit den Studierenden besprochen. Den Studierenden wurde innerhalb des Tutoriums 60 Minuten Zeit gegeben, ihren jeweiligen Fall unter beiden Bedingungen zu lösen. Fall und Reihenfolge wurden vor jedem Tutorial-Termin zufällig ausgewählt. Die Teilnahme am Studium selbst war freiwillig und hatte keinen Einfluss auf die Anrechnung von Leistungspunkten, sofern eine aktive Mitarbeit im weiteren Verlauf des Studiums gewährleistet war. Wir haben während der Kurse keine endgültigen Diagnosen gestellt, um die Ergebnisse zu späteren Zeitpunkten des Tutorials nicht zu verfälschen. Nach dem Pilotdurchlauf haben wir den Fragebogen angepasst, um die Fallbeschreibung wiederholt in den beiden subjektinternen Bedingungen aufzunehmen und einige Formulierungen in den Anweisungen zu spezifizieren. Das Feedback nach dem Pilotlauf war, dass 60 Minuten ausreichten, um die gestellte Aufgabe zu lösen. Der Prozess selbst blieb für die Hauptstudie derselbe.

Die Studie wurde als 2x2x2 Cluster-randomisierte Kontrollstudie zwischen und innerhalb von Probanden angelegt. Die teilnehmenden Studierenden wurden in Gruppen eingeteilt und diese Gruppen wurden je nach Fall und Reihenfolge zufällig einer von vier Bedingungen zugeordnet. Die beiden Papierfälle zwischen den Faktoren waren eine häufige Erkrankung in typischer Darstellung (Mandelentzündung mit Halsschmerzen und geschwollenen roten Mandeln, bedeckt von einem weißen Exsudat = Fall 1 [der Fall wurde aus einer fallbasierten Lernstichprobe unserer Universität übernommen]) und a häufige Erkrankung mit atypischem Erscheinungsbild [31] (Lungenembolie mit Schmerzen im Oberbauch = Fall 2 [32]). Zusätzlich zu den Leitsymptomen wurden in beiden Fällen eine kurze Anamnese sowie die wesentlichen diagnostischen Befunde zum Zeitpunkt der Konsultation dargestellt. Jeder Teilnehmer musste seinen jeweiligen Fall zweimal lösen – einmal mit Hilfe eines CDSS und einmal mit herkömmlichen Methoden (innerhalb des Faktors). Den Studierenden war der Schwierigkeitsgrad völlig unbekannt und sie wussten überhaupt nicht, ob die Papierfallpatienten eine typische Konstellation aufwiesen oder nicht. Konventionelle Methoden wurden spezifiziert, welche verwendet werden können (Lehrbücher, Forschungsliteratur, Internetrecherche und ähnliche Ressourcen), jedoch nicht explizit in Bezug auf z. B. die Reihenfolge angegeben, in der diese Materialien verwendet werden sollen, sodass die Schüler jeden ihnen vertrauten Ansatz verwenden können im Rahmen eines Tutorials zur Lösung der Aufgabe. Herkömmliche Methoden schlossen die Verwendung des CDSS ausdrücklich aus. Die Reihenfolge (CDSS zuerst, konventionelle Methoden als zweites oder konventionelle Methoden zuerst, CDSS als zweites) war der zweite Zwischenfaktor. Abbildung 1 zeigt die unterschiedlichen Bedingungen und Reihenfolgen unseres Designs und die resultierenden Gruppen für jeden Fall und jede Reihenfolge der verwendeten Methoden.

Design des Experiments und anschließende Gruppierung. Die Gruppen A, B, C und D präsentieren die vier Bedingungen basierend auf dem Zwischen-Faktor-Fall (typische Präsentation vs. atypische Präsentation) und der Zwischen-Faktor-Reihenfolge (CDSS zuerst oder konventionelle Methode zuerst). Die Gruppen A und B lösten Fall 1 in umgekehrter Reihenfolge der Aufgabe und die Gruppen C und D lösten Fall 2 entsprechend

Wir haben die für unsere Studie erforderliche Stichprobengröße mithilfe von G*Power 3.1 [33] auf der Grundlage der folgenden Kriterien berechnet: d = 0,50, α = 0,05, 1-β = 0,80 und kamen so zu einer erforderlichen Stichprobengröße von n = 34 pro Gruppe, N = insgesamt 136. Da wir von einer Abbrecherquote von 20 % ausgingen, wollten wir 164 Teilnehmer rekrutieren. Wir haben die beiden Pilot-Tutorials verwendet, um die mittlere Differenz für den Inner-Subjekt-Effekt (CDSS vs. konventionelle Methoden) zu bewerten.

Als CDSS verwendeten die Teilnehmer den Symptomchecker Ada® Versionen 3.3.0 bis 3.7.0 der Ada Health GmbH. Wir haben uns für die kostenlose App Ada® entschieden, die problemlos in den jeweiligen App-Stores für Android- und iOS-basierte Smartphones erhältlich ist. Außerdem ahmt der fragenbasierte Ansatz von Ada® bis zu einem gewissen Grad die herkömmliche medizinische Anamnese zur Erfassung von Anzeichen und Symptomen nach. Nach der Bereitstellung grundlegender Gesundheitsinformationen gibt der Benutzer die Hauptbeschwerden ein. Ada® stellt dann eine Reihe von Folgefragen über eine Argumentationsmaschine, die ihre Fragen, Diagnosen und Empfehlungen auf Wahrscheinlichkeitsschätzungen und ihrer medizinischen Wissensdatenbank basiert [34]. Für diese Studie haben die Studierenden die Informationen basierend auf der zugewiesenen Fallvignette in die Anwendung eingegeben.

Der Fragebogen enthielt 63 Items. Nach der Einverständniserklärung wurden die Studierenden angewiesen, zunächst das CDSS (Gruppen A und C) oder alternativ konventionelle Methoden (Gruppen B und D) zu verwenden, um auf der Grundlage des Papierfalls eine Diagnose zu stellen. Anschließend stellten die Teilnehmer bis zu drei Diagnosen, jeweils begleitet von einem Hinweis darauf, wie sicher sich die Studierenden angesichts ihrer eigenen Diagnosen fühlten (0–100 % für die konventionelle Falllösung oder „_ von 10“ bis „_ von 1.000“ Patienten). auf der CDSS-Ausgabe). Die gleiche Fallbeschreibung wurde ein zweites Mal mit der Anweisung bereitgestellt, konventionelle Methoden (Gruppen A und C) oder das CDSS (Gruppen B und D) zu verwenden, also diejenigen Methoden, die im ersten Durchgang nicht verwendet wurden. Auch hier konnten die Teilnehmer bis zu drei Diagnosen zusammen mit der entsprechenden Einschätzung des Vertrauens in ihre eigenen Diagnosen angeben. Wenn die Schüler herkömmliche Methoden anwenden mussten, mussten sie angeben, welche Ressourcen sie besuchten. Soziodemografische Informationen rundeten den Online-Fragebogen mit Fragen zu Alter, Geschlecht, Studiensemester und medizinischer Vorerfahrung sowie einer Frage mit der Bitte um weitere Kommentare ab.

Drei externe Fachärzte für Allgemeinmedizin, Innere Medizin und Hals-Nasen-Ohrenheilkunde beurteilten die Richtigkeit der von den Studierenden vorgeschlagenen Diagnosen. Jeder Experte erhielt alle Diagnosen für beide Fälle (N = 46 für Fall 1 und N = 98 für Fall 2), die Fallbeschreibungen und zehn zusätzliche Diagnosen, die für jeden Fall zufällig aus dem ICD-10 ausgewählt wurden. Dieses letztgenannte Verfahren stellte sicher, dass die Beurteilung der Genauigkeit sowohl in der typischen als auch in der atypischen Darstellung absolut und nicht relativ war und ähnlich kalibriert war. Jede Diagnose wurde auf einer Skala von 1 (falsch) bis 5 (richtig) bewertet, wobei das Organsystem und der Krankheitsmechanismus als Bezugspunkte dienten, und basierte auf Studien, die unseren eigenen ähnelten [35, 36]. Wenn beides richtig war, wurde die Diagnose mit 5 Punkten bewertet; waren beide falsch, wurde die Diagnose mit 1 Punkt bewertet; War das eine richtig, das andere falsch, erhielt die Diagnose 3 Punkte. Die Punkte 2 und 4 berücksichtigten die in der medizinischen Praxis üblichen Grauzonen, weshalb wir uns für die Einbindung der drei externen Experten entschieden haben. Anhand des Medianwerts der drei Experten wurden die Endwerte für jede Diagnose ermittelt. Die Diagnose mit der höchsten Punktzahl für jeden Teilnehmer in jeder Erkrankung wurde in die Analyse einbezogen.

Wir haben die folgenden Maßnahmen ergriffen, um mögliche Auswirkungen der Störfaktoren, die unsere Studie beeinflusst haben könnten, abzumildern: Wir haben die Studenten nach dem Zufallsprinzip den Fällen und der Reihenfolge zugeordnet und dabei die Möglichkeit einer Selektionsverzerrung berücksichtigt, wie sie einige Studenten unserer Fakultät möglicherweise bereits zuvor hatten Erfahrung mit fortschrittlichen technologischen Systemen und waren technisch versierter als andere und waren daher mehr am Thema des Tutorials und unserer Studie interessiert. Wir glauben jedoch, dass technische Kompetenz nicht dazu beiträgt, genauere Diagnosen zu stellen. Obwohl spätere Versionen des CDSS möglicherweise zu besseren Ergebnissen geführt haben, wurden zwischen den verschiedenen Versionen des CDSS keine signifikanten Unterschiede in der diagnostischen Genauigkeit beobachtet. Studierende, die zu einem späteren Zeitpunkt teilgenommen haben, könnten aufgrund ihrer Interaktion mit Studierenden, die zu einem früheren Zeitpunkt an der Studie teilgenommen haben, Kenntnis von den Fällen gehabt haben. Es ist wichtig zu beachten, dass wir alle Studierenden ausdrücklich angewiesen haben, die Studie nicht mit anderen interessierten Studierenden zu besprechen und während der Übungen keine Diagnosen offenzulegen. Schließlich ist es möglich, dass Studierende, die sich in einem späteren Stadium ihres Medizinstudiums befanden, im Vergleich zu Studierenden in einem früheren Stadium über ein höheres Leistungsniveau verfügten. Unsere Ergebnisse zeigten jedoch keinen signifikanten Effekt.

Wir haben den Prozentsatz der fehlenden Daten im Datensatz ermittelt und den MCAR-Test (Missing Completely At Random) nach Little berechnet, um zu überprüfen, ob fehlende Daten zufällig auf die Variablen verteilt waren. Wir verwendeten T-Tests mit unabhängigen Stichproben für geschlechtsspezifische Unterschiede bei allen Ergebnissen, um mögliche geschlechtsspezifische Auswirkungen auf unsere Analysen zu prüfen. Um die Primärhypothese zu testen, haben wir einen t-Test mit gepaarten Stichproben zwischen der CDSS-Bedingung und der konventionellen Bedingung berechnet. Anschließend suchten wir mithilfe einer gemischten Varianzanalyse (ANOVA) nach den Auswirkungen von Fall (Schwierigkeit) und Reihenfolge (CDSS/konventionell zuerst). Für das Vertrauen in die Diagnosen zwischen den Fällen haben wir einen t-Test für unabhängige Stichproben zwischen Fall 1 und Fall 2 berechnet. Für das Vertrauen in die Diagnosen je nach Reihenfolge haben wir einen t-Test für gepaarte Stichproben berechnet, indem wir die Gruppen A und B mit den Gruppen C verglichen haben und D. Für die Auswirkungen von Fall und Reihenfolge auf das Vertrauen in die Diagnosen verwendeten wir dann eine univariate ANOVA. Wir verwendeten SPSS 27.0 mit den entsprechenden Effektgrößenberechnungen und der paarweisen Löschung für alle Analysen. Zur Veranschaulichung unserer Ergebnisse in Tabellen und Abbildungen haben wir die deskriptive Statistik der Mittelwerte und Standardabweichungen genutzt.

An der Studie nahmen 213 Medizinstudierende der Charité – Universitätsmedizin Berlin teil. Wir haben 47 Studenten ausgeschlossen, weil sie die Einschlusskriterien hinsichtlich ihres Studienjahres nicht erfüllten, zuvor am Tutorial teilgenommen hatten oder weil sie mit der Ada Health GmbH verbunden waren. Die restlichen N = 166 Studierenden (57 % weiblich) im Alter M = 25,31 Jahre (SD = 4,49 Jahre) wurden in die Analyse einbezogen. Tabelle 1 zeigt die Verteilung auf die vier Gruppen.

Die Randomisierung ergab eine gleiche Verteilung hinsichtlich Alter und Semester, jedoch eine ungleiche Verteilung des Geschlechts in den vier Gruppen. Dementsprechend haben wir die geschlechtsspezifischen Unterschiede in unseren Ergebnissen analysiert. Tabelle 2 enthält Ergebnisse für drei T-Tests. Männer und Frauen unterschieden sich hinsichtlich ihrer Genauigkeit mit dem CDSS oder mit herkömmlichen Methoden nicht signifikant. Auch hinsichtlich des Vertrauens in ihre Diagnose unterschieden sie sich nicht wesentlich. Wir glauben daher nicht, dass die ungleiche Verteilung der Geschlechter einen Einfluss auf die Ergebnisse unserer Studie hinsichtlich der Genauigkeit und des Vertrauens in die Diagnosen hat.

Der endgültige Datensatz enthielt 3 % fehlende Daten. Der MCAR-Test von Little lieferte signifikante Ergebnisse (χ2 = 2408,58, df = 2221, p = 0,003), was bedeutet, dass Daten nicht völlig zufällig fehlten. Dementsprechend haben wir alle Variablen mit fehlenden Daten auf fehlende Muster überprüft und das Muster identifiziert, dass die Genauigkeits- und Vertrauenswerte der zweiten und dritten CDSS-Diagnose in den jeweiligen Paaren immer fehlten. Zusammen machten diese Variablen mehr als 50 % der fehlenden Daten aus. Daher haben wir die Variablen aus unserer Analyse fehlender Daten ausgeschlossen, um Muster zu identifizieren, die über diese technische Kovariation hinausgehen. Nach Ausschluss der Variablen lieferte der MCAR-Test von Little nicht signifikante Ergebnisse (χ2 = 1159,57, df = 1095, p = 0,086). Daher gingen wir davon aus, dass Daten in unserem Datensatz zufällig völlig fehlten.

Die häufigsten Informationsquellen in den konventionellen Gruppen waren Websites (69 %) und analoge Lehrbücher (9 %). Die meistbesuchte Website war Amboss – ein deutsches, digitalisiertes, lehrbuchähnliches Hilfsmittel, das Medizinstudenten vor allem zur Vorbereitung auf die bundesweiten Approbationsprüfungen für alle Bereiche der Medizin nutzen (79 %), gefolgt vom deutschen medizinischen Wiki DocCheck Flexikon (19 %) und Wikipedia (4 %). Zwanzig Teilnehmer (12 %) gaben an, den Fall selbstständig und ohne weitere Hilfsmittel gelöst zu haben.

Abbildung 2 zeigt die Ergebnisse unserer Primärhypothese zur diagnostischen Genauigkeit. Die Diagnosen für konventionelle Ressourcen ähnelten der Verwendung von CDSS in allen Fällen und zwischen den einzelnen Fällen. Die Diagnosen für Fall 1 waren sowohl mit konventionellen Methoden als auch mit dem CDSS deutlich genauer als Fall 2. Für Fall 1 erzielten 81 von 83 Schülern eine Genauigkeit von 5 und die anderen beiden Schüler eine Genauigkeit von 4 Punkten. Im Fall 2 wurde einer von 82 Schülern mit einer Punktzahl von 5 und 29 mit einer Punktzahl von 4 belohnt.

Genauigkeit der Diagnosen. Die Balken zeigen die mittlere diagnostische Genauigkeit für beide Methoden (konventionell und CDSS) über Fälle hinweg (linke Seite) sowie innerhalb von Fällen (rechte Seite). Es gibt keinen statistisch signifikanten Unterschied in der Genauigkeit zwischen und innerhalb von Fällen bei der konventionellen Diagnose im Vergleich zum CDSS. Mit beiden Methoden stellten die Studierenden in Fall 1 genauere Diagnosen als in Fall 2. ****, p < .0001 (signifikant), ns, nicht signifikant. Die Anzahl der einzelnen Studierenden in jeder Kohorte ist in jeder Leiste angegeben. Whiskers zeigen Standardabweichungen an, die 68 % der Werte um den Mittelwert ausmachen

Tabelle 3 zeigt die gemischten ANOVA-Ergebnisse für die diagnostische Genauigkeit, die konventionell/CDSS-Bedingung innerhalb der Subjekte und die beiden Bedingungen Fall und Reihenfolge zwischen Subjekten als unabhängige Variablen. Nur der Zwischensubjekt-Bedingungsfall hatte einen signifikanten Einfluss auf die Genauigkeit der Diagnose.

Spätere Versionen 6.0 und 7.0 des CDSS lieferten in ANOVAs keine genaueren Diagnosen als frühere Versionen 4.0 und 5.0 für Fall 1 (F(3,72) = 0,74, p = 0,53, n4,0 = 24, n5,0 = 24). , n6,0 = 17, n7,0 = 11) oder Fall 2 (F(3,65) = 1,66, p = 0,19, n4,0 = 9, n5,0 = 13, n6,0 = 24, n7. 0 = 23), noch schnitten Studierende der höheren Semester 9 oder 10 in ANOVAs im Fall 1 besser ab (F(3,79) = 0,47, p = 0,71, n7 = 15, n8 = 20, n9 = 31, n10 = 17 ) oder Fall 2 (F(3,78) = 0,77, p = 0,51, n7 = 25, n8 = 13, n9 = 29, n10 = 15) als ihre weniger erfahrenen Kommilitonen im 7. oder 8. Semester.

Abbildung 3 zeigt die Ergebnisse unserer Haupt- und zweiten Hypothese für das sekundäre Ergebnis Vertrauen. Das Vertrauen der Studierenden in die eigene Diagnose war im Fall 1 höher. Hinsichtlich der Reihenfolge der Diagnosen konnte kein Einfluss auf das Vertrauen festgestellt werden.

Das Vertrauen der Studierenden in eigene Diagnosen. Die Balken zeigen das Vertrauen der Schüler in ihre eigenen Diagnosen (konventioneller Zustand) zwischen den Fällen (linke Seite) und in Bezug auf die Reihenfolge der Methoden zwischen den Faktoren (rechte Seite). Das Vertrauen der Studierenden in die eigene Diagnose war in Fall 1 im Vergleich zu Fall 2 deutlich höher. Beim Vergleich der Reihenfolge der Diagnosestellung konnte kein signifikanter Effekt festgestellt werden. ****, p < .0001 (signifikant), ns, nicht signifikant. Die Anzahl der einzelnen Studierenden in jeder Kohorte ist in jeder Leiste angegeben. Whiskers zeigen Standardabweichungen an, die 68 % der Werte um den Mittelwert ausmachen

Abbildung 4 und Tabelle 4 verdeutlichen einige Interaktionseffekte im Hinblick auf das Vertrauen der Studierenden in ihre eigene Diagnose mit den beiden Zwischensubjektbedingungen Fall und Reihenfolge als unabhängige Variablen. Der Effekt war jedoch in beiden Fällen nicht signifikant.

Vergleich des Vertrauens der Studierenden in eigene Diagnosen innerhalb von Fällen. Die Balken zeigen das Vertrauen der Studierenden in ihre eigenen Diagnosen für Fall 1 (linke Seite) und Fall 2 (rechte Seite). Die Gruppen unterscheiden sich in der Reihenfolge der Methoden (konventionell vs. CDSS). In keinem Fall gab es einen signifikanten Einfluss der Methodenreihenfolge. ns, nicht signifikant. Die Anzahl der einzelnen Studierenden in jeder Kohorte ist in jeder Leiste angegeben. Whiskers zeigen Standardabweichungen an, die 68 % der Werte um den Mittelwert ausmachen

Studierende in höheren Semestern vertrauten ihren Diagnosen in ANOVAs für Fall 1 nicht mehr als Studierende in niedrigeren Semestern (F(3,79) = 2,59, p = 0,06, n7 = 15, n8 = 20, n9 = 31, n10 = 17) oder Fall 2 (F(3,76) = 0,83, p = 0,48, n7 = 24, n8 = 13, n9 = 28, n10 = 15).

Unser Ziel war es, die diagnostische Genauigkeit und das Vertrauen der Studierenden in ihre Diagnosen mithilfe konventioneller Methoden und eines CDSS in zwei klinischen Szenarien mit unterschiedlichen Schwierigkeitsgraden zu bewerten. Wenn es sich um eine häufige Erkrankung mit typischen Anzeichen und Symptomen handelte, erreichten die Studierenden ein sehr hohes Maß an diagnostischer Genauigkeit von nahezu 100 %. Im Falle einer häufigen Erkrankung mit atypischem Verlauf verringerte sich die Genauigkeit der Schüler erheblich. In beiden Szenarien stellten wir keinen signifikanten Unterschied in der Genauigkeit fest, wenn die Schüler herkömmliche Methoden verwendeten oder sich auf die Ergebnisse des CDSS verließen. Dieses Ergebnis führt uns dazu, unsere ursprüngliche Hypothese zu widerlegen, dass Studierende mit konventionellen Methoden zu genaueren Diagnosen kommen würden als mit der Verwendung eines CDSS.

Offensichtlich gab es zwischen den beiden Fällen einen relevanten Unterschied im Vertrauen der Studierenden in ihre eigenen Diagnosen: Im typischen Fall zeigten die Studierenden ein höheres Vertrauen in ihre Diagnosen, während das Vertrauen im atypischen Fall viel geringer war. Aber im krassen Gegensatz zu der sehr hohen Genauigkeit, mit der sie den typischen Fall lösten, hatten die Studierenden viel weniger Vertrauen in ihre eigene Diagnose. Umgekehrt entsprachen im Fall der atypischen Präsentation die durchschnittlichen Genauigkeitsbewertungen den durchschnittlichen Vertrauensbewertungen. Darüber hinaus beobachteten wir einen weiteren leichten, wenn auch statistisch nicht signifikanten Einfluss auf das Vertrauen der Studierenden in ihre Diagnosen: Letzteres war geringer, wenn das CDSS zuerst für den typischen Fall verwendet wurde, und höher, wenn sie das CDSS zuerst für den atypischen Fall verwendeten .

Unsere Ergebnisse deuten darauf hin, dass die diagnostische Genauigkeit von Studierenden bei häufigen Krankheiten stark vom Vorhandensein typischer Anzeichen und Symptome abhängt und weniger von der technischen Unterstützung abhängt. Die im typischen Fall beobachtete Genauigkeit zeigt, dass Studierende in der Lage sind, eine lehrbuchähnliche Präsentation, mit der sie vertraut sind, korrekt zu diagnostizieren. Im Gegensatz dazu nimmt ihre diagnostische Leistung ab, wenn sie mit einem atypischen Erscheinungsbild konfrontiert werden, selbst wenn es sich um eine häufige Erkrankung handelt. Diese Beobachtung verdeutlicht die Herausforderungen, denen sich Studierende bei der Erkennung ungewöhnlicher Manifestationen häufiger Krankheiten gegenübersehen.

Wir können zeigen, dass das CDSS nicht besonders dazu beigetragen hat, die Fähigkeit der Studierenden zu verbessern, zu präzisen diagnostischen Schlussfolgerungen zu gelangen. Allerdings kann das CDSS eine wichtige Rolle dabei spielen, das Vertrauen der Studierenden zu stärken, insbesondere wenn Studierende mit komplexeren Fällen konfrontiert werden. In diesen Szenarien kann das CDSS fast wie eine zweite Meinung und als Quelle der Beruhigung fungieren, die den Studierenden mehr Vertrauen in ihren eigenen diagnostischen Entscheidungsprozess gibt. In diesem Sinne kann der Einsatz des CDSS eine wertvolle psychologische Unterstützung als Instrument zur Stärkung des Selbstvertrauens und der Entscheidungsfähigkeit der Schüler bieten. Daher wäre es in Zukunft hilfreich, die psychologischen und pädagogischen Auswirkungen von CDSS in verschiedenen Diagnoseszenarien und mit größeren Stichprobengrößen genauer zu untersuchen. Darüber hinaus zeigt unsere Studie auf beispielhafte Weise, wie ein Versuchsaufbau funktionieren könnte, um andere Dimensionen der diagnostischen Genauigkeit von Studenten zu bewerten, z. B. seltene Krankheiten oder Diagnosen in morphologischen Bereichen wie Radiologie oder Pathologie.

Der Fokus der Forschung rund um unterstützende Geräte zur medizinischen Entscheidungsfindung lag bisher fast ausschließlich auf seltenen Erkrankungen oder anspruchsvollen und ungewöhnlichen klinischen Konstellationen [21]. Aufgrund dieser eher engen Perspektive haben wir häufige Krankheiten mit unterschiedlichen Darstellungen ausgewählt, um den Wissensstand der Schüler und ihren Bildungskontext besser widerzuspiegeln, da die Schüler zu ihren eigenen diagnostischen Schlussfolgerungen kommen mussten, anstatt eine Diagnose aus einer Reihe vorgefertigter Diagnosen auszuwählen Dies ist beispielsweise bei Multiple-Choice-Fragen der Fall, die in der medizinischen Ausbildung häufig verwendet werden [37]. Wir glauben, dass unser Ansatz eine umfassendere Untersuchung der Auswirkungen von CDSSs im Kontext häufiger vorkommender klinischer Szenarien in der medizinischen Ausbildung ermöglichte, da die Studierenden gerade erst lernen, wie man Subjektivität klassifiziert, bewertet, gewichtet, interpretiert und schließlich synthetisiert Beschwerden und objektive klinische Anzeichen, wie Bowen zeigte [5].

Wir halten es außerdem für eine besondere Stärke unserer Studie, dass wir die diagnostische Genauigkeit nicht dichotom gemessen haben und nur zwischen richtig und falsch unterschieden haben. Um unsere Ergebnisse zu verfeinern, haben wir eine Skala von 1 bis 5 entwickelt, die auf Ramnarayan et al. basiert. [35] und Bond et al. [36], das Parameter wie betroffene Organsysteme und Krankheitsmechanismen berücksichtigt. In der klinischen Praxis gibt es im Allgemeinen viel mehr Nuancen zwischen einer völlig richtigen und einer völlig falschen Diagnose. Außerdem spiegelt ein abgestuftes Spektrum teilweise richtiger Antworten die verschiedenen Aspekte, die die Studierenden in ihrer diagnostischen Argumentation zusammenfassen müssen, viel besser wider. Daher wird der Weg zum Diagnostiker durch die von uns verwendete Skala viel besser widergespiegelt als durch eine ausschließlich richtige – falsche Alternative. Offensichtlich kann eine solche Skala für andere Forschungszwecke je nach den eventuellen Forschungsfragen, um die es geht, auf unterschiedliche Weise modifiziert werden. Eine solche Skala kann auch als Instrument zur Bewertung potenzieller Fortschritte in der Lernkurve einer Person verwendet werden. Zweifellos sind weitere Studien erforderlich, um auch die Gültigkeit unseres Ansatzes zu testen.

Eine wesentliche methodische Einschränkung unserer Studie hängt mit der Tatsache zusammen, dass die Studierenden lediglich angewiesen wurden, das CDSS nicht zu verwenden, wenn sie aufgefordert wurden, herkömmliche Methoden zu verwenden. Dies führte dazu, dass die Mehrheit der Studierenden verschiedene Online-Dienste wie Amboss oder DocCheck Flexikon nutzte und nur eine Minderheit auf gedruckte Lehrbücher und Leitfäden zurückgriff, andere Studierende suchten überhaupt keine zusätzliche Hilfe. Somit besteht das konventionelle Krankheitsbild aus einem breiteren und viel heterogeneren Spektrum überwiegend digitalisierter Ressourcen, mit denen Medizinstudierende insgesamt vertraut sind. Daher haben die Studierenden möglicherweise sehr unterschiedliche Informationen abgerufen, um zu einer diagnostischen Schlussfolgerung zu gelangen, während die Verwendung des CDSS einen einheitlichen Weg darstellt.

Zusammenfassend lässt sich sagen, dass die Verwendung eines CDSS die diagnostische Genauigkeit nicht wesentlich verbesserte. Dennoch kann der Einsatz einer solchen Software eine interessante und auch relevante Rolle dabei spielen, das Vertrauen der Studierenden in herausfordernde klinische Konstellationen zu stärken. Wir haben auch beobachtet, dass Studierende in einfachen, typischen Fällen dazu neigen, ihr eigenes Wissen zu unterschätzen, während sie sich in anspruchsvollen, atypischen Fällen viel stärker ihrer Grenzen bewusst sind. Unsere Ergebnisse unterstreichen auch die Bedeutung der Berücksichtigung sowohl objektiver als auch subjektiver Parameter bei der Bewertung der Wirksamkeit von CDSS. Durch den Einsatz von CDSS in der medizinischen Ausbildung könnten Ausbilder schließlich die Integration dieser Technologie in die Ausbildung zukünftiger Ärzte optimieren.

Der Datensatz, der die Schlussfolgerungen dieses Artikels stützt, ist im Open Science Framework verfügbar, [https://osf.io/aegcp/files/osfstorage].

Klinisches Entscheidungsunterstützungssystem

Bei einem Zufallstest fehlt Little komplett

Varianzanalyse

Ausschuss des Institute of Medicine (US) für die Qualität der Gesundheitsversorgung in Amerika. In: Kohn LT, Corrigan JM, Donaldson MS, Herausgeber. Irren ist menschlich: Aufbau eines sichereren Gesundheitssystems. Washington (DC): National Academies Press (USA); 2000.

Balogh EP, Miller BT, Ball JR, Ausschuss für Diagnosefehler im Gesundheitswesen; Vorstand für Gesundheitsdienste; Institut für Medizin. Verbesserung der Diagnose im Gesundheitswesen. Washington (DC): National Academies Press (USA); 2015.

Brush JE Jr., Lee M., Sherbino J., Taylor-Fishwick JC, Norman G. Auswirkung des Lehrens bayesianischer Methoden unter Verwendung von Lernen nach Konzepten vs. Lernen nach Beispielen auf die Fähigkeit von Medizinstudenten, die Wahrscheinlichkeit einer Diagnose abzuschätzen: Eine randomisierte klinische Studie. JAMA Netw Open. 2019;2(12):e1918023.

Artikel Google Scholar

Chamberland M, Setrakian J, St-Onge C, Bergeron L, Mamede S, Schmidt HG. Verbessert die Bereitstellung der richtigen Diagnose als Feedback nach der Selbsterklärung die diagnostische Leistung von Medizinstudierenden? BMC Med Educ. 2019;19(1):194.

Artikel Google Scholar

Bowen JL. Bildungsstrategien zur Förderung des klinisch-diagnostischen Denkens. N Engl J Med. 2006;355(21):2217–25.

Artikel Google Scholar

Braun LT, Zottmann JM, Adolf C, Lottspeich C, Then C, Wirth S, et al. Repräsentationsgerüste verbessern die diagnostische Effizienz bei Medizinstudenten. Medizinische Ausbildung. 2017;51(11):1118–26.

Artikel Google Scholar

Eva KW. Was jeder Lehrer über klinisches Denken wissen muss. Medizinische Ausbildung. 2005;39(1):98–106.

Artikel Google Scholar

Braun LT, Borrmann KF, Lottspeich C, Heinrich DA, Kiesewetter J, Fischer MR, et al. Richtig raten – ob und wie Medizinstudierende ihre richtigen Diagnosen falsch begründen. GMS J Med Educ. 2019;36(6):Doc85.

Google Scholar

Han R, Yu W, Chen H, Chen Y. Verwendung eines Leseetikettensystems mit künstlicher Intelligenz in der Einstufungsschulung für diabetische Retinopathie für Assistenzärzte in der Augenheilkunde und Medizinstudenten. BMC Med Educ. 2022;22(1):258.

Artikel Google Scholar

Kwan JL, Lo L, Ferguson J, Goldberg H, Diaz-Martinez JP, Tomlinson G, et al. Computergestützte klinische Entscheidungsunterstützungssysteme und absolute Verbesserungen in der Pflege: Metaanalyse kontrollierter klinischer Studien. BMJ. 2020;370:m3216.

Artikel Google Scholar

Chambers D, Cantrell AJ, Johnson M, Preston L, Baxter SK, Booth A, et al. Digitale und Online-Symptomprüfer und Gesundheitsbewertungs-/Triage-Dienste für dringende Gesundheitsprobleme: Systematische Überprüfung. BMJ offen. 2019;9(8):e027743.

Artikel Google Scholar

Middleton B, Sittig DF, Wright A. Klinische Entscheidungsunterstützung: Eine 25-Jahres-Retrospektive und eine 25-Jahres-Vision. Yearb Med Inform. 2016;Suppl 1(Suppl 1):S103–16.

Google Scholar

Nash FA. Differentialdiagnose, ein Gerät zur Unterstützung der logischen Fähigkeiten. Lanzette. 1954;266(6817):874–5.

Artikel Google Scholar

de Dombal FT. Computergestützte Diagnose akuter Bauchschmerzen. Die britische Erfahrung. Rev Epidemiol Sante Publique. 1984;32(1):50–6.

Google Scholar

de Dombal FT. Computergestützte Entscheidungsunterstützung in der klinischen Medizin. Int J Biomed Comput. 1989;24(1):9–16.

Artikel Google Scholar

Semigran HL, Linder JA, Gidengil C, Mehrotra A. Bewertung von Symptomprüfern für Selbstdiagnose und Triage: Audit-Studie. BMJ. 2015;351:h3480.

Artikel Google Scholar

Sandholzer M, Rurik I, Deutsch T, Frese T. Erwartungen von Medizinstudenten an die Implementierung eines Lehrbuchs für Familienmedizin als umfassende App in Deutschland. J Med Syst. 2014;38(10):125.

Artikel Google Scholar

Nateqi J, Lin S, Krobath H, Gruarin S, Lutz T, Dvorak T, et al. Vom Symptom zur Diagnose – Symptomprüfer neu bewertet: Sind Symptomprüfer endlich ausreichend und genau in der Anwendung? Ein Update aus HNO-Sicht. HNO. 2019;67(5):334–42.

Artikel Google Scholar

Berner ES, Maisiak RS, Cobbs CG, Taunton OD. Auswirkungen eines Entscheidungsunterstützungssystems auf die diagnostische Leistung von Ärzten. J Am Med Inform Assoc. 1999;6(5):420–7.

Artikel Google Scholar

Riches N, Panagioti M, Alam R, Cheraghi-Sohi S, Campbell S, Esmail A, et al. Die Wirksamkeit von Generatoren für elektronische Differentialdiagnosen (DDX): Eine systematische Überprüfung und Metaanalyse. Plus eins. 2016;11(3):e0148991.

Artikel Google Scholar

Berner ES, Webster GD, Shugerman AA, Jackson JR, Algina J, Baker AL, et al. Leistung von vier computerbasierten Diagnosesystemen. N Engl J Med. 1994;330(25):1792–6.

Artikel Google Scholar

Graber ML, Mathew A. Leistung eines webbasierten Systems zur Unterstützung klinischer Diagnosen für Internisten. J Gen Intern Med. 2008;23(Suppl 1):37–40.

Artikel Google Scholar

Hill MG, Sim M, Mills B. Die Qualität der Diagnose und Triage-Beratung durch kostenlose Online-Symptomprüfer und Apps in Australien. Med J Aust. 2020;212(11):514–9.

Artikel Google Scholar

Schmieding ML, Kopka M, Schmidt K, Schulz-Niethammer S, Balzer F, Feufel MA. Triage-Genauigkeit von Symptom-Checker-Apps: 5-Jahres-Follow-up-Bewertung. J Med Internet Res. 2022;24(5):e31810.

Artikel Google Scholar

Martinez-Franco AI, Sanchez-Mendiola M, Mazon-Ramirez JJ, Hernandez-Torres I, Rivero-Lopez C, Spicer T, et al. Diagnosegenauigkeit bei Assistenzärzten für Allgemeinmedizin mithilfe eines klinischen Entscheidungsunterstützungssystems (DXplain): Eine randomisierte kontrollierte Studie. Diagnose (Berl). 2018;5(2):71–6.

Artikel Google Scholar

Graber ML, Tompkins D, Holland JJ. Ressourcen, die Medizinstudierende nutzen, um eine Differenzialdiagnose abzuleiten. Med. Lehren. 2009;31(6):522–7.

Artikel Google Scholar

Kämmer JE, Schauber SK, Hautz SC, Stroben F, Hautz WE. Differentialdiagnose-Checklisten reduzieren Diagnosefehler differenziell: ein randomisiertes Experiment. Medizinische Ausbildung. 2021;55(10):1172–82. https://doi.org/10.1111/medu.14596.

Artikel Google Scholar

Diekhoff T, Kainberger F, Oleaga L, Dewey M, Zimmermann E. Wirksamkeit des klinischen Entscheidungsunterstützungstools ESR eGUIDE für die Vermittlung der geeigneten Auswahl bildgebender Tests an Medizinstudenten: randomisierte Cross-Over-Bewertung. Eur Radiol. 2020;30(10):5684–9.

Artikel Google Scholar

Shah C, Davtyan K, Nasrallah I, Bryan RN, Mohan S. Künstliche Intelligenz-gestützte klinische Entscheidungsunterstützungs- und Simulationsplattform für die Ausbildung von Radiologiepraktikanten. J-stellige Bildgebung. 2023;36(1):11–6.

Artikel Google Scholar

Wie schneiden Medizinstudenten ab, wenn sie mithilfe eines medizinischen Entscheidungsunterstützungssystems häufige Krankheiten diagnostizieren müssen? 2020 Verfügbar unter: https://osf.io/5ujy4

Goldrich M, Shah A, et al. Atypische Krankheitsbilder. In: Walter LC, Chang A, Chen P, Harper GM, Rivera J, Conant R, et al., Herausgeber. Aktuelle Diagnose und Behandlung Geriatrie, 3. New York, NY: McGraw-Hill Education; 2021.

Google Scholar

Majidi A, Mahmoodi S, Baratloo A, Mirbaha S. Atypische Darstellung einer massiven Lungenembolie, ein Fallbericht. Emerg (Teheran). 2014;2(1):46–7.

Google Scholar

Faul F, Erdfelder E, Buchner A, Lang AG. Statistische Poweranalysen mit G* Power 3.1: Tests für Korrelations- und Regressionsanalysen. Behav Res-Methoden. 2009;41:1149–60.

Artikel Google Scholar

Miller S, Gilbert S, Virani V, Wicks P. Nutzung und Wahrnehmung einer auf künstlicher Intelligenz basierenden Symptombewertungs- und Beratungstechnologie durch Patienten in einem Wartezimmer der britischen Grundversorgung: Explorative Pilotstudie. JMIR Hum-Faktoren. 2020;7(3):e19713.

Artikel Google Scholar

Ramnarayan P, Kapoor RR, Coren M, Nanduri V, Tomlinson AL, Taylor PM, et al. Messung des Einflusses der diagnostischen Entscheidungsunterstützung auf die Qualität der klinischen Entscheidungsfindung: Entwicklung eines zuverlässigen und gültigen zusammengesetzten Scores. J Am Med Inform Assoc. 2003;10(6):563–72.

Artikel Google Scholar

Bond WF, Schwartz LM, Weaver KR, Levick D, Giuliano M, Graber ML. Differentialdiagnosegeneratoren: Eine Bewertung derzeit verfügbarer Computerprogramme. J Gen Intern Med. 2012;27(2):213–9.

Artikel Google Scholar

Epstein RM. Beurteilung in der medizinischen Ausbildung. N Engl J Med. 2007;356(4):387–96.

Artikel Google Scholar

Referenzen herunterladen

Die Studie wurde in Zusammenarbeit mit der Kassenärztlichen Bundesvereinigung (KBV) durchgeführt. Die Autoren danken Maike Buchmann und Dorothea Penders (Charité Lernzentrum) für die Möglichkeit, das Online-Tutorial im Rahmen des studentischen Peer-Teaching-Programms an der Charité anzubieten; die Gutachterinnen Katharina Stölzel, Sabine Gehrke-Beck und Anna Schappert für die Diagnosebewertung, Miriam Sieg für die biometrische Beratung und Marie Lencer für die technische Unterstützung. Abschließend möchten wir uns bei den Gutachtern für ihr wertvolles Feedback bedanken.

Open-Access-Förderung ermöglicht und organisiert durch Projekt DEAL.

Jan C. Zoellick und Pascal Grosse haben gleichermaßen zu dieser Arbeit beigetragen.

Charité – Universitätsmedizin Berlin, corporate member of Freie Universität Berlin and Humboldt-Universität zu Berlin, Berlin, Germany

Sean D. Kafke, Adelheid Kuhlmey, Johanna Schuster, Stefan Blüher, Constanze Czimmeck, Jan C. Zoellick & Pascal Grosse

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Alle Autoren (SK, AK, JS, SB, CC, JZ und PG) haben die Studie konzipiert und gestaltet. SK und CC haben die Daten gesammelt. SK und JZ analysierten die Daten. SK, JZ und PG haben die erste Version des Manuskripts verfasst. Alle Autoren (SK, AK, JS, SB, CC, JZ und PG) haben zur kritischen Überarbeitung des Manuskripts beigetragen und die endgültige Version zur Veröffentlichung freigegeben.

Korrespondenz mit Sean D. Kafke.

Die Studie wurde von der Ethikkommission der Charité genehmigt (Abstimmung EA1/237/19 vom 5. Juni 2020). Alle Teilnehmer gaben ihr Einverständnis zur Teilnahme. Alle Methoden wurden in Übereinstimmung mit den relevanten Richtlinien und Vorschriften durchgeführt.

Unzutreffend.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/. Der Creative Commons Public Domain Dedication-Verzicht (http://creativecommons.org/publicdomain/zero/1.0/) gilt für die in diesem Artikel zur Verfügung gestellten Daten, sofern in einer Quellenangabe für die Daten nichts anderes angegeben ist.

Nachdrucke und Genehmigungen

Kafke, SD, Kuhlmey, A., Schuster, J. et al. Können klinische Entscheidungsunterstützungssysteme eine Bereicherung für die medizinische Ausbildung sein? Ein experimenteller Ansatz. BMC Med Educ 23, 570 (2023). https://doi.org/10.1186/s12909-023-04568-8

Zitat herunterladen

Eingegangen: 31. Mai 2023

Angenommen: 04. August 2023

Veröffentlicht: 11. August 2023

DOI: https://doi.org/10.1186/s12909-023-04568-8

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt