Wie aussagekräftig und fair sind VR-Prüfungen?

Würzburger Arbeitsgruppe „VR-Simulation im Medizinstudium“ veröffentlicht neue Erkenntnisse aus zwei Studien zu VR-Prüfungen in hochrangigen Fachzeitschriften für Digital Health

Würzburg. Anwendungen in der virtuellen Realität (VR) gelten als vielversprechende Innovation für die medizinische Ausbildung. Insbesondere für Prüfungen zu klinisch-praktischen Kompetenzen erscheinen sogenannte immersive Simulationen attraktiv: Durch das Eintauchen in eine digitale Welt, in der die Anwenderinnen und Anwender ihre Handlungen selbst bestimmen müssen, lassen sich komplexe Notfallszenarien standardisiert abbilden. Abläufe sind reproduzierbar, und die Prüfungsbedingungen können für alle Teilnehmenden identisch gestaltet werden.

Zwei aktuelle Studien der Arbeitsgruppe VR-Simulation im Medizinstudium am Institut für Medizinische Lehre und Ausbildungsforschung (IMLA) des Universitätsklinikums Würzburg (UKW) zeigen jedoch, dass VR-basierte Prüfungsformate derzeit möglicherweise nicht uneingeschränkt einsetzbar sind. Die Ergebnisse wurden in den renommierten Fachzeitschriften npj Digital Medicine, ein Journal des Nature-Portfolios, und JMIR Medical Education veröffentlicht.

Immersive Kompetenz beeinflusst Prüfungsleistung

In den Studien wurde der Frage nachgegangen, inwiefern die medizinische Prüfungsleistung in VR-Szenarien durch die immersive Kompetenz, also die Fähigkeit, sich in virtuellen Umgebungen sicher bewegen zu können, beeinflusst wird. Diese Fähigkeit wird unter anderem durch Vorerfahrungen mit 3D- und VR-Anwendungen geprägt. Dadurch könnten Studierende mit intensiver Gaming-Erfahrung einen Leistungsvorteil haben.

Die im JMIR veröffentlichte erste Arbeit schuf dafür die methodische Grundlage: Gemeinsam mit dem Lehrstuhl für Mensch-Computer Interaktion der Universität Würzburg wurde erstmals ein Instrument entwickelt und erprobt, mit dem sich die immersive Kompetenz direkt innerhalb einer VR-Anwendung erfassen lässt. 

In der darauf aufbauenden, randomisiert-kontrollierten Studie wurde die immersive Kompetenz bei einem Teil der Prüflinge gezielt trainiert. Die trainierte Gruppe erzielte anschließend signifikant bessere medizinische Ergebnisse in einem VR-Notfallszenario als die nicht trainierte Kontrollgruppe. 

„Unsere Daten deuten darauf hin, dass VR-Prüfungen nicht nur medizinisches Wissen und klinisches Handeln, sondern auch den Umgang mit der Technologie selbst messen“, erklärt Jan Schaal, Erstautor der Validierungsstudie und Doktorand am IMLA. „Damit entsteht die Gefahr, dass digitale Vorerfahrung unbeabsichtigt zu einem Vorteil wird – unabhängig vom eigentlichen Leistungsvermögen“, ergänzt Verena Schreiner, ebenfalls Doktorandin und Erstautorin der methodenzentrierten Studie.

Training allein gleicht Unterschiede nicht automatisch aus

Ein weiteres zentrales Ergebnis betrifft vorbereitende VR-Tutorials. Solche Trainings sollen eigentlich gleiche Ausgangsbedingungen schaffen. Die Würzburger Daten legen jedoch nahe, dass die derzeit üblichen Einführungen möglicherweise nicht ausreichen, um bestehende Unterschiede vollständig auszugleichen. In bestimmten Konstellationen könnten die Trainings anfängliche Leistungsunterschiede sogar verstärken statt reduzieren.

Konsequenzen für die digitale Transformation der Lehre

Die Ergebnisse legen nahe, dass der Einsatz von VR in zukünftigen Prüfungen sorgfältig vorbereitet und überwacht werden muss. Entscheidend sind ein intuitives und zugängliches Design von VR-Hardware und -Software, gezielte Trainings zur Entwicklung immersiver Kompetenz sowie eine sorgfältige wissenschaftliche Prüfung von Aussagekraft und Fairness, bevor Ergebnisse über das Weiterkommen im Studium entscheiden.

„VR bietet enormes Potenzial für die medizinische Ausbildung – aber wir müssen sehr genau untersuchen, was wir eigentlich messen“, betont Dr. Tobias Mühling, Arbeitsgruppenleiter und Letztautor der Studien. „Wenn VR in Zukunft auch in benoteten Prüfungen über den Studienfortgang entscheiden soll, müssen die Ergebnisse zuverlässig sein und für alle Studierenden die gleichen Chancen bieten“, ergänzt die Institutsleitung Prof. Dr. Sarah König.

 

Publikationen:

Schreiner V, Backhaus J, Lindner M, Heinisch M, König S, Oberdörfer S, Mühling T. Specific Immersive Competence in VR-Based Medical Assessments: Development and Exploratory Evaluation of an In-Situ Measurement Approach. JMIR Medical Education. 24/02/2026:82136 (forthcoming/in press). DOI: 10.2196/82136 URL: https://preprints.jmir.org/preprint/82136

Schaal, J., Leutritz, T., Lindner, M. et al. Immersive competence as a source of bias in virtual reality clinical assessment. npj Digit. Med. (2026). https://doi.org/10.1038/s41746-026-02482-z

Großaufnahme des Anwenders mit VR-Brille und Hand mit Controller
Die immersive Kompetenz, also die Fähigkeit, sich in virtuellen Umgebungen sicher bewegen zu können, kann die klinische Beurteilung in der virtuellen Realität verzerren. © Liam König / UKW
VR-Situation aus Sicht des Anwenders: links im Bildrand die VR-Brille und in der Mitte des Bildes die Hand des Anwenders mit VR-Gerät - im Hintergrund die virtuelle Welt mit Patient und Geräten
Durch immersive Simulationen ermöglicht die virtuelle Realität eine realitätsnahe, standardisierte und reproduzierbare Vermittlung klinisch-praktischer Kompetenzen. © Tobias Mühling / UKW

Die immersive Kompetenz, also die Fähigkeit, sich in virtuellen Umgebungen sicher bewegen zu können, kann die klinische Beurteilung in der virtuellen Realität verzerren. © Liam König / UKW

Durch immersive Simulationen ermöglicht die virtuelle Realität eine realitätsnahe, standardisierte und reproduzierbare Vermittlung klinisch-praktischer Kompetenzen. © Tobias Mühling / UKW