Elsevier hat zur statistischen Analyse der GKV-Daten den Elsevier Versorgungsmanagement Assistent (EVA) entwickelt. Die EVA-Software ermöglicht Krankenkassen, selbst die Konzeption, Evaluation und Optimierung der medizinischen Versorgung durchzuführen, ohne Kenntnis von Datenabfragesprachen (SQL) und ohne Kenntnis statistischer Methoden.
Für die nächste Generation der EVA – der Version 4.x – wird der Technology Stack komplett erneuert. Um die höchstmögliche Performance zu erzielen, sollen leistungsfähigste Open Source Systeme eingesetzt werden:
a. Das Clustersystem „High Performance Computing Cluster“ (HPCC)
b. Pentaho Data Integration
c. Mondrian OLAP Server
d. Saiku Analytics
e. Eine selbstentwickelte GUI auf Grundlage von Java und gwt
Das Projekt wird den Fokus auf zwei wesentliche Punkte legen:
- Integration und Visualisierung: Die verwendeten Systeme sollen unter ein gemeinsames User Interface zusammengefügt werden. Das Interface soll so einfach gehalten sein, dass den Business Anwendern ein Data Mining ohne SQL- oder Statistik-Kenntnisse ermöglicht wird. Und es soll die State-of-the-Art graphischen Darstellungen integrieren, die Saiku Analytics mitbringt. Zusätzlich soll eine zentrale Ablage und Verwaltung von Datenabfragen und Nutzer-definierten Methoden über die Systeme hinweg konzipiert und entwickelt werden.
- Optimierung: Ziel ist, auch für große Datenmengen (z.B. 7 Millionen Patienten mit 1,2 Milliarden Arztbesuchen in den letzten 7 Jahren) eine fast „real-time“ Analyse zu ermöglichen. Um dies zu erreichen, müssen alle Teilsysteme optimiert werden: a. Interaktive Visualisierung mit Saiku Analytics b. ETL Funktionalität für EVA in Pentaho Data Integration c. Optimierter Zugriff auf das HPCC Clustersystem via JDBC d. (Automatische) Skalierung des HPCC Clustersystems e. Optimierung der Multidimensional Expressions (MDX) Anfragen in Mondrian OLAP
Die fachliche Domäne „Gesundheitswesen“ und die sehr strukturiert vorliegenden Daten ermöglichen eine starke Optimierung. Das Projekt wird fachlich von Elsevier Health Analytics in Berlin unterstützt, und technisch von bakdata. Es werden ein vollständiger, großer Entwicklungsdatensatz und eine zentrale Cloud-Infrastruktur auf Amazon Webservices zur Verfügung gestellt.