Eine virtuelle Maschine, kurz VM, ist ein virtueller Computer. Eine solche Maschine besteht nicht aus Hardware, sondern aus Software. Auf einem physischen Computer können gleichzeitig mehrere virtuelle Maschinen betrieben werden.
Virtuelle Maschinen werden als Betriebssystem ausgeführt, das nicht exklusiv über den Computer verfügt, oder als Laufzeitumgebung. Eine Laufzeitumgebung ist ein Modell eines Computers in Software. Sich als Betriebssystem darstellende virtuelle Maschinen können vollständig durch Software (z/VM), mit zusätzlicher Unterstützung durch Hardware und Firmware (Intel VT, AMD-V) oder allein durch Hardware und Firmware (LPAR) realisiert werden.
Stellt das Host-System keine Möglichkeit zur Verfügung, für ein bestimmtes Programm den Anwendungscode direkt auf einem Prozessor ausführen zu können, muss ein Interpreter den Anwendungscode indirekt ausführen. Benötigt bei der Virtualisierung von Hardware (VMware, QEMU) das darauf zugreifende System Schnittstellen (z. B. für Geräte und Kommunikation), die das Betriebssystem nicht bereitstellen kann, müssen diese emuliert werden.
Systeme und Modelle
In der Entwicklung der Rechnerarchitekturen hat sich eine Trennung der typischen VM-Modelle ergeben, mit denen Hardware-CPUs und Software-VMs entwickelt werden. Die große Mehrzahl physischer CPUs verwalten mehrere Operanden in einer beschränkten Zahl direkt adressierbarer Register (Registermaschinen), die große Mehrzahl der portablen VM-Systeme verwalten ihre Operanden in einem verschiebbaren unbeschränkten Stapel (Stapelmaschinen). Dies ergab sich durch die verschiedenen Vorteile dieser Ansätze.
Bei VM-Modellen nach Art von Stapelmaschinen entsprechen die obersten Stapelwerte jeweils dem Parameterblock eines Funktionsaufrufs, der nur einmal vorhanden ist. Die Registermaschinen kommen dagegen ohne Parameterblock aus, indem Schalter bestimmte Register für eine Operation an- und abschalten, wofür zusätzliche Schalter und Leiterbahnen gebraucht werden. Dies beschränkt die Zahl der Register und Recheneinheiten. Eine Emulation von Registermaschinen ersetzt nun die Recheneinheiten durch Funktionsblöcke, für deren Aufruf jeweils Parameterblöcke erstellt werden.
Virtuelle Maschinen mit Orientierung auf Ausführung in Software spielen heute eine bedeutende Rolle, da Microsoft mit der .NET-Architektur dem Beispiel von SUN mit der virtuellen Java-Maschine (Java VM) folgt. Hintergrund ist jeweils die Orientierung auf plattformunabhängige Ausführung von Programmen auf verschiedenen Rechnern, die über ein Netzwerk (z.B. das Internet) verbunden sind.
Die heutigen VM-Systeme besitzen eine große Zahl von Vorläufern, bei denen nutzerorientierte Darstellungen eines Programms (Programmiersprachen) nicht direkt in die maschinenorientierte Darstellung der CPU übersetzt wurden (Maschinencode), sondern in einen einfach strukturierten Zwischencode. Dieser Zwischencode wird dann auf dem Zielsystem durch einen Interpreter ausgeführt. Neben der direkten Ausführung stehen dabei auch verschiedene Optimierungen zur Verfügung, insbesondere die JIT-Compiler.
Die Speicherung des Zwischencodes kann unterschiedlich ausfallen, etwa als Bytecode oder als Baumstruktur. Technisch kann dies als Vorkompilierung betrachtet werden, bei der die Analyseschritte eines Compilers zum Verständnis der problemorientierten Programmiersprache durchlaufen werden (Frontend des Compilers), jedoch keine maschinenorientierte Anpassung an eine spezielle CPU erfolgt (Backend des Compilers), sondern die Anpassung an die abstrakten Ausführungseigenschaften der virtuellen Maschine erfolgt.
Methoden
Der Hypervisor oder Virtual Machine Monitor verwaltet die Ressourcenverteilung für einzelne virtuelle Maschinen. Er verteilt die Hardware-Ressourcen derart, dass für jedes einzelne VM-Betriebssystem alle Ressourcen bei Bedarf verfügbar sind, so, als ob nur ein Betriebssystem vorhanden wäre. Dies kann durch Hardware-Emulation, Hardware-Virtualisierung oder Paravirtualisierung stattfinden. Den einzelnen Gastsystemen wird dabei jeweils ein eigener kompletter Rechner mit allen Hardware-Elementen (Prozessor, Laufwerke, Arbeitsspeicher, usw.) vorgespielt.
Der Vorteil ist, dass an den Betriebssystemen selbst (fast) keine Änderungen erforderlich sind und die Gastsysteme alle ihren eigenen Kernel laufen haben, was eine gewisse Flexibilität im Gegensatz zur Betriebssystemvirtualisierung mit sich bringt.
Wenn weder diese Hardware-Elemente noch die Betriebssysteme der Gastsysteme diese Form der Virtualisierung unterstützen, muss die Virtualisierungssoftware eine Emulationsschicht benutzen, um jedem Gastsystem vorzuspiegeln, es hätte die Hardware für sich allein. Diese Emulation ist oft weniger effizient als direkter Zugriff auf die Hardware, was dann zu einer verringerten Geschwindigkeit führen kann.
Beispiele: VMware Workstation, Windows Virtual PC, VirtualBox, Parallels Workstation.
Hardware-Emulation
Die virtuelle Maschine simuliert die komplette Hardware und ermöglicht einem nichtmodifizierten Betriebssystem, das für eine andere CPU ausgelegt ist, den Betrieb.
Beispiele: Bochs (hier anstatt Emulation Simulation), PPC-Version von Windows Virtual PC, QEMU.
Hardware-Virtualisierung
Die virtuelle Maschine stellt dem Gastbetriebssystem nur Teilbereiche der physischen Hardware in Form von virtueller Hardware zur Verfügung. Diese reicht jedoch aus, um ein unverändertes Betriebssystem darauf in einer isolierten Umgebung laufen zu lassen. Das Gastsystem muss hierbei für den gleichen CPU-Typ ausgelegt sein.
Beispiele: VMware, x86-Version von Windows Virtual PC, KVM, Xen 3.0 auf Prozessoren mit Hardware-Virtualisierungstechnologien: Intel VT-x oder AMD Pacifica.
Paravirtualisierung
Bei Paravirtualisierung wird zwar ein zusätzliches Betriebssystem virtuell neu gestartet, jedoch wird keine Hardware virtualisiert oder emuliert, sondern die virtuell gestarteten Betriebssysteme verwenden eine abstrakte Verwaltungsschicht, um auf gemeinsame Ressourcen (Netzanbindung, Festplattenspeicher, Benutzerein- bzw. -ausgaben) zuzugreifen. In der Informatik ist Paravirtualisierung eine Technologie zur Virtualisierung, die eine Softwareschnittstelle bereitstellt, die ähnlich, aber nicht identisch zur tatsächlichen Hardware ist.
Das Betriebssystem muss portiert werden um auf der virtuellen Maschine (VM) ausgeführt werden zu können, was die Rechteinhaber proprietärer Betriebssysteme aus strategischen Gründen ablehnen können. Die Portierung vereinfacht jedoch den Aufbau der VM und ermöglicht den darauf ausgeführten virtuellen Maschinen eine höhere Leistung. VMware oder auch XEN verwendet die VMI-Schnittstelle, die als „Sprachrohr“ zwischen der Virtualisierungsschicht und Gastbetriebssystem fungiert.
Beispiele: Red Hat Fedora Core 5 mit Xen 3.0, SUSE Linux Enterprise Server mit Xen oder auch VMware ESX 3.5 ab Update 1, Citrix XenServer, KVM, PikeOS Echtzeitbetriebssystem für eingebettete Systeme, Windows 8 mit Hyper-V.
Vorteile und Nachteile
Vorteile einer portablen virtuellen Maschine:
- Plattformunabhängigkeit: Programme für eine virtuelle Maschine laufen auf allen physischen Maschinen, für die die virtuelle Maschine implementiert ist. Sie kann dadurch Architekturtransparenz schaffen.
- Dynamische Optimierung ist möglich.
Nachteile einer portablen virtuellen Maschine:
- Die Ausführung eines portablen Programms auf einer portablen virtuellen Maschine ist meist langsamer als die native Ausführung von Programmen, die speziell für die Zielumgebung übersetzt wurden.
- Bei Verwendung eines Interpreters ergeben sich zusätzliche Indirektionen, was ineffizienter ist als direkte Ausführung.
- Dynamische Übersetzung zur Laufzeit (JIT-Compiler) löst zwar die meisten Indirektionen auf und sorgt für großteils direkte Ausführung, jedoch erfordert die Übersetzung selbst zusätzlichen Aufwand, bis der Code direkt ausgeführt werden kann (jedoch nur im Moment der Übersetzung, nicht mehr bei späteren Durchläufen.)
Diese Nachteile können durch geeignete (zum Beispiel dynamische) Optimierung verringert werden. Eine weitere Möglichkeit ist die automatische Kompilierung mittels Ahead-of-time-Compiler unmittelbar vor der Ausführung. Damit wird das Backend eines hochoptimierenden maschinenorientierten Compilers unmittelbar auf dem Anwendersystem ausgeführt. Dabei kann dieser noch spezifischere Optimierungen an das System des Anwenders vornehmen, als es bei einem vorkompilierten Programm ohne spezielle Optimierungen für den Prozessor des Anwenders möglich wäre.
Weitere virtuelle Maschinen
Neben den Stapelmaschinen der JVM/CLR gibt es auch registerbasierte virtuelle Maschinen, etwa Parrot (VM von Perl 6). Neben der Definition von virtuellen Maschinen für allgemeine Aufgaben gibt es auch spezielle Modelle wie etwa die VM-Definition für Shaderprogramme in 3D-Systemen.
Ein verbreitetes, aber unbekannt gebliebenes VM-System ist Open Firmware, auf der Basis einer Forth-Stapelmaschine mit festgelegten F-Codes und Laufzeitumgebung für den speziellen Einsatz zur BIOS-Programmierung. Eingesetzt wird dieses System heute überwiegend bei PowerPC-Rechnern auf CHRP-Basis.
Umgekehrt findet sich die Möglichkeit, die Hardware einer CPU um die Möglichkeit zur Ausführung mehrerer verschiedener VM-Modelle zu erweitern. CPUs bieten oft einen Kompatibilitätsmodus (z. B. Virtual 8086 Mode). Eine andere Möglichkeit ist es, fremden Maschinencode in den internen Maschinencode (Microcode) zu übersetzen (z. B. CPUs von Transmeta).
Quelle: Wikipedia (http://de.wikipedia.org/wiki/Virtual_Machine)