Publikationen

Paralleler schneller Multipolalgorithmus mit Mehrschrittverfahren für Molekulardynamiksimulationen

Diplomarbeit am Physik-Department der Technische Universität München

angefertigt an der
Fakultät für Physik der
Ludwig-Maximilians-Universität München
Institut für Medizinische Optik

vorgelegt von
Markus Eichinger

Download der kompletten Diplomarbeit: PostScript (636 kB)

Inhaltsverzeichnis

  • 1 Einleitung
  • 2 Grundlagen der Molekulardynamiksimulation
    • 2.1 Proteine und Membranen
    • 2.2 Die Methode der MD­Simulation
  • 3 Effiziente Simulationsverfahren
    • 3.1 Mehrschrittverfahren
    • 3.2 Einfache Multipolverfahren
    • 3.3 Strukturadaptierte Multipolmethode
      • 3.3.1 Definition struktureller Basisgruppen
      • 3.3.2 Aufpunktsoptimierung
      • 3.3.3 Bestimmung der lokalen Entwicklung
  • 4 Entwicklung von FAMUSAMM
    • 4.1 Die Methode der Hierarchiebildung
      • 4.1.1 Initialisierungsphase
      • 4.1.2 Adaptionsphase
    • 4.2 Festlegung der Abstandsklassen
    • 4.3 Analyse des Rechenaufwandes
    • 4.4 Erweiterung durch ein Mehrschrittverfahren
  • 5 Parallelisierung
    • 5.1 Parallelisierung von FAMUSAMM
    • 5.2 Optimierung der Kommunikation
    • 5.3 Optimierung der Knotenauslastung
  • 6 Ergebnisse
    • 6.1 Analyse der Aggregatstruktur
    • 6.2 Analyse der Näherungsverfahren
      • 6.2.1 Fehler bei der Kraftberechnung
      • 6.2.2 Drift und Fluktuation der Energie
      • 6.2.3 Langzeitverhalten der Proteinstruktur
      • 6.2.4 Kovarianzanalyse der atomaren Bewegung
      • 6.2.5 Zusammenfassung
    • 6.3 Leistungsfähigkeit von EGO_VIII
  • 7 Zusammenfassung und Ausblick

Zusammenfassung und Ausblick

In der vorliegenden Arbeit wurde das Parallelprogramm EGO_VIII zur effizienten MD­Simulation großer Systeme entwickelt und erfolgreich getestet. Bei der Auswertung der langreichweitigen Kräfte kommen dabei eine schnelle Multipolmethode und ein Mehrschrittverfahren gleichzeitig zum Einsatz. Diesen Algorithmus haben wir als FAMUSAMM bezeichnet.

Die hier realisierte schnelle Multipolmethode greift auf die strukturadaptierte Methode von C. Niedermeier und P. Tavan zurück. Zur Extrapolation der Kräfte durch ein Mehrschrittverfahren eignet sich die DC­1d­Methode, die von H. Grubmüller in entwickelt wurde. Wie eine Analyse zeigte, bleiben auch beim kombinierten Einsatz von schneller Multipolmethode und Mehrschrittverfahren die günstigen Eigenschaften der DC­1d­Methode erhalten. Um einen eventuellen Einfluß des neuen Näherungsalgorithmus auf relevante Observablen aufzudecken, wurde für ein kleines Protein eine Langzeitsimulationen über 1,2 ns durchgeführt. Als Vergleich dienten zwei Referenzsimulationen mit exakt berechneten Kräften. Es konnte keine signifikante Beeinflussung der betrachteten Observablen beobachtet werden.

Gegenüber der exakten Berechnung der langreichweitigen Kräfte erzielt man bei großen Systemen mit FAMUSAMM eine Beschleunigung um den Faktor 60. Die langreichweitigen Kräfte werden dabei bis auf 1 % Genauigkeit ermittelt. Durch den Einsatz von Parallelrechnern werden Langzeitsimulationen im Nanosekunden-Bereich für Systeme mit über 25 000 Atomen möglich. Dabei konnte bei einem Parallelrechnersystem mit 15 Rechenknoten effektiv eine Beschleunigung um den Faktor 10 erreicht werden. Eine hinsichtlich der Kommunikationsleistung verbesserte Hardware würde eine bessere Ausnutzung der Rechenleistung ermöglichen und den Einsatz von noch mehr Rechenknoten erlauben. Insgesamt ermöglichen die in den letzten Jahren gestiegene Rechenleistung von Computern und der Einsatz des hier entwickelten Verfahrens die Berechnung von 1 ns Simulationszeit in 35 Tagen Rechenzeit für ein System aus 25 000 Atomen. Vor drei Jahren benötigte H. Heller für die Simulation eines solchen Systems über 200 ps noch 20 Monate Rechenzeit.

In Abschnitt 4.1 wurde ein Clustering­Algorithmus beschrieben, der jedoch - wie sich in Abschnitt 6.1 herausstellte - für große Systeme mit mehr als drei Hierarchiestufen keine optimale Aggregatstruktur liefert. Mit dem Einsatz besserer Clustering-Algorithmen, welche auch auf höheren Hierarchiestufen kompakte Aggregate bilden, wäre eine Geschwindigkeitssteigerung der Kraftberechnung bei großen Systemen verbunden. Ein vielversprechender Clustering­Algorithmus hierzu ist in [ ] beschrieben.

Nach Abschluß der Testphase von FAMUSAMM ist die Simulation des Membranproteins Bakteriorhodopsin, einer lichtgetriebenen Protonenpumpe photsynthetischer Bakterien, in seiner natürlichen Umgebung geplant. Das MD­Simulationsmodell von Bakteriorhodopsin besteht aus etwa 2 500 Atomen. Die Simulation des reinen Proteins ohne seine natürliche Umgebung führt zu einer Abweichung von der Tertiärstruktur, welche aus Elektronenbeugung an einem zweidimensionalen Kristall gewonnen wurde. Wie in der Einleitung erläutert wurde, ist es notwendig, das Protein in eine Lipidmembran einzubetten, die von beiden Seiten mit Wasser benetzt ist. Insgesamt wird das MD-System aus etwa 35 000 Atomen bestehen. Eine Langzeitsimulation soll klären, ob die durch Röntgenstrukturanalyse ermittelte Tertiärstruktur des Simulationsmodell in diesem Fall stabil ist. Sollte dies zutreffen, kann mit genaueren Untersuchungen zur Dynamik und Arbeitsweise von Bakteriorhodopsin mittels MD-Simulation begonnen werden.

Die Einbettung eines derart großen MD-Systems in ein Lösungsmittel erhöht die Anzahl der zu simulierenden Atome sehr stark. Da das Verhalten der Lösungsmittelmoleküle, die nicht unmittelbar mit dem Membran­Protein­Komplex in Berührung stehen, nicht von Interesse ist, würde man gern auf die explizite Simulation dieser Moleküle verzichten, um die Anzahl der Atome zu reduzieren. Statt dessen genügt es, die elektrostatische Wirkung des Lösungsmittel auf das MD-System implizit zu beschreiben. Hierfür sind verschiedene Verfahren entwickelt worden, welche die Poisson­Boltzmann Gleichung durch Einführung von virtuellen Dipolen und Ladungen näherungsweise lösen. Es ist zu erwarten, daß bei der Anwendung dieser Methode nach wie vor eine effiziente Berechnung der langreichweitigen Kräfte durch FAMUSAMM möglich ist. Die Implementierung einer solchen Methode in dem Programm EGO_VIII würde also eine realistische MD­Simulation sehr großer Systeme erlauben, ohne explizit eine große Anzahl von Lösungsmittelmolekülen berücksichtigen zu müssen. Der Anwendungsbereich und die Aussagekraft von MD-Simulationen könnte damit weiter gesteigert werden.