Drei Reinforcement-Learning-Modelle, ein Meta-Selektor, klare Limitationen. Ein vollständiges Bild dessen, was unter der Haube läuft — und was nicht.
Unsere Ausführungs-Engine besteht aus drei Reinforcement-Learning-Modellen mit unterschiedlichen Spezialisierungen. Jedes Modell verwendet eine PPO-basierte (Proximal Policy Optimization) Architektur mit einem Aktor-Kritiker-Setup. Die Modelle werden nicht permanent neu trainiert — wir aktualisieren die Gewichte vierteljährlich nach einer strengen Out-of-Sample-Validierung.
Unsere Modelle verarbeiten drei Kategorien von Daten:
Wir behaupten nicht, dass unsere Modelle alle Marktregime gleich gut handhaben. Wir behaupten nicht, dass sie Schwarz-Schwan-Ereignisse vorhersehen. Wir behaupten nicht, dass die historische Performance ein Hinweis auf zukünftige Ergebnisse ist. Was wir behaupten: dass eine disziplinierte algorithmische Ausführung mit klaren Risikolimits über lange Zeiträume zu besseren Ergebnissen führt als emotional getriebene diskretionäre Entscheidungen.
Algorithmen sind keine Wahrsager. Bei extremen, noch nie dagewesenen Marktbedingungen werden unsere Modelle Verluste produzieren. Das ist die Natur der Sache — kein Modell kann auf etwas vorbereitet sein, das es nie gesehen hat.
Wir verwenden eine strenge Walk-Forward-Validierungs-Methodik. Modelle werden auf 80 % der historischen Daten trainiert und auf den verbleibenden 20 % validiert. Wir verwenden niemals zukünftige Daten zum Training (kein Look-Ahead-Bias). Wir berücksichtigen vollständige Transaktionskosten einschließlich Spreads, Provisionen und realistischem Slippage. Modelle, die im Out-of-Sample-Test nicht überzeugen, werden nicht in Produktion gebracht.
Unser Forschungsteam ist organisatorisch von Geschäft und Marketing getrennt. Forschungsleiter berichten direkt an den Vorstand, nicht an den CEO. Wenn ein Modell schlecht performt, sagen wir es offen in der monatlichen Mitteilung — wir trimmen die Ergebnisse nicht für die Optik. Diese Trennung ist in unseren internen Regularien festgeschrieben und wird vom Vorstand jährlich überprüft.
Wir veröffentlichen vierteljährlich eine technische Notiz auf unserem Blog mit Details zur jüngsten Modellperformance, methodischen Verbesserungen und Lessons Learned aus jüngsten Marktbedingungen. Die Notizen sind ohne Marketing-Sprache geschrieben und für technisch interessierte Abonnenten zugänglich.