Problem
Ein Modell auf Sekunden-Daten den nächsten Schritt im NQ-Future vorhersagen zu lassen klingt zuerst wie ein klassisches Quant-Problem. Praktisch ist es vor allem ein Problem aus Rauschen, Kosten und Selbsttäuschung. Kleine Fehler im Resampling erzeugen Look-ahead, K-Fold wirkt auf Zeitreihen sauberer als es ist, und post-hoc Filter machen aus fast jedem Backtest kurzzeitig einen Gewinner. Die eigentliche Aufgabe war deshalb nicht nur ein besseres Modell, sondern eine Pipeline, die solche Abkürzungen sichtbar macht und erst dann misst, ob überhaupt noch Signal übrig bleibt.
Ansatz
Fünf Iterationen, jede strenger als die vorige. Alpha war ein erster Random Forest auf rohen OHLC-Daten. Beta brachte Walk-Forward. Gamma ersetzte Pandas durch eine Rust-Pipeline (CSVValidator), nachdem ein leiser Resampler-Off-by-One Wochen gekostet hatte. Delta wechselte auf eine TCN mit Quantile-Head, damit das Modell Unsicherheit ausdrücken konnte. NQNN, die fünfte Iteration, ist nicht das Modell sondern die Methodik: ein Probe-First-Workflow, in dem jede Hypothese auf ein eigenständiges, kleines, gut prüfbares Skript reduziert wird. Acht solcher Probes — linear, GBM, TCN, Cross-Asset NQ und ES, Reference-Level-Fade, Breakout, Regime — alle mit chronologischen Splits und realistischen Kosten. Aus dem Ergebnis ist der nächste Schritt entstanden: weg vom generischen Direction-Predictor, hin zu einem selektiven, falsifizierbaren Trade-Decision-System.