first version of load forecaster implemented - not yet running

2025-10-23 13:21:28 +02:00
13 changed files with 351 additions and 128 deletions
--- a/pycache/data_base_influx.cpython-312.pyc
+++ b/pycache/data_base_influx.cpython-312.pyc
--- a/pycache/energysystem.cpython-312.pyc
+++ b/pycache/energysystem.cpython-312.pyc
--- a/pycache/pv_inverter.cpython-312.pyc
+++ b/pycache/pv_inverter.cpython-312.pyc
--- a/pycache/sg_ready_controller.cpython-312.pyc
+++ b/pycache/sg_ready_controller.cpython-312.pyc
--- a/pycache/solaredge_meter.cpython-312.pyc
+++ b/pycache/solaredge_meter.cpython-312.pyc
--- a/forecaster/pycache/weather_forecaster.cpython-312.pyc
+++ b/forecaster/pycache/weather_forecaster.cpython-312.pyc
--- a/forecaster/load_forecaster.py
+++ b/forecaster/load_forecaster.py
@@ -0,0 +1,349 @@
+# load_forecaster.py
+# -*- coding: utf-8 -*-
+"""
+LoadForecaster: builds a 36-hour forecast at 15-min resolution from InfluxDB data.
+
+- Data source: InfluxDB (Flux query provided by user)
+- Target: House load = M_AC_real - I_AC_real
+- Frequency: 15 minutes (changeable via init)
+- Model: Keras (LSTM by default, pluggable)
+- Persistence: Saves model (H5) and scaler (joblib)
+
+Usage (example):
+
+    from load_forecaster import LoadForecaster
+    import tensorflow as tf
+
+    lf = LoadForecaster(
+        url="http://localhost:8086",
+        token="<YOUR_TOKEN>",
+        org="<YOUR_ORG>",
+        bucket="allmende_db",
+        agg_every="15m",
+        input_hours=72,
+        output_hours=36,
+        model_path="model/load_forecaster.h5",
+        scaler_path="model/scaler.joblib",
+    )
+
+    # Train or retrain
+    lf.train_and_save(train_days=90, epochs=60)
+
+    # Load model and forecast
+    model = lf.load_model()
+    forecast_df = lf.get_15min_forecast(model)
+    print(forecast_df.head())
+
+"""
+from __future__ import annotations
+import os
+import math
+import json
+import warnings
+from dataclasses import dataclass
+from typing import Optional, Tuple
+
+import numpy as np
+import pandas as pd
+from influxdb_client import InfluxDBClient
+from influxdb_client.client.warnings import MissingPivotFunction
+from sklearn.preprocessing import StandardScaler
+from sklearn.exceptions import NotFittedError
+import joblib
+
+# TensorFlow / Keras
+import tensorflow as tf
+from tensorflow.keras.models import Sequential, load_model
+from tensorflow.keras.layers import LSTM, Dense, Dropout
+from tensorflow.keras.callbacks import EarlyStopping
+
+warnings.filterwarnings("ignore", category=MissingPivotFunction)
+
+@dataclass
+class InfluxParams:
+    url: str
+    token: str
+    org: str
+    bucket: str = "allmende_db"
+
+class LoadForecaster:
+    def __init__(
+        self,
+        url: str,
+        token: str,
+        org: str,
+        bucket: str = "allmende_db",
+        agg_every: str = "15m",
+        input_hours: int = 72,
+        output_hours: int = 36,
+        model_path: str = "model/load_forecaster.h5",
+        scaler_path: str = "model/scaler.joblib",
+        feature_config: Optional[dict] = None,
+    ) -> None:
+        self.influx = InfluxParams(url=url, token=token, org=org, bucket=bucket)
+        self.agg_every = agg_every
+        self.input_steps = int((input_hours * 60) / self._freq_minutes(agg_every))
+        self.output_steps = int((output_hours * 60) / self._freq_minutes(agg_every))
+        self.model_path = model_path
+        self.scaler_path = scaler_path
+        self.feature_config = feature_config or {"use_temp": True, "use_time_cyc": True}
+        self._scaler: Optional[StandardScaler] = None
+
+        # Ensure model dir exists
+        os.makedirs(os.path.dirname(model_path), exist_ok=True)
+
+    # ---------------------------- Public API ---------------------------- #
+    def get_15min_forecast(self, model: tf.keras.Model) -> pd.DataFrame:
+        """Create a 36-hour forecast at 15-min resolution using the latest data.
+        Assumes a StandardScaler has been fitted during training and saved.
+        The method uses the most recent input window from InfluxDB.
+        """
+        # Pull just enough history for one input window
+        history_hours = math.ceil(self.input_steps * self._freq_minutes(self.agg_every) / 60)
+        df = self._query_and_prepare(range_hours=history_hours)
+        if len(df) < self.input_steps:
+            raise RuntimeError(f"Not enough data: need {self.input_steps} steps, got {len(df)}")
+
+        # Build features for the latest window
+        feats = self._build_features(df)
+        X_window = feats[-self.input_steps :]
+
+        # Load scaler
+        scaler = self._load_or_get_scaler()
+        X_scaled = scaler.transform(X_window)
+
+        # Predict
+        pred_scaled = model.predict(X_scaled[np.newaxis, ...], verbose=0)[0]
+
+        # Inverse transform only the target column (index 0 is Load)
+        # Reconstruct a full array to inverse_transform
+        inv = np.zeros((self.output_steps, X_scaled.shape[1]))
+        inv[:, 0] = pred_scaled
+        inv_full = scaler.inverse_transform(inv)
+        y_pred = inv_full[:, 0]
+
+        # Build forecast index
+        last_ts = df.index[-1]
+        freq = pd.tseries.frequencies.to_offset(self.agg_every)
+        idx = pd.date_range(last_ts + freq, periods=self.output_steps, freq=freq)
+        out = pd.DataFrame({"Forecast_Load": y_pred}, index=idx)
+        out.index.name = "timestamp"
+        return out
+
+    def train_and_save(
+        self,
+        train_days: int = 90,
+        epochs: int = 80,
+        batch_size: int = 128,
+        validation_split: float = 0.2,
+        learning_rate: float = 1e-3,
+        fine_tune: bool = False,
+    ) -> tf.keras.Model:
+        """Train (or fine-tune) a model from recent history and persist model + scaler."""
+        df = self._query_and_prepare(range_hours=24 * train_days)
+        feats = self._build_features(df)
+
+        # Prepare windows
+        X, y = self._make_windows(feats)
+        if len(X) < 10:
+            raise RuntimeError("Not enough windowed samples to train.")
+
+        # Fit scaler on full X
+        scaler = StandardScaler()
+        X_scaled = scaler.fit_transform(X)
+        self._scaler = scaler
+        joblib.dump(scaler, self.scaler_path)
+
+        # Build model (or load existing for fine-tune)
+        if fine_tune and os.path.exists(self.model_path):
+            model = load_model(self.model_path)
+        else:
+            model = self._build_default_model(input_dim=X.shape[1], output_dim=self.output_steps, lr=learning_rate)
+
+        # Train
+        es = EarlyStopping(monitor="val_loss", patience=10, restore_best_weights=True)
+        model.fit(
+            X_scaled.reshape((-1, self.input_steps, X.shape[1] // self.input_steps)),
+            y,
+            epochs=epochs,
+            batch_size=batch_size,
+            validation_split=validation_split,
+            callbacks=[es],
+            verbose=1,
+        )
+
+        model.save(self.model_path)
+        return model
+
+    # A convenience wrapper to be called from an external script once per day
+    def retrain_daily(self, train_days: int = 90, epochs: int = 40, fine_tune: bool = True) -> None:
+        self.train_and_save(train_days=train_days, epochs=epochs, fine_tune=fine_tune)
+
+    def load_model(self) -> tf.keras.Model:
+        if not os.path.exists(self.model_path):
+            raise FileNotFoundError(f"Model not found at {self.model_path}")
+        return load_model(self.model_path)
+
+    # ------------------------- Internals: Data ------------------------- #
+    def _query_and_prepare(self, range_hours: int) -> pd.DataFrame:
+        """Query InfluxDB for the last `range_hours` and construct the Load series.
+        Expected fields (exactly as in DB):
+          - "40206 - M_AC_Power"
+          - "40210 - M_AC_Power_SF"
+          - "40083 - I_AC_Power"
+          - "40084 - I_AC_Power_SF"
+          - "300 - Aussentemperatur"
+        """
+        start_str = f"-{range_hours}h"
+        flux = f'''
+from(bucket: "{self.influx.bucket}")
+  |> range(start: {start_str})
+  |> filter(fn: (r) => r["_measurement"] == "solaredge_meter" or r["_measurement"] == "solaredge_master" or r["_measurement"] == "hp_master")
+  |> filter(fn: (r) => r["_field"] == "40206 - M_AC_Power" or r["_field"] == "40210 - M_AC_Power_SF" or r["_field"] == "40083 - I_AC_Power" or r["_field"] == "40084 - I_AC_Power_SF" or r["_field"] == "300 - Aussentemperatur")
+  |> aggregateWindow(every: {self.agg_every}, fn: mean, createEmpty: false)
+  |> yield(name: "mean")
+'''
+        with InfluxDBClient(url=self.influx.url, token=self.influx.token, org=self.influx.org) as client:
+            tables = client.query_api().query_data_frame(flux)
+
+        # Concatenate if list of frames is returned
+        if isinstance(tables, list):
+            df = pd.concat(tables, ignore_index=True)
+        else:
+            df = tables
+
+        # Keep relevant columns and pivot
+        df = df[["_time", "_field", "_value"]]
+        df = df.pivot(index="_time", columns="_field", values="_value").reset_index()
+        df = df.rename(
+            columns={
+                "_time": "timestamp",
+                "40206 - M_AC_Power": "M_AC",
+                "40210 - M_AC_Power_SF": "M_SF",
+                "40083 - I_AC_Power": "I_AC",
+                "40084 - I_AC_Power_SF": "I_SF",
+                "300 - Aussentemperatur": "Temp",
+            }
+        )
+        df = df.sort_values("timestamp").set_index("timestamp")
+
+        # Forward-fill reasonable gaps (e.g., scaler factors and temp)
+        df[["M_SF", "I_SF", "Temp"]] = df[["M_SF", "I_SF", "Temp"]].ffill()
+
+        # Apply scaling: real = value * 10^sf
+        df["I_AC_real"] = df["I_AC"] * np.power(10.0, df["I_SF"]).astype(float)
+        df["M_AC_real"] = df["M_AC"] * np.power(10.0, df["M_SF"]).astype(float)
+
+        # Compute load
+        df["Load"] = df["M_AC_real"] - df["I_AC_real"]
+
+        # Ensure regular 15-min grid
+        df = df.asfreq(self.agg_every)
+        df[["Load", "Temp"]] = df[["Load", "Temp"]].interpolate(limit_direction="both")
+
+        return df[["Load", "Temp"]]
+
+    def _build_features(self, df: pd.DataFrame) -> np.ndarray:
+        """Create feature matrix: [Load, Temp?, sin/cos day, sin/cos dow]."""
+        feats = [df["Load"].values.reshape(-1, 1)]
+
+        if self.feature_config.get("use_temp", True):
+            feats.append(df["Temp"].values.reshape(-1, 1))
+
+        if self.feature_config.get("use_time_cyc", True):
+            idx = df.index
+            minute_of_day = (idx.hour * 60 + idx.minute).values.astype(float)
+            sod = 2 * np.pi * minute_of_day / (24 * 60)
+            dow = 2 * np.pi * idx.dayofweek.values.astype(float) / 7.0
+            feats.append(np.sin(sod).reshape(-1, 1))
+            feats.append(np.cos(sod).reshape(-1, 1))
+            feats.append(np.sin(dow).reshape(-1, 1))
+            feats.append(np.cos(dow).reshape(-1, 1))
+
+        X = np.hstack(feats)  # shape: (T, n_features)
+
+        # Flatten windows to 2D for scaler fitting, but model expects 3D; we reshape later
+        return X
+
+    def _make_windows(self, X_2d: np.ndarray) -> Tuple[np.ndarray, np.ndarray]:
+        """Create sliding windows: returns (X_flat, y) where X_flat stacks the windowed features.
+        For Keras we later reshape X_flat -> (N, input_steps, n_features).
+        """
+        n = X_2d.shape[0]
+        n_features = X_2d.shape[1]
+        X_list, y_list = [], []
+        for i in range(n - self.input_steps - self.output_steps):
+            xw = X_2d[i : i + self.input_steps, :]
+            yw = X_2d[i + self.input_steps : i + self.input_steps + self.output_steps, 0]  # target: Load
+            X_list.append(xw.reshape(-1))  # flatten
+            y_list.append(yw)
+        X_flat = np.stack(X_list)
+        y = np.stack(y_list)
+        return X_flat, y
+
+    # ----------------------- Internals: Modeling ----------------------- #
+    def _build_default_model(self, input_dim: int, output_dim: int, lr: float = 1e-3) -> tf.keras.Model:
+        n_features = input_dim // self.input_steps
+        model = Sequential([
+            LSTM(96, input_shape=(self.input_steps, n_features), return_sequences=False),
+            Dropout(0.1),
+            Dense(output_dim)
+        ])
+        model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=lr), loss="mse")
+        return model
+
+    def _load_or_get_scaler(self) -> StandardScaler:
+        if self._scaler is not None:
+            return self._scaler
+        if not os.path.exists(self.scaler_path):
+            raise NotFittedError("Scaler not found. Train the model first to create scaler.")
+        self._scaler = joblib.load(self.scaler_path)
+        return self._scaler
+
+    @staticmethod
+    def _freq_minutes(spec: str) -> int:
+        # supports formats like "15m", "1h"
+        if spec.endswith("m"):
+            return int(spec[:-1])
+        if spec.endswith("h"):
+            return int(spec[:-1]) * 60
+        raise ValueError(f"Unsupported frequency spec: {spec}")
+
+
+# ----------------------------- retrain_daily.py -----------------------------
+# A tiny script you can run once per day (e.g., via cron/systemd) to retrain the model.
+# It delegates the work to LoadForecaster.retrain_daily().
+
+if __name__ == "__main__":
+    # Read credentials/config from env vars or fill here
+    URL = os.getenv("INFLUX_URL", "http://localhost:8086")
+    TOKEN = os.getenv("INFLUX_TOKEN", "<YOUR_TOKEN>")
+    ORG = os.getenv("INFLUX_ORG", "<YOUR_ORG>")
+    BUCKET = os.getenv("INFLUX_BUCKET", "allmende_db")
+
+    lf = LoadForecaster(
+        url=URL,
+        token=TOKEN,
+        org=ORG,
+        bucket=BUCKET,
+        agg_every="15m",
+        input_hours=72,
+        output_hours=36,
+        model_path=os.getenv("FORECASTER_MODEL", "model/load_forecaster.h5"),
+        scaler_path=os.getenv("FORECASTER_SCALER", "model/scaler.joblib"),
+    )
+
+    # One call per day is enough; decrease epochs for faster daily updates
+    lf.retrain_daily(train_days=int(os.getenv("TRAIN_DAYS", "120")), epochs=int(os.getenv("EPOCHS", "30")), fine_tune=True)
+
+    # Optionally, produce a fresh forecast right after training
+    try:
+        model = lf.load_model()
+        fc = lf.get_15min_forecast(model)
+        # Save latest forecast to CSV for dashboards/consumers
+        out_path = os.getenv("FORECAST_OUT", "model/latest_forecast_15min.csv")
+        os.makedirs(os.path.dirname(out_path), exist_ok=True)
+        fc.to_csv(out_path)
+        print(f"Saved forecast: {out_path}")
+    except Exception as e:
+        print(f"Forecast generation failed: {e}")
--- a/main.py
+++ b/main.py
@@ -26,8 +26,8 @@ db = DataBaseInflux(
    bucket="allmende_db"
 )

-hp_master = HeatPump(device_name='hp_master', ip_address='127.0.0.1', port=8111)
-hp_slave = HeatPump(device_name='hp_slave', ip_address='127.0.0.1', port=8111)
+hp_master = HeatPump(device_name='hp_master', ip_address='10.0.0.10', port=502)
+hp_slave = HeatPump(device_name='hp_slave', ip_address='10.0.0.11', port=502)
 shelly = ShellyPro3m(device_name='wohnung_2_6', ip_address='192.168.1.121')
 wr = PvInverter(device_name='solaredge_master', ip_address='192.168.1.112')
 meter = SolaredgeMeter(device_name='solaredge_meter', ip_address='192.168.1.112')
--- a/modbus_registers/_modbus_register_template.xlsx
+++ b/modbus_registers/_modbus_register_template.xlsx
--- a/modbus_registers/ventilation_modbus_registers.xlsx
+++ b/modbus_registers/ventilation_modbus_registers.xlsx
--- a/simulators/pycache/pv_plant_simulator.cpython-312.pyc
+++ b/simulators/pycache/pv_plant_simulator.cpython-312.pyc
--- a/test.py
+++ b/test.py
@@ -1,69 +0,0 @@
-import time
-import struct
-from pymodbus.client import ModbusTcpClient
-
-MODBUS_IP = "10.0.0.40"
-SLAVE_ID = 1
-POLL = 2.0  # Sekunden
-
-def u16_to_i16(u16):
-    return struct.unpack(">h", struct.pack(">H", u16 & 0xFFFF))[0]
-
-def read_i16(client, addr, scale):
-    rr = client.read_input_registers(address=addr, count=1, slave=SLAVE_ID)
-    if rr.isError():
-        return None
-    raw = rr.registers[0]
-    if raw == 65535:
-        return None
-    return round(u16_to_i16(raw) / scale, 1)
-
-def fmt(v):
-    return f"{v:5.1f}" if v is not None else "  ---"
-
-client = ModbusTcpClient(MODBUS_IP, port=502)
-
-try:
-    if not client.connect():
-        raise RuntimeError("Modbus connect failed")
-
-    print("Logging temperatures (Ctrl+C to stop)\n")
-
-    while True:
-        # Eintrittsluft = Mittelwert aus 3x0324 & 3x0323 (scale 100)
-        t_e1 = read_i16(client, 324, 100)
-        t_e2 = read_i16(client, 323, 100)
-        t_ein = None
-        if t_e1 is not None and t_e2 is not None:
-            t_ein = round((t_e1 + t_e2) / 2, 1)
-
-        # Zuluft -> 3x0614 (/10)
-        t_zuluft = read_i16(client, 614, 10)
-
-        # Abluft -> Mittelwert aus 3x0581 & 3x0582 (/10)
-        t_a1 = read_i16(client, 581, 10)
-        t_a2 = read_i16(client, 582, 10)
-        t_abluft = None
-        if t_a1 is not None and t_a2 is not None:
-            t_abluft = round((t_a1 + t_a2) / 2, 1)
-
-        # Fortluft -> 3x0301 (/100)
-        t_fortluft = read_i16(client, 301, 100)
-
-        ts = time.strftime("%H:%M:%S")
-
-        print(
-            f"{ts} | "
-            f"Eintritt: {fmt(t_ein)} °C | "
-            f"Zuluft: {fmt(t_zuluft)} °C | "
-            f"Abluft: {fmt(t_abluft)} °C | "
-            f"Fortluft: {fmt(t_fortluft)} °C"
-        )
-
-        time.sleep(POLL)
-
-except KeyboardInterrupt:
-    print("\nStopped by user.")
-
-finally:
-    client.close()
--- a/test_knx.py
+++ b/test_knx.py
@@ -1,57 +0,0 @@
-import asyncio
-import logging
-from datetime import datetime
-
-from xknx import XKNX
-from xknx.io import ConnectionConfig, ConnectionType
-from xknx.devices import Sensor
-
-logging.basicConfig(level=logging.INFO)
-
-GA_TEMP = "0/0/8"      # Außentemperatur
-POLL_SECONDS = 60      # Abfrageintervall
-TIMEOUT_SECONDS = 10   # Antwort-Timeout pro Read
-
-async def main():
-    connection_config = ConnectionConfig(
-        connection_type=ConnectionType.TUNNELING,
-        gateway_ip="10.0.0.111",
-        gateway_port=3671,
-        local_ip="192.168.1.88",
-        route_back=True,
-        # Optional: festen UDP-Quellport setzen, falls NAT instabil wird
-        # local_port=50055,
-    )
-
-    async with XKNX(connection_config=connection_config, daemon_mode=True) as xknx:
-        temp = Sensor(
-            xknx=xknx,
-            name="Aussentemperatur",
-            group_address_state=GA_TEMP,
-            value_type="temperature",
-            sync_state=True,
-        )
-        xknx.devices.async_add(temp)
-
-        while True:
-            logging.info("Sende GroupValueRead an %s ...", GA_TEMP)
-            try:
-                try:
-                    await temp.sync(wait_for_result=True, timeout=TIMEOUT_SECONDS)
-                except TypeError:
-                    await asyncio.wait_for(temp.sync(wait_for_result=True), timeout=TIMEOUT_SECONDS)
-
-                value = temp.resolve_state()
-                ts = datetime.now().isoformat(timespec="seconds")
-                if value is None:
-                    logging.warning("%s Aussentemperatur: None (keine verwertbare Antwort)", ts)
-                else:
-                    logging.info("%s Aussentemperatur: %.2f °C", ts, value)
-
-            except asyncio.TimeoutError:
-                logging.warning("Timeout nach %ss: keine Antwort", TIMEOUT_SECONDS)
-
-            await asyncio.sleep(POLL_SECONDS)
-
-if __name__ == "__main__":
-    asyncio.run(main())