Bitcoin Machine Learning and Future forcaste

Farrukhbuzdar · (This post was last modified: Dec-28-2024, 04:22 AM by buran.)

I developed a script and encountering error. Need inputs to finalize script. I am using .csv file in script to analysize future price of #bitcoin
-------------

# Import Libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import joblib
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from statsmodels.tsa.arima.model import ARIMA
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import LSTM, Dense
from prophet import Prophet
import xgboost as xgb
import torch
import torch.nn as nn
import torch.optim as optim
import pytorch_lightning as pl
from torch.utils.data import DataLoader, Dataset, random_split
import pytorch_forecasting
from pytorch_forecasting.data import TimeSeriesDataSet, GroupNormalizer
from pytorch_forecasting.models import TemporalFusionTransformer
import optuna
import shap

# Load Dataset
file_path = '/content/drive/MyDrive/Colab Notebooks/bitcoin_prices'  # Update this path
df = pd.read_excel(file_path)

# Data Validation: Handle missing values, outliers, or anomalies
df = df.dropna()  # Drop missing values for simplicity

# Feature Engineering
df['Daily_Return'] = df['Close'].pct_change()
df['Log_Return'] = np.log(df['Close'] / df['Close'].shift(1))
df['MA_5'] = df['Close'].rolling(window=5).mean()
df['MA_10'] = df['Close'].rolling(window=10).mean()
df['EMA_5'] = df['Close'].ewm(span=5, adjust=False).mean()
df['EMA_10'] = df['Close'].ewm(span=10, adjust=False).mean()
df['BB_Middle'] = df['Close'].rolling(window=20).mean()
df['BB_Upper'] = df['BB_Middle'] + 2*df['Close'].rolling(window=20).std()
df['BB_Lower'] = df['BB_Middle'] - 2*df['Close'].rolling(window=20).std()
df['Volatility'] = df['Daily_Return'].rolling(window=10).std()
df['Momentum'] = df['Close'] - df['Close'].shift(10)
df['VWAP'] = (df['Volume'] * (df['High'] + df['Low'] + df['Close']) / 3).cumsum() / df['Volume'].cumsum()
delta = df['Close'].diff(1)
gain = delta.where(delta > 0, 0)
loss = -delta.where(delta < 0, 0)
avg_gain = gain.rolling(window=14).mean()
avg_loss = loss.rolling(window=14).mean()
rs = avg_gain / avg_loss
df['RSI'] = 100 - (100 / (1 + rs))
ema_12 = df['Close'].ewm(span=12, adjust=False).mean()
ema_26 = df['Close'].ewm(span=26, adjust=False).mean()
df['MACD'] = ema_12 - ema_26
df['MACD_Signal'] = df['MACD'].ewm(span=9, adjust=False).mean()

# Dynamic Time Features
df['day_of_week'] = df['Timestamp'].dt.dayofweek
df['month'] = df['Timestamp'].dt.month

# Drop rows with NaN values after feature engineering
df = df.dropna()

# ARIMA Model
arima_df = df.set_index('Timestamp')['Close']
arima_model = ARIMA(arima_df, order=(5, 1, 0))
arima_model_fit = arima_model.fit()
arima_forecast = arima_model_fit.forecast(steps=30)
arima_model_fit.save('arima_model.pkl')

# Prophet Model
prophet_df = df[['Timestamp', 'Close']].rename(columns={'Timestamp': 'ds', 'Close': 'y'})
prophet_model = Prophet()
prophet_model.fit(prophet_df)
future = prophet_model.make_future_dataframe(periods=30)
prophet_forecast = prophet_model.predict(future)

# Save the Prophet model using joblib
joblib.dump(prophet_model, 'prophet_model.pkl')

# XGBoost Model
df['Lag_1'] = df['Close'].shift(1)
df['Lag_2'] = df['Close'].shift(2)
df['Lag_3'] = df['Close'].shift(3)
df = df.dropna()
X = df[['Lag_1', 'Lag_2', 'Lag_3', 'day_of_week', 'month']]
y = df['Close']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
xgb_model = xgb.XGBRegressor(objective='reg:squarederror', n_estimators=100, random_state=42)
xgb_model.fit(X_train, y_train)
xgb_forecast = xgb_model.predict(X_test)
joblib.dump(xgb_model, 'xgb_model.pkl')

# SHAP for XGBoost Explainability
shap.initjs()
explainer = shap.Explainer(xgb_model)
shap_values = explainer(X_test)
shap.summary_plot(shap_values, X_test)

# LSTM Model
features = ['Open', 'High', 'Low', 'Volume', 'Daily_Return', 'Log_Return', 'MA_5', 'MA_10', 'EMA_5', 'EMA_10',
            'BB_Middle', 'BB_Upper', 'BB_Lower', 'Volatility', 'Momentum', 'VWAP', 'RSI', 'MACD', 'MACD_Signal']
scaler = MinMaxScaler()
df[features] = scaler.fit_transform(df[features])
df['Close'] = scaler.fit_transform(df[['Close']])
sequence_length = 50
X = []
y = []
for i in range(sequence_length, len(df)):
    X.append(df[features].iloc[i-sequence_length:i].values)
    y.append(df['Close'].iloc[i])
X = np.array(X)
y = np.array(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

def create_lstm_model():
    model = Sequential([
        LSTM(50, activation='relu', return_sequences=True, input_shape=(X_train.shape[1], X_train.shape[2])),
        LSTM(50, activation='relu'),
        Dense(1)
    ])
    model.compile(optimizer='adam', loss='mse')
    return model

# Hyperparameter Tuning for LSTM using Optuna
def objective(trial):
    lstm_units = trial.suggest_int('lstm_units', 10, 100)
    batch_size = trial.suggest_int('batch_size', 16, 128)
    epochs = trial.suggest_int('epochs', 10, 50)

    model = Sequential([
        LSTM(lstm_units, activation='relu', return_sequences=True, input_shape=(X_train.shape[1], X_train.shape[2])),
        LSTM(lstm_units, activation='relu'),
        Dense(1)
    ])
    model.compile(optimizer='adam', loss='mse')
    model.fit(X_train, y_train, epochs=epochs, batch_size=batch_size, validation_split=0.2, verbose=0)
    loss = model.evaluate(X_test, y_test, verbose=0)
    return loss

study = optuna.create_study(direction='minimize')
study.optimize(objective, n_trials=50)

best_params = study.best_params
print("Best hyperparameters: ", best_params)

lstm_model = Sequential([
    LSTM(best_params['lstm_units'], activation='relu', return_sequences=True, input_shape=(X_train.shape[1], X_train.shape[2])),
    LSTM(best_params['lstm_units'], activation='relu'),
    Dense(1)
])
lstm_model.compile(optimizer='adam', loss='mse')
lstm_model.fit(X_train, y_train, epochs=best_params['epochs'], batch_size=best_params['batch_size'], validation_split=0.2)
lstm_model.save('lstm_model.h5')

y_pred_lstm = lstm_model.predict(X_test)
last_sequence = df[features].iloc[-sequence_length:].values
future_predictions = []
for _ in range(30):
    last_sequence = last_sequence.reshape((1, sequence_length, len(features)))
    next_pred = lstm_model.predict(last_sequence)
    future_predictions.append(next_pred[0, 0])
    next_pred_repeated = np.repeat(next_pred, len(features)).reshape(1, 1, len(features))
    new_sequence = np.append(last_sequence[:, 1:, :], next_pred_repeated, axis=1)
    last_sequence = new_sequence
future_predictions = scaler.inverse_transform(np.array(future_predictions).reshape(-1, 1))

# Transformer Model
class TimeSeriesDataset(Dataset):
    def __init__(self, data, seq_length):
        self.data = data
        self.seq_length = seq_length

    def __len__(self):
        return len(self.data) - self.seq_length

    def __getitem__(self, idx):
        x = self.data[idx:idx+self.seq_length]
        y = self.data[idx+self.seq_length]
        return torch.tensor(x, dtype=torch.float32).unsqueeze(-1), torch.tensor(y, dtype=torch.float32).unsqueeze(-1)  # Ensure 3D shape

class TransformerModel(pl.LightningModule):
    def __init__(self, input_dim, seq_length, num_heads, num_layers, dim_feedforward, output_dim):
        super(TransformerModel, self).__init__()
        self.seq_length = seq_length
        self.input_dim = input_dim
        self.transformer = nn.Transformer(input_dim, num_heads, num_layers, dim_feedforward)
        self.fc = nn.Linear(input_dim * seq_length, output_dim)

    def forward(self, x):
        print(x.shape)  # Debug statement to check shape
        if x.ndim == 2:  # Add a feature dimension if missing
            x = x.unsqueeze(-1)
        x = x.permute(1, 0, 2)  # [sequence_length, batch_size, input_dim]
        x = self.transformer(x)
        x = x.permute(1, 0, 2)  # [batch_size, sequence_length, output_dim]
        x = x.reshape(x.size(0), -1)
        x = self.fc(x)
        return x

    def training_step(self, batch, batch_idx):
        x, y = batch
        y_hat = self(x)
        loss = nn.MSELoss()(y_hat, y)
        return loss

    def configure_optimizers(self):
        return optim.Adam(self.parameters(), lr=0.001)

data = df['Close'].values
dataset = TimeSeriesDataset(data, sequence_length)
train_size = int(0.8 * len(dataset))
val_size = len(dataset) - train_size
train_dataset, val_dataset = random_split(dataset, [train_size, val_size])
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32)
input_dim = 1  # Use 1 for single feature input
output_dim = 1
num_heads = 1  # Use 1 since input_dim is 1
num_layers = 4
dim_feedforward = 128
transformer_model = TransformerModel(input_dim, sequence_length, num_heads, num_layers, dim_feedforward, output_dim)
trainer = pl.Trainer(max_epochs=10)
trainer.fit(transformer_model, train_loader, val_loader)
torch.save(transformer_model.state_dict(), 'transformer_model.pth')
transformer_model.eval()
test_data = data[-sequence_length:].reshape(1, sequence_length, 1)
test_data = torch.tensor(test_data, dtype=torch.float32)
with torch.no_grad():
    transformer_predictions = transformer_model(test_data).numpy()
transformer_predictions = scaler.inverse_transform(transformer_predictions)

# Temporal Fusion Transformer (TFT)
df['time_idx'] = df.index
df['group'] = 0
max_encoder_length = 60
max_prediction_length = 30
training_cutoff = df["time_idx"].max() - max_prediction_length
training = TimeSeriesDataSet(
    df[lambda x: x.time_idx <= training_cutoff],
    time_idx="time_idx",
    target="Close",
    group_ids=["group"],
    min_encoder_length=max_encoder_length // 2,
    max_encoder_length=max_encoder_length,
    min_prediction_length=1,
    max_prediction_length=max_prediction_length,
    static_categoricals=["group"],
    time_varying_known_reals=["time_idx"],
    time_varying_unknown_reals=["Close"],
    target_normalizer=GroupNormalizer(groups=["group"]),
)
batch_size = 64
train_dataloader = training.to_dataloader(train=True, batch_size=batch_size, num_workers=0)

# Hyperparameter Tuning for TFT using Optuna
def tft_objective(trial):
    hidden_size = trial.suggest_int('hidden_size', 8, 64)
    attention_head_size = trial.suggest_int('attention_head_size', 1, 4)
    dropout = trial.suggest_float('dropout', 0.1, 0.5)
    hidden_continuous_size = trial.suggest_int('hidden_continuous_size', 8, 64)

    tft = TemporalFusionTransformer.from_dataset(
        training,
        learning_rate=0.03,
        hidden_size=hidden_size,
        attention_head_size=attention_head_size,
        dropout=dropout,
        hidden_continuous_size=hidden_continuous_size,
        output_size=7,
        loss=pytorch_forecasting.metrics.QuantileLoss(),
        log_interval=10,
        reduce_on_plateau_patience=4,
    )
    trainer = pl.Trainer(
        max_epochs=10,
        gpus=0,
        gradient_clip_val=0.1,
    )
    trainer.fit(tft, train_dataloader)
    val_loss = trainer.callback_metrics['val_loss'].item()
    return val_loss

tft_study = optuna.create_study(direction='minimize')
tft_study.optimize(tft_objective, n_trials=50)

best_tft_params = tft_study.best_params
print("Best TFT hyperparameters: ", best_tft_params)

tft = TemporalFusionTransformer.from_dataset(
    training,
    learning_rate=0.03,
    hidden_size=best_tft_params['hidden_size'],
    attention_head_size=best_tft_params['attention_head_size'],
    dropout=best_tft_params['dropout'],
    hidden_continuous_size=best_tft_params['hidden_continuous_size'],
    output_size=7,
    loss=pytorch_forecasting.metrics.QuantileLoss(),
    log_interval=10,
    reduce_on_plateau_patience=4,
)
trainer = pl.Trainer(
    max_epochs=30,
    gpus=0,
    gradient_clip_val=0.1,
)
trainer.fit(tft, train_dataloader)
torch.save(tft.state_dict(), 'tft_model.pth')
best_model_path = trainer.checkpoint_callback.best_model_path
best_tft = TemporalFusionTransformer.load_from_checkpoint(best_model_path)
tft_predictions = best_tft.predict(training, mode="raw")

# Plot the predictions
plt.figure(figsize=(12, 6))
plt.plot(df['Close'].values, label='Actual Prices')
plt.plot(range(len(df), len(df) + len(arima_forecast)), arima_forecast, label='ARIMA Forecast')
plt.plot(prophet_forecast['ds'].values[-30:], prophet_forecast['yhat'].values[-30:], label='Prophet Forecast')
plt.plot(range(len(df), len(df) + len(xgb_forecast)), xgb_forecast, label='XGBoost Forecast')
plt.plot(range(len(df), len(df) + len(future_predictions)), future_predictions, label='LSTM Forecast')
plt.plot(range(len(df), len(df) + len(transformer_predictions)), transformer_predictions, label='Transformer Forecast')
plt.plot(df['time_idx'].values[-len(tft_predictions):], tft_predictions, label='TFT Forecast')
plt.title('Bitcoin Price Prediction using Various Models')
plt.legend()
plt.show()

buran write Dec-28-2024, 04:22 AM:
Please post all code, output and errors (it it's entirety) between their respective tags. Refer to BBCode help topic on how to post. Use the "Preview Post" button to make sure the code is presented as you expect before hitting the "Post Reply/Thread" button.

Farrukhbuzdar · (This post was last modified: Dec-28-2024, 12:57 PM by Larz60+.)

Help me to remove errors and finalize my project regarding Bitcoin Forcasting. I am running this project on google Colab
Bitcoin file is uploaded in .csv
---------

# Import Libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import joblib
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from statsmodels.tsa.arima.model import ARIMA
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import LSTM, Dense
from prophet import Prophet
import xgboost as xgb
import torch
import torch.nn as nn
import torch.optim as optim
import pytorch_lightning as pl
from torch.utils.data import DataLoader, Dataset, random_split
import pytorch_forecasting
from pytorch_forecasting.data import TimeSeriesDataSet, GroupNormalizer
from pytorch_forecasting.models import TemporalFusionTransformer
import optuna
import shap

# Load Dataset
file_path = '/content/drive/MyDrive/Colab Notebooks/bitcoin_prices' # Update this path
df = pd.read_excel(file_path)

# Data Validation: Handle missing values, outliers, or anomalies
df = df.dropna() # Drop missing values for simplicity

# Feature Engineering
df['Daily_Return'] = df['Close'].pct_change()
df['Log_Return'] = np.log(df['Close'] / df['Close'].shift(1))
df['MA_5'] = df['Close'].rolling(window=5).mean()
df['MA_10'] = df['Close'].rolling(window=10).mean()
df['EMA_5'] = df['Close'].ewm(span=5, adjust=False).mean()
df['EMA_10'] = df['Close'].ewm(span=10, adjust=False).mean()
df['BB_Middle'] = df['Close'].rolling(window=20).mean()
df['BB_Upper'] = df['BB_Middle'] + 2*df['Close'].rolling(window=20).std()
df['BB_Lower'] = df['BB_Middle'] - 2*df['Close'].rolling(window=20).std()
df['Volatility'] = df['Daily_Return'].rolling(window=10).std()
df['Momentum'] = df['Close'] - df['Close'].shift(10)
df['VWAP'] = (df['Volume'] * (df['High'] + df['Low'] + df['Close']) / 3).cumsum() / df['Volume'].cumsum()
delta = df['Close'].diff(1)
gain = delta.where(delta > 0, 0)
loss = -delta.where(delta < 0, 0)
avg_gain = gain.rolling(window=14).mean()
avg_loss = loss.rolling(window=14).mean()
rs = avg_gain / avg_loss
df['RSI'] = 100 - (100 / (1 + rs))
ema_12 = df['Close'].ewm(span=12, adjust=False).mean()
ema_26 = df['Close'].ewm(span=26, adjust=False).mean()
df['MACD'] = ema_12 - ema_26
df['MACD_Signal'] = df['MACD'].ewm(span=9, adjust=False).mean()

# Dynamic Time Features
df['day_of_week'] = df['Timestamp'].dt.dayofweek
df['month'] = df['Timestamp'].dt.month

# Drop rows with NaN values after feature engineering
df = df.dropna()

# ARIMA Model
arima_df = df.set_index('Timestamp')['Close']
arima_model = ARIMA(arima_df, order=(5, 1, 0))
arima_model_fit = arima_model.fit()
arima_forecast = arima_model_fit.forecast(steps=30)
arima_model_fit.save('arima_model.pkl')

# Prophet Model
prophet_df = df[['Timestamp', 'Close']].rename(columns={'Timestamp': 'ds', 'Close': 'y'})
prophet_model = Prophet()
prophet_model.fit(prophet_df)
future = prophet_model.make_future_dataframe(periods=30)
prophet_forecast = prophet_model.predict(future)

# Save the Prophet model using joblib
joblib.dump(prophet_model, 'prophet_model.pkl')

# XGBoost Model
df['Lag_1'] = df['Close'].shift(1)
df['Lag_2'] = df['Close'].shift(2)
df['Lag_3'] = df['Close'].shift(3)
df = df.dropna()
X = df[['Lag_1', 'Lag_2', 'Lag_3', 'day_of_week', 'month']]
y = df['Close']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
xgb_model = xgb.XGBRegressor(objective='reg:squarederror', n_estimators=100, random_state=42)
xgb_model.fit(X_train, y_train)
xgb_forecast = xgb_model.predict(X_test)
joblib.dump(xgb_model, 'xgb_model.pkl')

# SHAP for XGBoost Explainability
shap.initjs()
explainer = shap.Explainer(xgb_model)
shap_values = explainer(X_test)
shap.summary_plot(shap_values, X_test)

# LSTM Model
features = ['Open', 'High', 'Low', 'Volume', 'Daily_Return', 'Log_Return', 'MA_5', 'MA_10', 'EMA_5', 'EMA_10',
'BB_Middle', 'BB_Upper', 'BB_Lower', 'Volatility', 'Momentum', 'VWAP', 'RSI', 'MACD', 'MACD_Signal']
scaler = MinMaxScaler()
df[features] = scaler.fit_transform(df[features])
df['Close'] = scaler.fit_transform(df[['Close']])
sequence_length = 50
X = []
y = []
for i in range(sequence_length, len(df)):
X.append(df[features].iloc[i-sequence_length:i].values)
y.append(df['Close'].iloc[i])
X = np.array(X)
y = np.array(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

def create_lstm_model():
model = Sequential([
LSTM(50, activation='relu', return_sequences=True, input_shape=(X_train.shape[1], X_train.shape[2])),
LSTM(50, activation='relu'),
Dense(1)
])
model.compile(optimizer='adam', loss='mse')
return model

# Hyperparameter Tuning for LSTM using Optuna
def objective(trial):
lstm_units = trial.suggest_int('lstm_units', 10, 100)
batch_size = trial.suggest_int('batch_size', 16, 128)
epochs = trial.suggest_int('epochs', 10, 50)

model = Sequential([
LSTM(lstm_units, activation='relu', return_sequences=True, input_shape=(X_train.shape[1], X_train.shape[2])),
LSTM(lstm_units, activation='relu'),
Dense(1)
])
model.compile(optimizer='adam', loss='mse')
model.fit(X_train, y_train, epochs=epochs, batch_size=batch_size, validation_split=0.2, verbose=0)
loss = model.evaluate(X_test, y_test, verbose=0)
return loss

study = optuna.create_study(direction='minimize')
study.optimize(objective, n_trials=50)

best_params = study.best_params
print("Best hyperparameters: ", best_params)

lstm_model = Sequential([
LSTM(best_params['lstm_units'], activation='relu', return_sequences=True, input_shape=(X_train.shape[1], X_train.shape[2])),
LSTM(best_params['lstm_units'], activation='relu'),
Dense(1)
])
lstm_model.compile(optimizer='adam', loss='mse')
lstm_model.fit(X_train, y_train, epochs=best_params['epochs'], batch_size=best_params['batch_size'], validation_split=0.2)
lstm_model.save('lstm_model.h5')

y_pred_lstm = lstm_model.predict(X_test)
last_sequence = df[features].iloc[-sequence_length:].values
future_predictions = []
for _ in range(30):
last_sequence = last_sequence.reshape((1, sequence_length, len(features)))
next_pred = lstm_model.predict(last_sequence)
future_predictions.append(next_pred[0, 0])
next_pred_repeated = np.repeat(next_pred, len(features)).reshape(1, 1, len(features))
new_sequence = np.append(last_sequence[:, 1:, :], next_pred_repeated, axis=1)
last_sequence = new_sequence
future_predictions = scaler.inverse_transform(np.array(future_predictions).reshape(-1, 1))

# Transformer Model
class TimeSeriesDataset(Dataset):
def __init__(self, data, seq_length):
self.data = data
self.seq_length = seq_length

def __len__(self):
return len(self.data) - self.seq_length

def __getitem__(self, idx):
x = self.data[idx:idx+self.seq_length]
y = self.data[idx+self.seq_length]
return torch.tensor(x, dtype=torch.float32).unsqueeze(-1), torch.tensor(y, dtype=torch.float32).unsqueeze(-1) # Ensure 3D shape

class TransformerModel(pl.LightningModule):
def __init__(self, input_dim, seq_length, num_heads, num_layers, dim_feedforward, output_dim):
super(TransformerModel, self).__init__()
self.seq_length = seq_length
self.input_dim = input_dim
self.transformer = nn.Transformer(input_dim, num_heads, num_layers, dim_feedforward)
self.fc = nn.Linear(input_dim * seq_length, output_dim)

def forward(self, x):
print(x.shape) # Debug statement to check shape
if x.ndim == 2: # Add a feature dimension if missing
x = x.unsqueeze(-1)
x = x.permute(1, 0, 2) # [sequence_length, batch_size, input_dim]
x = self.transformer(x)
x = x.permute(1, 0, 2) # [batch_size, sequence_length, output_dim]
x = x.reshape(x.size(0), -1)
x = self.fc(x)
return x

def training_step(self, batch, batch_idx):
x, y = batch
y_hat = self(x)
loss = nn.MSELoss()(y_hat, y)
return loss

def configure_optimizers(self):
return optim.Adam(self.parameters(), lr=0.001)

data = df['Close'].values
dataset = TimeSeriesDataset(data, sequence_length)
train_size = int(0.8 * len(dataset))
val_size = len(dataset) - train_size
train_dataset, val_dataset = random_split(dataset, [train_size, val_size])
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32)
input_dim = 1 # Use 1 for single feature input
output_dim = 1
num_heads = 1 # Use 1 since input_dim is 1
num_layers = 4
dim_feedforward = 128
transformer_model = TransformerModel(input_dim, sequence_length, num_heads, num_layers, dim_feedforward, output_dim)
trainer = pl.Trainer(max_epochs=10)
trainer.fit(transformer_model, train_loader, val_loader)
torch.save(transformer_model.state_dict(), 'transformer_model.pth')
transformer_model.eval()
test_data = data[-sequence_length:].reshape(1, sequence_length, 1)
test_data = torch.tensor(test_data, dtype=torch.float32)
with torch.no_grad():
transformer_predictions = transformer_model(test_data).numpy()
transformer_predictions = scaler.inverse_transform(transformer_predictions)

# Temporal Fusion Transformer (TFT)
df['time_idx'] = df.index
df['group'] = 0
max_encoder_length = 60
max_prediction_length = 30
training_cutoff = df["time_idx"].max() - max_prediction_length
training = TimeSeriesDataSet(
df[lambda x: x.time_idx <= training_cutoff],
time_idx="time_idx",
target="Close",
group_ids=["group"],
min_encoder_length=max_encoder_length // 2,
max_encoder_length=max_encoder_length,
min_prediction_length=1,
max_prediction_length=max_prediction_length,
static_categoricals=["group"],
time_varying_known_reals=["time_idx"],
time_varying_unknown_reals=["Close"],
target_normalizer=GroupNormalizer(groups=["group"]),
)
batch_size = 64
train_dataloader = training.to_dataloader(train=True, batch_size=batch_size, num_workers=0)

# Hyperparameter Tuning for TFT using Optuna
def tft_objective(trial):
hidden_size = trial.suggest_int('hidden_size', 8, 64)
attention_head_size = trial.suggest_int('attention_head_size', 1, 4)
dropout = trial.suggest_float('dropout', 0.1, 0.5)
hidden_continuous_size = trial.suggest_int('hidden_continuous_size', 8, 64)

tft = TemporalFusionTransformer.from_dataset(
training,
learning_rate=0.03,
hidden_size=hidden_size,
attention_head_size=attention_head_size,
dropout=dropout,
hidden_continuous_size=hidden_continuous_size,
output_size=7,
loss=pytorch_forecasting.metrics.QuantileLoss(),
log_interval=10,
reduce_on_plateau_patience=4,
)
trainer = pl.Trainer(
max_epochs=10,
gpus=0,
gradient_clip_val=0.1,
)
trainer.fit(tft, train_dataloader)
val_loss = trainer.callback_metrics['val_loss'].item()
return val_loss

tft_study = optuna.create_study(direction='minimize')
tft_study.optimize(tft_objective, n_trials=50)

best_tft_params = tft_study.best_params
print("Best TFT hyperparameters: ", best_tft_params)

tft = TemporalFusionTransformer.from_dataset(
training,
learning_rate=0.03,
hidden_size=best_tft_params['hidden_size'],
attention_head_size=best_tft_params['attention_head_size'],
dropout=best_tft_params['dropout'],
hidden_continuous_size=best_tft_params['hidden_continuous_size'],
output_size=7,
loss=pytorch_forecasting.metrics.QuantileLoss(),
log_interval=10,
reduce_on_plateau_patience=4,
)
trainer = pl.Trainer(
max_epochs=30,
gpus=0,
gradient_clip_val=0.1,
)
trainer.fit(tft, train_dataloader)
torch.save(tft.state_dict(), 'tft_model.pth')
best_model_path = trainer.checkpoint_callback.best_model_path
best_tft = TemporalFusionTransformer.load_from_checkpoint(best_model_path)
tft_predictions = best_tft.predict(training, mode="raw")

# Plot the predictions
plt.figure(figsize=(12, 6))
plt.plot(df['Close'].values, label='Actual Prices')
plt.plot(range(len(df), len(df) + len(arima_forecast)), arima_forecast, label='ARIMA Forecast')
plt.plot(prophet_forecast['ds'].values[-30:], prophet_forecast['yhat'].values[-30:], label='Prophet Forecast')
plt.plot(range(len(df), len(df) + len(xgb_forecast)), xgb_forecast, label='XGBoost Forecast')
plt.plot(range(len(df), len(df) + len(future_predictions)), future_predictions, label='LSTM Forecast')
plt.plot(range(len(df), len(df) + len(transformer_predictions)), transformer_predictions, label='Transformer Forecast')
plt.plot(df['time_idx'].values[-len(tft_predictions):], tft_predictions, label='TFT Forecast')
plt.title('Bitcoin Price Prediction using Various Models')
plt.legend()
plt.show()

Larz60+ write Dec-28-2024, 12:57 PM:
As notified by Buran in previous post:
Please post all code, output and errors (it it's entirety) between their respective tags. Refer to BBCode help topic on how to post. Use the "Preview Post" button to make sure the code is presented as you expect before hitting the "Post Reply/Thread" button.

Possibly Related Threads…
Thread		Author	Replies	Views	Last Post
	Feature Selection in Machine Learning	shiv11	4	4,635	Apr-09-2024, 02:22 PM Last Post: DataScience
	[machine learning] identifying a number 0-9 from a 28x28 picture, not working	SheeppOSU	0	2,463	Apr-09-2021, 12:38 AM Last Post: SheeppOSU
	Getting started in Machine Learning	Harshil	5	4,657	Dec-07-2020, 04:06 PM Last Post: sridhar
	Python Machine Learning: For Data Extraction	JaneTan	0	2,504	Nov-24-2020, 06:45 AM Last Post: JaneTan
	IndexError in Array while trying to do machine learning	Mariaoye	0	2,737	Nov-12-2020, 12:35 AM Last Post: Mariaoye
	Errors with Machine Learning trading bot-- not sure why	MattKahn13	0	1,893	Aug-07-2020, 08:19 PM Last Post: MattKahn13
	How useful is PCA for machine learning?	Marvin93	0	2,160	Aug-07-2020, 02:07 PM Last Post: Marvin93
	How to extract data from paragraph using Machine Learning with python?	bccsthilina	2	4,220	Jul-27-2020, 07:02 AM Last Post: hussainmujtaba
	Predicting/Forecasting Future Values	BadWhite	1	3,201	Jun-15-2020, 11:30 AM Last Post: hussainmujtaba
	Machine Learning: Process	Enanda	13	6,700	Mar-18-2020, 02:02 AM Last Post: jefsummers

Bitcoin Machine Learning and Future forcaste

User Panel Messages

Announcements