Smac

The SMACOptimizer, is a wrapper around the smac optimizer.

Requirements

This requires smac which can be installed with:

pip install amltk[smac]

# Or directly
pip install smac

This uses ConfigSpace as its search_space() to optimize.

Users should report results using trial.success().

Visit their documentation for what you can pass to SMACOptimizer.create().

The below example shows how you can use SMAC to optimize an sklearn pipeline.

from __future__ import annotations

import logging

from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

from amltk.optimization.optimizers.smac import SMACOptimizer
from amltk.scheduling import Scheduler
from amltk.optimization import History, Trial, Metric
from amltk.pipeline import Component, Node

logging.basicConfig(level=logging.INFO)


def target_function(trial: Trial, pipeline: Node) -> Trial.Report:
    X, y = load_iris(return_X_y=True)
    X_train, X_test, y_train, y_test = train_test_split(X, y)
    clf = pipeline.configure(trial.config).build("sklearn")

    with trial.begin():
        clf.fit(X_train, y_train)
        y_pred = clf.predict(X_test)
        accuracy = accuracy_score(y_test, y_pred)
        return trial.success(accuracy=accuracy)

    return trial.fail()

pipeline = Component(RandomForestClassifier, space={"n_estimators": (10, 100), "max_samples": (0.1, 0.9)})

metric = Metric("accuracy", minimize=False, bounds=(0, 1))
optimizer = SMACOptimizer.create(space=pipeline, metrics=metric, bucket="smac-doc-example")

N_WORKERS = 2
scheduler = Scheduler.with_processes(N_WORKERS)
task = scheduler.task(target_function)

history = History()

@scheduler.on_start(repeat=N_WORKERS)
def on_start():
    trial = optimizer.ask()
    task.submit(trial, pipeline)

@task.on_result
def tell_and_launch_trial(_, report: Trial.Report):
    if scheduler.running():
        optimizer.tell(report)
        trial = optimizer.ask()
        task.submit(trial, pipeline)

@task.on_result
def add_to_history(_, report: Trial.Report):
    history.add(report)

scheduler.run(timeout=3, wait=False)

print(history.df())

                                                     status  ...  time:unit
name                                                         ...           
config_id=2_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=1_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=3_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=4_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=6_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=5_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=7_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=8_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=10_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=9_seed=907842988_budget=None_instance...  success  ...    seconds
config_id=11_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=12_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=14_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=13_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=15_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=16_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=18_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=17_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=20_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=19_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=21_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=22_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=23_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=24_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=25_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=26_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=27_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=28_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=30_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=29_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=31_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=32_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=33_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=34_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=36_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=35_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=37_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=39_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=38_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=40_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=41_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=42_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=43_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=44_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=45_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=46_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=47_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=48_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=49_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=50_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=51_seed=907842988_budget=None_instanc...  success  ...    seconds
config_id=52_seed=907842988_budget=None_instanc...  success  ...    seconds

[52 rows x 20 columns]