Source code for quaterion.main

import warnings
from typing import Dict, Iterable, Optional, Sized, Union

import pytorch_lightning as pl
import torch
from pytorch_lightning.callbacks import EarlyStopping, RichModelSummary
from pytorch_lightning.utilities.warnings import PossibleUserWarning
from quaterion_models import SimilarityModel
from torch.utils.data import Dataset

from quaterion.dataset.similarity_data_loader import (
    GroupSimilarityDataLoader,
    PairsSimilarityDataLoader,
    SimilarityDataLoader,
)
from quaterion.eval.evaluator import Evaluator
from quaterion.loss import GroupLoss, PairwiseLoss
from quaterion.train.cache import CacheType
from quaterion.train.callbacks import CleanupCallback, MetricsCallback
from quaterion.train.trainable_model import TrainableModel
from quaterion.utils.enums import TrainStage
from quaterion.utils.progress_bar import QuaterionProgressBar


[docs]class Quaterion:
    """Fine-tuning entry point

    Contains methods to launch the actual training and evaluation processes.
    """

[docs]    @classmethod
    def fit(
        cls,
        trainable_model: TrainableModel,
        trainer: Optional[pl.Trainer],
        train_dataloader: SimilarityDataLoader,
        val_dataloader: Optional[SimilarityDataLoader] = None,
        ckpt_path: Optional[str] = None,
    ):
        """Handle training routine

        Assemble data loaders, performs caching and whole training process.

        Args:
            trainable_model: model to fit
            trainer:
                `pytorch_lightning.Trainer` instance to handle fitting routine internally.
                If `None` passed, trainer will be created with :meth:`Quaterion.trainer_defaults`.
                The default parameters are intended to serve as a quick start for learning the model, and we
                encourage users to try different parameters if the default ones do not give a satisfactory result.
            train_dataloader: DataLoader instance to retrieve samples during training
                stage
            val_dataloader: Optional DataLoader instance to retrieve samples during
                validation stage
            ckpt_path: Path/URL of the checkpoint from which training is resumed.
                If there is no checkpoint file at the path, an exception is raised.
                If resuming from mid-epoch checkpoint, training will start from the beginning of
                the next epoch.
        """

        if isinstance(train_dataloader, PairsSimilarityDataLoader):
            if not isinstance(trainable_model.loss, PairwiseLoss):
                raise NotImplementedError(
                    "Can't use PairsSimilarityDataLoader with non-PairwiseLoss"
                )

        if isinstance(train_dataloader, GroupSimilarityDataLoader):
            if not isinstance(trainable_model.loss, GroupLoss):
                raise NotImplementedError(
                    "Pair samplers are not implemented yet. "
                    "Try other loss/data loader"
                )

        if trainer is None:
            trainer = pl.Trainer(
                **cls.trainer_defaults(
                    trainable_model=trainable_model, train_dataloader=train_dataloader
                )
            )

        trainer.callbacks.append(CleanupCallback())
        trainer.callbacks.append(MetricsCallback())
        # Prepare data loaders for training

        trainable_model.setup_dataloader(train_dataloader)
        if val_dataloader:
            trainable_model.setup_dataloader(val_dataloader)

        trainable_model.setup_cache(
            trainer=trainer,
            train_dataloader=train_dataloader,
            val_dataloader=val_dataloader,
        )

        with warnings.catch_warnings():
            if train_dataloader.full_cache_used:
                warnings.filterwarnings(
                    "ignore", category=PossibleUserWarning, message="The dataloader.*"
                )

            trainer.fit(
                model=trainable_model,
                train_dataloaders=train_dataloader,
                val_dataloaders=val_dataloader,
                ckpt_path=ckpt_path,
            )

[docs]    @classmethod
    def evaluate(
        cls,
        evaluator: Evaluator,
        dataset: Union[Sized, Iterable, Dataset],
        model: SimilarityModel,
    ) -> Dict[str, torch.Tensor]:
        """
        Compute metrics on a dataset

        Args:
            evaluator: Object which holds the configuration of which metrics to use and how to
                obtain samples for them
            dataset: Sized object, like list, tuple, torch.utils.data.Dataset, etc. to compute
                metrics
            model: SimilarityModel instance to perform objects encoding

        Returns:
            Dict[str, torch.Tensor] - dict of computed metrics.
            Where key - name of the metric and value - metric estimated values

        """
        return evaluator.evaluate(dataset, model)

[docs]    @staticmethod
    def trainer_defaults(
        trainable_model: TrainableModel = None,
        train_dataloader: SimilarityDataLoader = None,
    ):
        """Reasonable default parameters for `pytorch_lightning.Trainer`

        This function generates parameter set for Trainer, which are considered
        "recommended" for most use-cases of Quaterion.
        Quaterion similarity learning train process has characteristics that differentiate it from
        regular deep learning model training.
        This default parameters may be overwritten, if you need some special behaviour for your special task.

        Consider overriding default parameters if you need to adjust Trainer parameters:

        Example::

            trainer_kwargs = Quaterion.trainer_defaults(
                trainable_model=model,
                train_dataloader=train_dataloader
            )
            trainer_kwargs['logger'] = pl.loggers.WandbLogger(
                name="example_model",
                project="example_project",
            )
            trainer_kwargs['callbacks'].append(YourCustomCallback())
            trainer = pl.Trainer(**trainer_kwargs)

        Args:
            trainable_model: We will try to adjust default params based on model configuration, if provided
            train_dataloader: If provided, trainer params will be adjusted according to dataset

        Returns:
            kwargs for `pytorch_lightning.Trainer`
        """
        defaults = {
            "callbacks": [
                QuaterionProgressBar(console_kwargs={"tab_size": 4}),
                EarlyStopping(f"{TrainStage.VALIDATION}_loss"),
                RichModelSummary(max_depth=3),
            ],
            "accelerator": "auto",
            "devices": 1,
            "max_epochs": -1,
            "enable_model_summary": False,  # We define our custom model summary
        }

        # Adjust default parameters according to the dataloader configuration
        if train_dataloader:
            try:
                num_batches = len(train_dataloader)
                if num_batches > 0:
                    defaults["log_every_n_steps"] = min(50, num_batches)
            except Exception:  # If dataset has to length
                pass

        # Adjust default parameters according to model configuration
        if trainable_model:
            # If the cache is enabled and there are no
            # trainable encoders - checkpointing on each epoch might become a bottleneck
            cache_config = trainable_model.configure_caches()
            all_encoders_frozen = all(
                not encoder.trainable
                for encoder in trainable_model.model.encoders.values()
            )
            cache_configured = (
                cache_config is not None and cache_config.cache_type != CacheType.NONE
            )
            disable_checkpoints = all_encoders_frozen and cache_configured

            if disable_checkpoints:
                defaults["enable_checkpointing"] = False
        return defaults
Source code for quaterion.main

Qdrant

Similarity Learning

Community