Source code for pylag.parallel.simulator

"""
This module contains classes that can be used to manage the running of
PyLag simulations in parallel mode.

See Also
--------
pylag.simulator - Simulators for serial execution
"""

from __future__ import print_function

import logging
import traceback
import numpy as np

from mpi4py import MPI

from pylag.time_manager import TimeManager
from pylag.particle_initialisation import get_initial_particle_state_reader
from pylag.restart import RestartFileCreator
from pylag.netcdf_logger import NetCDFLogger
from pylag.data_types_python import DTYPE_INT, DTYPE_FLOAT

from pylag.parallel.model_factory import get_model


[docs]def get_simulator(config):
    """ Factory method for PyLag MPI simulators

    Parameters
    ----------
    config : ConfigParser
        PyLag configuraton object

    Returns
    -------
     : pylag.parallel.simulator.Simulator
         Object of type Simulator
    """

    if config.get("SIMULATION", "simulation_type") == "trace":
        return TraceSimulator(config)
    else:
        raise ValueError('Unsupported simulation type.')


[docs]class Simulator(object):
    """ Simulator

    Abstract base class for PyLag MPI simulators.
    """
[docs]    def run(self):
        """ Run a PyLag MPI simulation
        """
        pass


[docs]class TraceSimulator(Simulator):
    """ Trace simulator

    Simulator for tracing particle pathlines through time. Trace
    simulators can perform forward or backward in time integrations.

    Parameters
    ----------
    config : ConfigParser
        PyLag configuraton object
    """
    def __init__(self, config):
        # MPI objects and variables
        comm = MPI.COMM_WORLD
        rank = comm.Get_rank()
        size = comm.Get_size()
        
        # Configuration object
        self._config = config

        # Time manager - for controlling time stepping etc
        self.time_manager = TimeManager(self._config)

        # Model object
        self.model = get_model(self._config, self.time_manager.datetime_start,
                               self.time_manager.datetime_end)

        # Initial particle state readers are used to read in intial
        # particle state data. This only happens on the lead process,
        # so we initialise it to None here, then override this below
        # for the root process.
        self.initial_particle_state_reader = None

        # Flag indicating whether or not restart files should be created
        self.create_restarts = self._config.getboolean('RESTART',
                                                       'create_restarts')

        # Restart creators create restart files. This only happens on
        # the lead process, so we initialise it to None here, then
        # override this below for the root process.
        self.restart_creator = None

        # Overrides when on the root process
        if rank == 0:
            self.initial_particle_state_reader = \
                get_initial_particle_state_reader(self._config)
     
            if self.create_restarts:
                self.restart_creator = RestartFileCreator(self._config)

        # Data logger
        self.data_logger = None

[docs]    def run(self):
        """ Run a simulation

        Run a single or multiple integrations according to options set out
        in the run configuration file.

        Returns
        -------
         : None
        """
        # MPI objects and variables
        comm = MPI.COMM_WORLD
        rank = comm.Get_rank()
        size = comm.Get_size()

        # Read in particle initial positions from file
        if rank == 0:
            # For logging
            logger = logging.getLogger(__name__)

            # Read in particle initial positions from file - these will be used to
            # create the initial particle set.
            try:
                n_particles, group_ids, x1_positions, x2_positions, x3_positions = \
                    self.initial_particle_state_reader.get_particle_data()
            except Exception as e:
                print(traceback.format_exc())
                comm.Abort()

            if n_particles == len(group_ids):
                self.n_particles = n_particles
                logger.info(f'Particle seed contains {self.n_particles} '
                            f'particles.')
            else:
                logger.error(f'Error reading particle initial positions from '
                             f'file. The number of particles specified in the '
                             f'file is {self.n_particles}. The actual number '
                             f'found while parsing the file was '
                             f'{len(group_ids)}.')
                comm.Abort()

            # Insist on the even distribution of particles
            if self.n_particles % size == 0:
                my_n_particles = self.n_particles//size
            else:
                logger.error(f'For now the total number of particles must '
                             f'divide equally among the set of workers. The '
                             f'total number of particles = {self.n_particles}. '
                             f'The total number of workers = {size}.')
                comm.Abort()
        else:
            group_ids = None
            x1_positions = None
            x2_positions = None
            x3_positions = None

            my_n_particles = None

        # Broadcast local particle numbers
        my_n_particles = comm.bcast(my_n_particles, root=0)

        # Local arrays for holding particle data
        my_group_ids = np.empty(my_n_particles, dtype=DTYPE_INT)
        my_x1_positions = np.empty(my_n_particles, dtype=DTYPE_FLOAT)
        my_x2_positions = np.empty(my_n_particles, dtype=DTYPE_FLOAT)
        my_x3_positions = np.empty(my_n_particles, dtype=DTYPE_FLOAT)

        # Scatter particles across workers
        comm.Scatter(group_ids,my_group_ids,root=0)
        comm.Scatter(x1_positions,my_x1_positions,root=0)
        comm.Scatter(x2_positions,my_x2_positions,root=0)
        comm.Scatter(x3_positions,my_x3_positions,root=0)

        # Display particle count if running in debug mode
        if self._config.get('GENERAL', 'log_level') == 'DEBUG':
            print(f'Processor with rank {rank} is managing {my_n_particles} '
                  f'particles.')

        # Initialise particle arrays
        self.model.set_particle_data(my_group_ids, my_x1_positions,
                                     my_x2_positions, my_x3_positions)

        # Run the ensemble
        run_simulation = True
        while run_simulation:
            # Read data into arrays
            self.model.read_input_data(self.time_manager.time)

            # Seed the model
            self.model.seed(self.time_manager.time)

            if rank == 0:
                # Data logger on the root process
                file_name = ''.join([self._config.get('GENERAL', 'output_file'),
                                     f'_{self.time_manager.current_release}'])
                start_datetime = self.time_manager.datetime_start
                grid_names = self.model.get_grid_names()
                self.data_logger = NetCDFLogger(self._config, file_name,
                                                start_datetime, n_particles,
                                                grid_names)

                # Write particle group ids to file
                self.data_logger.write_group_ids(group_ids)

            # Write initial state to file
            particle_diagnostics = self.model.get_diagnostics(
                self.time_manager.time)
            self._save_data(particle_diagnostics)

            # The main update loop
            if rank == 0:
                logger.info(f'Starting ensemble member '
                            f'{self.time_manager.current_release} ...')
            while abs(self.time_manager.time) < abs(self.time_manager.time_end):
                if rank == 0:
                    percent_complete = abs(self.time_manager.time) / \
                                       abs(self.time_manager.time_end) * 100
                    if percent_complete % 10 == 0:
                        logger.info(f'{int(percent_complete)}% complete ...')
                try:
                    # Update
                    self.model.update(self.time_manager.time)
                    self.time_manager.update_current_time()

                    # Save diagnostic data
                    if self.time_manager.write_output_to_file() == 1:
                        particle_diagnostics = self.model.get_diagnostics(
                            self.time_manager.time)
                        self._save_data(particle_diagnostics)

                    # Sync diagnostic data to disk
                    if rank == 0 and self.time_manager.sync_data_to_disk() == 1:
                        self.data_logger.sync()

                    # Create restart
                    if self.create_restarts:
                        if self.time_manager.create_restart_file() == 1:
                            particle_data = self.model.get_particle_data()
                            self._create_restart(particle_data)

                    self.model.read_input_data(self.time_manager.time)
                except Exception as e:
                    print(traceback.format_exc())
                    comm.Abort()

            # Close the current data logger
            if rank == 0:
                logger.info('100% complete ...')
                self.data_logger.close()

            # Run another simulation?
            if self.time_manager.new_simulation():
                run_simulation = True

                # Set up data access for the new simulation
                self.model.setup_input_data_access(self.time_manager.datetime_start,
                                                   self.time_manager.datetime_end)
            else:
                run_simulation = False

    def _save_data(self, diags):
        # MPI objects and variables
        comm = MPI.COMM_WORLD
        rank = comm.Get_rank()

        global_diags = {}
        for diag in list(diags.keys()):
            if rank == 0:
                global_diags[diag] = np.empty(self.n_particles,
                                              dtype=type(diags[diag][0]))
            else:
                global_diags[diag] = None

        # Pool diagnostics
        for diag in list(diags.keys()):
            comm.Gather(np.array(diags[diag]), global_diags[diag], root=0)

        # Write to file
        if rank == 0:
            self.data_logger.write(self.time_manager.time, global_diags)

    def _create_restart(self, data):
        """ Create restart file

        The real work is done by RestartFileCreator. Here, we simply pool
        particle data from each process before passing it on. Writing
        occurs on the root process only.

        Parameters:
        -----------
        data : dict
            Dictionary containing particle data.

        Returns:
        --------
        N/A
        """

        # MPI objects and variables
        comm = MPI.COMM_WORLD
        rank = comm.Get_rank()

        global_data = {}
        for key in list(data.keys()):
            if rank == 0:
                global_data[key] = np.empty(self.n_particles,
                                            dtype=type(data[key][0]))
            else:
                global_data[key] = None

        # Pool data
        for key in list(data.keys()):
            comm.Gather(np.array(data[key]), global_data[key], root=0)

        # Write to file
        if rank == 0:
            file_name_stem = f'restart_{self.time_manager.current_release}'
            datetime_current = self.time_manager.datetime_current
            self.restart_creator.create(file_name_stem, self.n_particles,
                                        datetime_current, global_data)


__all__ = ['Simulator',
           'TraceSimulator',
           'get_simulator']