tatami_stats/grouped__medians_8hpp_source.html

#ifndef TATAMI_STATS_GROUPED_MEDIANS_HPP

#define TATAMI_STATS_GROUPED_MEDIANS_HPP


#include "utils.hpp"

#include "medians.hpp"


#include <vector>

#include <algorithm>


#include "tatami/tatami.hpp"

#include "sanisizer/sanisizer.hpp"


namespace tatami_stats {


namespace grouped_medians {


struct Options {

    bool skip_nan = false;


    int num_threads = 1;

};


template<typename Value_, typename Index_, typename Group_, class GroupSizes_, typename Output_>


void apply(bool row, const tatami::Matrix<Value_, Index_>& mat, const Group_* group, const GroupSizes_& group_sizes, Output_** output, const Options& mopt) {

    Index_ dim = (row ? mat.nrow() : mat.ncol());

    Index_ otherdim = (row ? mat.ncol() : mat.nrow());


    tatami::parallelize([&](int, Index_ start, Index_ len) -> void {

        auto xbuffer = tatami::create_container_of_Index_size<std::vector<Value_> >(otherdim);


        auto ngroups = group_sizes.size();

        auto workspace = sanisizer::create<std::vector<std::vector<Value_> > >(ngroups);

        for (decltype(ngroups) g = 0; g < ngroups; ++g) {

            workspace[g].reserve(group_sizes[g]);

        }


        if (mat.sparse()) {

            tatami::Options opt;

            opt.sparse_ordered_index = false;


            auto ext = tatami::consecutive_extractor<true>(mat, row, start, len, opt);

            auto ibuffer = tatami::create_container_of_Index_size<std::vector<Index_> >(otherdim);

            for (Index_ i = 0; i < len; ++i) {

                auto range = ext->fetch(xbuffer.data(), ibuffer.data());

                for (Index_ j = 0; j < range.number; ++j) {

                    workspace[group[range.index[j]]].push_back(range.value[j]);

                }


                for (decltype(ngroups) g = 0; g < ngroups; ++g) {

                    auto& w = workspace[g];

                    output[g][i + start] = medians::direct<Output_, Value_, Index_>(w.data(), w.size(), group_sizes[g], mopt.skip_nan);

                    w.clear();

                }

            }


        } else {

            auto ext = tatami::consecutive_extractor<false>(mat, row, start, len);

            for (Index_ i = 0; i < len; ++i) {

                auto ptr = ext->fetch(xbuffer.data());

                for (Index_ j = 0; j < otherdim; ++j) {

                    workspace[group[j]].push_back(ptr[j]);

                }


                for (decltype(ngroups) g = 0; g < ngroups; ++g) {

                    auto& w = workspace[g];

                    output[g][i + start] = medians::direct<Output_, Value_, Index_>(w.data(), w.size(), mopt.skip_nan);

                    w.clear();

                }

            }

        }

    }, dim, mopt.num_threads);

}


// Back-compatibility.

template<typename Value_, typename Index_, typename Group_, class GroupSizes_, typename Output_>

void apply(bool row, const tatami::Matrix<Value_, Index_>* p, const Group_* group, const GroupSizes_& group_sizes, Output_** output, const Options& mopt) {

    apply(row, *p, group, group_sizes, output, mopt);

}

template<typename Output_ = double, typename Value_, typename Index_, typename Group_>


std::vector<std::vector<Output_> > by_row(const tatami::Matrix<Value_, Index_>& mat, const Group_* group, const Options& mopt) {

    auto mydim = mat.nrow();

    auto group_sizes = tabulate_groups(group, mat.ncol());


    auto output = sanisizer::create<std::vector<std::vector<Output_> > >(group_sizes.size());

    std::vector<Output_*> ptrs;

    ptrs.reserve(output.size());

    for (auto& o : output) {

        o.resize(mydim);

        ptrs.push_back(o.data());

    }


    apply(true, mat, group, group_sizes, ptrs.data(), mopt);

    return output;

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_row(const tatami::Matrix<Value_, Index_>* p, const Group_* group, const Options& mopt) {

    return by_row<Output_>(*p, group, mopt);

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_row(const tatami::Matrix<Value_, Index_>& mat, const Group_* group) {

    return by_row<Output_>(mat, group, Options());

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_row(const tatami::Matrix<Value_, Index_>* p, const Group_* group) {

    return by_row<Output_>(*p, group);

}

template<typename Output_ = double, typename Value_, typename Index_, typename Group_>


std::vector<std::vector<Output_> > by_column(const tatami::Matrix<Value_, Index_>& mat, const Group_* group, const Options& mopt) {

    auto mydim = mat.ncol();

    auto group_sizes = tabulate_groups(group, mat.nrow());


    auto output = sanisizer::create<std::vector<std::vector<Output_> > >(group_sizes.size());

    std::vector<Output_*> ptrs;

    ptrs.reserve(output.size());

    for (auto& o : output) {

        o.resize(mydim);

        ptrs.push_back(o.data());

    }


    apply(false, mat, group, group_sizes, ptrs.data(), mopt);

    return output;

}


// Back-compatibility.

template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_column(const tatami::Matrix<Value_, Index_>* p, const Group_* group, const Options& mopt) {

    return by_column<Output_>(*p, group, mopt);

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_column(const tatami::Matrix<Value_, Index_>& mat, const Group_* group) {

    return by_column<Output_>(mat, group, Options());

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_column(const tatami::Matrix<Value_, Index_>* p, const Group_* group) {

    return by_column<Output_>(*p, group);

}

}


}


#endif

tatami::Matrix

tatami::Matrix::ncol
virtual Index_ ncol() const=0

tatami::Matrix::nrow
virtual Index_ nrow() const=0

tatami::Matrix::sparse
virtual std::unique_ptr< MyopicSparseExtractor< Value_, Index_ > > sparse(bool row, const Options &opt) const=0

medians.hpp
Compute row and column medians from a tatami::Matrix.

tatami_stats::grouped_medians::by_column
std::vector< std::vector< Output_ > > by_column(const tatami::Matrix< Value_, Index_ > &mat, const Group_ *group, const Options &mopt)
Definition grouped_medians.hpp:203

tatami_stats::grouped_medians::apply
void apply(bool row, const tatami::Matrix< Value_, Index_ > &mat, const Group_ *group, const GroupSizes_ &group_sizes, Output_ **output, const Options &mopt)
Definition grouped_medians.hpp:68

tatami_stats::grouped_medians::by_row
std::vector< std::vector< Output_ > > by_row(const tatami::Matrix< Value_, Index_ > &mat, const Group_ *group, const Options &mopt)
Definition grouped_medians.hpp:148

tatami_stats::medians::direct
Output_ direct(Value_ *ptr, Index_ num, bool skip_nan)
Definition medians.hpp:83

tatami_stats
Functions to compute statistics from a tatami::Matrix.
Definition counts.hpp:18

tatami_stats::tabulate_groups
std::vector< Size_ > tabulate_groups(const Group_ *group, Size_ n)
Definition utils.hpp:53

tatami::parallelize
void parallelize(Function_ fun, Index_ tasks, int threads)

tatami::create_container_of_Index_size
Container_ create_container_of_Index_size(Index_ x, Args_ &&... args)

tatami::consecutive_extractor
auto consecutive_extractor(const Matrix< Value_, Index_ > &matrix, bool row, Index_ iter_start, Index_ iter_length, Args_ &&... args)

tatami::Options

tatami::Options::sparse_ordered_index
bool sparse_ordered_index

tatami_stats::grouped_medians::Options
Grouped median calculation options.
Definition grouped_medians.hpp:30

tatami_stats::grouped_medians::Options::num_threads
int num_threads
Definition grouped_medians.hpp:41

tatami_stats::grouped_medians::Options::skip_nan
bool skip_nan
Definition grouped_medians.hpp:35

tatami.hpp

utils.hpp
Utilities for computing matrix statistics.