tatami_stats/grouped__sums_8hpp_source.html

#ifndef TATAMI_STATS_GROUPED_SUMS_HPP

#define TATAMI_STATS_GROUPED_SUMS_HPP


#include "utils.hpp"

#include "tatami/tatami.hpp"

#include "sums.hpp"

#include <vector>

#include <algorithm>

#include <cstddef>


namespace tatami_stats {


namespace grouped_sums {


struct Options {

    bool skip_nan = false;


    int num_threads = 1;

};


template<typename Value_, typename Index_, typename Group_, typename Output_>


void apply(bool row, const tatami::Matrix<Value_, Index_>& mat, const Group_* group, std::size_t num_groups, Output_** output, const Options& sopt) {

    Index_ dim = (row ? mat.nrow() : mat.ncol());

    Index_ otherdim = (row ? mat.ncol() : mat.nrow());


    if (mat.sparse()) {

        if (mat.prefer_rows() == row) {

            tatami::parallelize([&](int, Index_ start, Index_ len) -> void {

                auto ext = tatami::consecutive_extractor<true>(mat, row, start, len);

                std::vector<Value_> xbuffer(otherdim);

                std::vector<Index_> ibuffer(otherdim);

                std::vector<Output_> tmp(num_groups);


                for (Index_ i = 0; i < len; ++i) {

                    auto range = ext->fetch(xbuffer.data(), ibuffer.data());

                    std::fill(tmp.begin(), tmp.end(), static_cast<Output_>(0));


                    internal::nanable_ifelse<Value_>(

                        sopt.skip_nan,

                        [&]() -> void {

                            for (int j = 0; j < range.number; ++j) {

                                auto val = range.value[j];

                                if (!std::isnan(val)) {

                                    tmp[group[range.index[j]]] += val;

                                }

                            }

                        },

                        [&]() -> void {

                            for (int j = 0; j < range.number; ++j) {

                                tmp[group[range.index[j]]] += range.value[j];

                            }

                        }

                    );


                    for (decltype(num_groups) g = 0; g < num_groups; ++g) {

                        output[g][i + start] = tmp[g];

                    }

                }

            }, dim, sopt.num_threads);


        } else {

            // Order within each observed vector doesn't affect numerical

            // precision of the outcome, as addition order for each objective

            // vector is already well-defined for a running calculation.

            tatami::Options opt;

            opt.sparse_ordered_index = false;


            tatami::parallelize([&](int thread, Index_ start, Index_ len) -> void {

                std::vector<sums::RunningSparse<Output_, Value_, Index_> > runners;

                runners.reserve(num_groups);

                std::vector<LocalOutputBuffer<Output_> > local_output;

                local_output.reserve(num_groups);


                for (decltype(num_groups) g = 0; g < num_groups; ++g) {

                    local_output.emplace_back(thread, start, len, output[g]);

                    runners.emplace_back(local_output.back().data(), sopt.skip_nan, start);

                }


                auto ext = tatami::consecutive_extractor<true>(mat, !row, static_cast<Index_>(0), otherdim, start, len, opt);

                std::vector<Value_> xbuffer(len);

                std::vector<Index_> ibuffer(len);


                for (int i = 0; i < otherdim; ++i) {

                    auto range = ext->fetch(xbuffer.data(), ibuffer.data());

                    runners[group[i]].add(range.value, range.index, range.number);

                }


                for (decltype(num_groups) g = 0; g < num_groups; ++g) {

                    local_output[g].transfer();

                }

            }, dim, sopt.num_threads);

        }


    } else {

        if (mat.prefer_rows() == row) {

            tatami::parallelize([&](int, Index_ start, Index_ len) -> void {

                auto ext = tatami::consecutive_extractor<false>(mat, row, start, len);

                std::vector<Value_> xbuffer(otherdim);

                std::vector<Output_> tmp(num_groups);


                for (Index_ i = 0; i < len; ++i) {

                    auto ptr = ext->fetch(xbuffer.data());

                    std::fill(tmp.begin(), tmp.end(), static_cast<Output_>(0));


                    internal::nanable_ifelse<Value_>(

                        sopt.skip_nan,

                        [&]() -> void {

                            for (Index_ j = 0; j < otherdim; ++j) {

                                auto val = ptr[j];

                                if (!std::isnan(val)) {

                                    tmp[group[j]] += val;

                                }

                            }

                        },

                        [&]() -> void {

                            for (Index_ j = 0; j < otherdim; ++j) {

                                tmp[group[j]] += ptr[j];

                            }

                        }

                    );


                    for (decltype(num_groups) g = 0; g < num_groups; ++g) {

                        output[g][i + start] = tmp[g];

                    }

                }

            }, dim, sopt.num_threads);


        } else {

            tatami::parallelize([&](int thread, Index_ start, Index_ len) -> void {

                std::vector<sums::RunningDense<Output_, Value_, Index_> > runners;

                runners.reserve(num_groups);

                std::vector<LocalOutputBuffer<Output_> > local_output;

                local_output.reserve(num_groups);


                for (decltype(num_groups) g = 0; g < num_groups; ++g) {

                    local_output.emplace_back(thread, start, len, output[g]);

                    runners.emplace_back(len, local_output.back().data(), sopt.skip_nan);

                }


                std::vector<Value_> xbuffer(len);

                auto ext = tatami::consecutive_extractor<false>(mat, !row, static_cast<Index_>(0), otherdim, start, len);


                for (int i = 0; i < otherdim; ++i) {

                    auto ptr = ext->fetch(xbuffer.data());

                    runners[group[i]].add(ptr);

                }


                for (decltype(num_groups) g = 0; g < num_groups; ++g) {

                    local_output[g].transfer();

                }

            }, dim, sopt.num_threads);

        }

    }

}


// Back-compatibility.

template<typename Value_, typename Index_, typename Group_, typename Output_>

void apply(bool row, const tatami::Matrix<Value_, Index_>* p, const Group_* group, std::size_t num_groups, Output_** output, const Options& sopt) {

    apply(row, *p, group, num_groups, output, sopt);

}

template<typename Output_ = double, typename Value_, typename Index_, typename Group_>


std::vector<std::vector<Output_> > by_row(const tatami::Matrix<Value_, Index_>& mat, const Group_* group, const Options& sopt) {

    auto mydim = mat.nrow();

    auto ngroup = total_groups(group, mat.ncol());


    std::vector<std::vector<Output_> > output(ngroup);

    std::vector<Output_*> ptrs;

    ptrs.reserve(output.size());

    for (auto& o : output) {

        o.resize(mydim);

        ptrs.push_back(o.data());

    }


    apply(true, mat, group, ngroup, ptrs.data(), sopt);

    return output;

}


// Back-compatibility.

template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_row(const tatami::Matrix<Value_, Index_>* p, const Group_* group, const Options& sopt) {

    return by_row<Output_>(*p, group, sopt);

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_row(const tatami::Matrix<Value_, Index_>& mat, const Group_* group) {

    return by_row<Output_>(mat, group, Options());

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_row(const tatami::Matrix<Value_, Index_>* p, const Group_* group) {

    return by_row<Output_>(*p, group);

}

template<typename Output_ = double, typename Value_, typename Index_, typename Group_>


std::vector<std::vector<Output_> > by_column(const tatami::Matrix<Value_, Index_>& mat, const Group_* group, const Options& sopt) {

    auto mydim = mat.ncol();

    auto ngroup = total_groups(group, mat.nrow());


    std::vector<std::vector<Output_> > output(ngroup);

    std::vector<Output_*> ptrs;

    ptrs.reserve(output.size());

    for (auto& o : output) {

        o.resize(mydim);

        ptrs.push_back(o.data());

    }


    apply(false, mat, group, ngroup, ptrs.data(), sopt);

    return output;

}


// Back-compatibility.

template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_column(const tatami::Matrix<Value_, Index_>* p, const Group_* group, const Options& sopt) {

    return by_column<Output_>(*p, group, sopt);

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_column(const tatami::Matrix<Value_, Index_>& mat, const Group_* group) {

    return by_column<Output_>(mat, group, Options());

}


template<typename Output_ = double, typename Value_, typename Index_, typename Group_>

std::vector<std::vector<Output_> > by_column(const tatami::Matrix<Value_, Index_>* p, const Group_* group) {

    return by_column<Output_>(*p, group);

}

}


}


#endif

tatami::Matrix

tatami::Matrix::ncol
virtual Index_ ncol() const=0

tatami::Matrix::nrow
virtual Index_ nrow() const=0

tatami::Matrix::prefer_rows
virtual bool prefer_rows() const=0

tatami::Matrix::sparse
virtual std::unique_ptr< MyopicSparseExtractor< Value_, Index_ > > sparse(bool row, const Options &opt) const=0

tatami_stats::counts::nan::by_row
std::vector< Output_ > by_row(const tatami::Matrix< Value_, Index_ > &mat, const Options &nopt)
Definition counts.hpp:229

tatami_stats::counts::nan::by_column
std::vector< Output_ > by_column(const tatami::Matrix< Value_, Index_ > &mat, const Options &nopt)
Definition counts.hpp:288

tatami_stats::counts::apply
void apply(bool row, const tatami::Matrix< Value_, Index_ > &mat, Output_ *output, int num_threads, Condition_ condition)
Definition counts.hpp:44

tatami_stats::grouped_sums::apply
void apply(bool row, const tatami::Matrix< Value_, Index_ > &mat, const Group_ *group, std::size_t num_groups, Output_ **output, const Options &sopt)
Definition grouped_sums.hpp:65

tatami_stats
Functions to compute statistics from a tatami::Matrix.
Definition counts.hpp:18

tatami_stats::total_groups
std::size_t total_groups(const Group_ *group, std::size_t n)
Definition utils.hpp:29

tatami::parallelize
void parallelize(Function_ fun, Index_ tasks, int threads)

tatami::consecutive_extractor
auto consecutive_extractor(const Matrix< Value_, Index_ > &matrix, bool row, Index_ iter_start, Index_ iter_length, Args_ &&... args)

tatami::Options

tatami::Options::sparse_ordered_index
bool sparse_ordered_index

tatami_stats::grouped_sums::Options
Grouped summation options.
Definition grouped_sums.hpp:28

tatami_stats::grouped_sums::Options::skip_nan
bool skip_nan
Definition grouped_sums.hpp:33

tatami_stats::grouped_sums::Options::num_threads
int num_threads
Definition grouped_sums.hpp:39

sums.hpp
Compute row and column sums from a tatami::Matrix.

tatami.hpp

utils.hpp
Utilities for computing matrix statistics.