tatami_stats/sums_8hpp_source.html

#ifndef TATAMI_STATS__SUMS_HPP

#define TATAMI_STATS__SUMS_HPP


#include "tatami/tatami.hpp"

#include "utils.hpp"


#include <vector>

#include <numeric>

#include <algorithm>


namespace tatami_stats {


namespace sums {


struct Options {

    bool skip_nan = false;


    int num_threads = 1;

};


template<typename Output_ = double, typename Value_, typename Index_>


Output_ direct(const Value_* ptr, Index_ num, bool skip_nan) {

    return internal::nanable_ifelse_with_value<Value_>(

        skip_nan,

        [&]() -> Output_ {

            Output_ sum = 0;

            for (Index_ i = 0; i < num; ++i) {

                auto val = ptr[i];

                if (!std::isnan(val)) {

                    sum += val;

                }

            }

            return sum;

        },

        [&]() -> Output_ {

            return std::accumulate(ptr, ptr + num, static_cast<Output_>(0));

        }

    );

}


template<typename Output_, typename Value_, typename Index_>


class RunningDense {

public:

    RunningDense(Index_ num, Output_* sum, bool skip_nan) : my_num(num), my_sum(sum), my_skip_nan(skip_nan) {}


    void add(const Value_* ptr) {

        internal::nanable_ifelse<Value_>(

            my_skip_nan,

            [&]() {

                for (Index_ i = 0; i < my_num; ++i) {

                    auto val = ptr[i];

                    if (!std::isnan(val)) {

                        my_sum[i] += val;

                    }

                }

            },

            [&]() {

                for (Index_ i = 0; i < my_num; ++i) {

                    my_sum[i] += ptr[i];

                }

            }

        );

    }


private:

    Index_ my_num;

    Output_* my_sum;

    bool my_skip_nan;

};


template<typename Output_, typename Value_, typename Index_>


class RunningSparse {

public:


    RunningSparse(Output_* sum, bool skip_nan, Index_ subtract = 0) :

        my_sum(sum), my_skip_nan(skip_nan), my_subtract(subtract) {}


    void add(const Value_* value, const Index_* index, Index_ number) {

        internal::nanable_ifelse<Value_>(

            my_skip_nan,

            [&]() {

                for (Index_ i = 0; i < number; ++i) {

                    auto val = value[i];

                    if (!std::isnan(val)) {

                        my_sum[index[i] - my_subtract] += val;

                    }

                }

            },

            [&]() {

                for (Index_ i = 0; i < number; ++i) {

                    my_sum[index[i] - my_subtract] += value[i];

                }

            }

        );

    }


private:

    Output_* my_sum;

    bool my_skip_nan;

    Index_ my_subtract;

};


template<typename Value_, typename Index_, typename Output_>


void apply(bool row, const tatami::Matrix<Value_, Index_>* p, Output_* output, const Options& sopt) {

    auto dim = (row ? p->nrow() : p->ncol());

    auto otherdim = (row ? p->ncol() : p->nrow());

    const bool direct = p->prefer_rows() == row;


    if (p->sparse()) {

        if (direct) {

            tatami::Options opt;

            opt.sparse_extract_index = false;


            tatami::parallelize([&](int, Index_ s, Index_ l) {

                auto ext = tatami::consecutive_extractor<true>(p, row, s, l, opt);

                std::vector<Value_> vbuffer(otherdim);

                for (Index_ x = 0; x < l; ++x) {

                    auto out = ext->fetch(vbuffer.data(), NULL);

                    output[x + s] = sums::direct(out.value, out.number, sopt.skip_nan);

                }

            }, dim, sopt.num_threads);


        } else {

            tatami::Options opt;

            opt.sparse_ordered_index = false;


            tatami::parallelize([&](int thread, Index_ s, Index_ l) {

                auto ext = tatami::consecutive_extractor<true>(p, !row, static_cast<Index_>(0), otherdim, s, l, opt);

                std::vector<Value_> vbuffer(l);

                std::vector<Index_> ibuffer(l);


                LocalOutputBuffer<Output_> local_output(thread, s, l, output);

                sums::RunningSparse<Output_, Value_, Index_> runner(local_output.data(), sopt.skip_nan, s);


                for (Index_ x = 0; x < otherdim; ++x) {

                    auto out = ext->fetch(vbuffer.data(), ibuffer.data());

                    runner.add(out.value, out.index, out.number);

                }


                local_output.transfer();

            }, dim, sopt.num_threads);

        }


    } else {

        if (direct) {

            tatami::parallelize([&](int, Index_ s, Index_ l) {

                auto ext = tatami::consecutive_extractor<false>(p, row, s, l);

                std::vector<Value_> buffer(otherdim);

                for (Index_ x = 0; x < l; ++x) {

                    auto out = ext->fetch(buffer.data());

                    output[x + s] = sums::direct(out, otherdim, sopt.skip_nan);

                }

            }, dim, sopt.num_threads);


        } else {

            tatami::parallelize([&](int thread, Index_ s, Index_ l) {

                auto ext = tatami::consecutive_extractor<false>(p, !row, static_cast<Index_>(0), otherdim, s, l);

                std::vector<Value_> buffer(l);


                LocalOutputBuffer<Output_> local_output(thread, s, l, output);

                sums::RunningDense<Output_, Value_, Index_> runner(l, local_output.data(), sopt.skip_nan);


                for (Index_ x = 0; x < otherdim; ++x) {

                    auto out = ext->fetch(buffer.data());

                    runner.add(out);

                }


                local_output.transfer();

            }, dim, sopt.num_threads);

        }

    }


    return;

}


template<typename Output_ = double, typename Value_, typename Index_>


std::vector<Output_> by_column(const tatami::Matrix<Value_, Index_>* p, const Options& sopt) {

    std::vector<Output_> output(p->ncol());

    apply(false, p, output.data(), sopt);

    return output;

}


template<typename Output_ = double, typename Value_, typename Index_>


std::vector<Output_> by_column(const tatami::Matrix<Value_, Index_>* p) {

    return by_column(p, Options());

}


template<typename Output_ = double, typename Value_, typename Index_>


std::vector<Output_> by_row(const tatami::Matrix<Value_, Index_>* p, const Options& sopt) {

    std::vector<Output_> output(p->nrow());

    apply(true, p, output.data(), sopt);

    return output;

}


template<typename Output_ = double, typename Value_, typename Index_>


std::vector<Output_> by_row(const tatami::Matrix<Value_, Index_>* p) {

    return by_row(p, Options());

}


}


}


#endif

tatami::Matrix

tatami::Matrix::ncol
virtual Index_ ncol() const=0

tatami::Matrix::nrow
virtual Index_ nrow() const=0

tatami::Matrix::prefer_rows
virtual bool prefer_rows() const=0

tatami::Matrix::sparse
virtual std::unique_ptr< MyopicSparseExtractor< Value_, Index_ > > sparse(bool row, const Options &opt) const=0

tatami_stats::LocalOutputBuffer
Local output buffer for running calculations.
Definition utils.hpp:78

tatami_stats::LocalOutputBuffer::transfer
void transfer()
Definition utils.hpp:135

tatami_stats::LocalOutputBuffer::data
Output_ * data()
Definition utils.hpp:118

tatami_stats::sums::RunningDense
Running sums from dense data.
Definition sums.hpp:93

tatami_stats::sums::RunningDense::add
void add(const Value_ *ptr)
Definition sums.hpp:107

tatami_stats::sums::RunningDense::RunningDense
RunningDense(Index_ num, Output_ *sum, bool skip_nan)
Definition sums.hpp:101

tatami_stats::sums::RunningSparse
Running sums from sparse data.
Definition sums.hpp:143

tatami_stats::sums::RunningSparse::add
void add(const Value_ *value, const Index_ *index, Index_ number)
Definition sums.hpp:163

tatami_stats::sums::RunningSparse::RunningSparse
RunningSparse(Output_ *sum, bool skip_nan, Index_ subtract=0)
Definition sums.hpp:153

tatami_stats::sums::by_column
std::vector< Output_ > by_column(const tatami::Matrix< Value_, Index_ > *p, const Options &sopt)
Definition sums.hpp:291

tatami_stats::sums::apply
void apply(bool row, const tatami::Matrix< Value_, Index_ > *p, Output_ *output, const Options &sopt)
Definition sums.hpp:207

tatami_stats::sums::by_row
std::vector< Output_ > by_row(const tatami::Matrix< Value_, Index_ > *p, const Options &sopt)
Definition sums.hpp:324

tatami_stats::sums::direct
Output_ direct(const Value_ *ptr, Index_ num, bool skip_nan)
Definition sums.hpp:57

tatami_stats
Functions to compute statistics from a tatami::Matrix.
Definition counts.hpp:18

tatami::parallelize
void parallelize(Function_ fun, Index_ tasks, int threads)

tatami::consecutive_extractor
auto consecutive_extractor(const Matrix< Value_, Index_ > *mat, bool row, Index_ iter_start, Index_ iter_length, Args_ &&... args)

tatami::Options

tatami::Options::sparse_extract_index
bool sparse_extract_index

tatami::Options::sparse_ordered_index
bool sparse_ordered_index

tatami_stats::sums::Options
Summation options.
Definition sums.hpp:28

tatami_stats::sums::Options::num_threads
int num_threads
Definition sums.hpp:39

tatami_stats::sums::Options::skip_nan
bool skip_nan
Definition sums.hpp:33

tatami.hpp

utils.hpp
Utilities for computing matrix statistics.