3466/doxygen/treeset__core_8cpp_source.html

 /*

 # =============================================================================

 # Copyright (c) 2016 - 2021 Blue Brain Project/EPFL

 #

 # See top-level LICENSE file for details.

 # =============================================================================.

 */


 #include <string>


 #include "coreneuron/nrnconf.h"

 #include "coreneuron/sim/multicore.hpp"

 #include "coreneuron/utils/profile/profiler_interface.h"

 #include "coreneuron/coreneuron.hpp"

 #include "coreneuron/utils/nrnoc_aux.hpp"


 namespace coreneuron {

 /*

 Fixed step method with threads and cache efficiency. No extracellular,

 sparse matrix, multisplit, or legacy features.

 */


 static void nrn_rhs(NrnThread* _nt) {

     int i1 = 0;

     int i2 = i1 + _nt->ncell;

     int i3 = _nt->end;


     double* vec_rhs = &(VEC_RHS(0));

     double* vec_d = &(VEC_D(0));

     double* vec_a = &(VEC_A(0));

     double* vec_b = &(VEC_B(0));

     double* vec_v = &(VEC_V(0));

     int* parent_index = _nt->_v_parent_index;


     nrn_pragma_acc(parallel loop present(vec_rhs [0:i3], vec_d [0:i3]) if (_nt->compute_gpu)

                        async(_nt->stream_id))

     nrn_pragma_omp(target teams distribute parallel for if(_nt->compute_gpu))

     for (int i = i1; i < i3; ++i) {

         vec_rhs[i] = 0.;

         vec_d[i] = 0.;

     }


     if (_nt->nrn_fast_imem) {

         double* fast_imem_d = _nt->nrn_fast_imem->nrn_sav_d;

         double* fast_imem_rhs = _nt->nrn_fast_imem->nrn_sav_rhs;

         nrn_pragma_acc(

             parallel loop present(fast_imem_d [i1:i3], fast_imem_rhs [i1:i3]) if (_nt->compute_gpu)

                 async(_nt->stream_id))

         nrn_pragma_omp(target teams distribute parallel for if(_nt->compute_gpu))

         for (int i = i1; i < i3; ++i) {

             fast_imem_d[i] = 0.;

             fast_imem_rhs[i] = 0.;

         }

     }


     nrn_ba(_nt, BEFORE_BREAKPOINT);

     /* note that CAP has no current */

     for (auto tml = _nt->tml; tml; tml = tml->next)

         if (corenrn.get_memb_func(tml->index).current) {

             mod_f_t s = corenrn.get_memb_func(tml->index).current;

             std::string ss("cur-");

             ss += nrn_get_mechname(tml->index);

             Instrumentor::phase p(ss.c_str());

             (*s)(_nt, tml->ml, tml->index);

 #ifdef DEBUG

             if (errno) {

                 hoc_warning("errno set during calculation of currents", nullptr);

             }

 #endif

         }


     if (_nt->nrn_fast_imem) {

         /* nrn_sav_rhs has only the contribution of electrode current

            here we transform so it only has membrane current contribution

         */

         double* p = _nt->nrn_fast_imem->nrn_sav_rhs;

         nrn_pragma_acc(parallel loop present(p, vec_rhs) if (_nt->compute_gpu)

                            async(_nt->stream_id))

         nrn_pragma_omp(target teams distribute parallel for if(_nt->compute_gpu))

         for (int i = i1; i < i3; ++i) {

             p[i] -= vec_rhs[i];

         }

     }


     /* now the internal axial currents.

     The extracellular mechanism contribution is already done.

             rhs += ai_j*(vi_j - vi)

     */

     nrn_pragma_acc(parallel loop present(vec_rhs [0:i3],

                                          vec_d [0:i3],

                                          vec_a [0:i3],

                                          vec_b [0:i3],

                                          vec_v [0:i3],

                                          parent_index [0:i3]) if (_nt->compute_gpu)

                        async(_nt->stream_id))

     nrn_pragma_omp(target teams distribute parallel for if(_nt->compute_gpu))

     for (int i = i2; i < i3; ++i) {

         double dv = vec_v[parent_index[i]] - vec_v[i];

         /* our connection coefficients are negative so */

         nrn_pragma_acc(atomic update)

         nrn_pragma_omp(atomic update)

         vec_rhs[i] -= vec_b[i] * dv;

         nrn_pragma_acc(atomic update)

         nrn_pragma_omp(atomic update)

         vec_rhs[parent_index[i]] += vec_a[i] * dv;

     }

 }


 /* calculate left hand side of

 cm*dvm/dt = -i(vm) + is(vi) + ai_j*(vi_j - vi)

 cx*dvx/dt - cm*dvm/dt = -gx*(vx - ex) + i(vm) + ax_j*(vx_j - vx)

 with a matrix so that the solution is of the form [dvm+dvx,dvx] on the right

 hand side after solving.

 This is a common operation for fixed step, cvode, and daspk methods

 */


 static void nrn_lhs(NrnThread* _nt) {

     int i1 = 0;

     int i2 = i1 + _nt->ncell;

     int i3 = _nt->end;


     /* note that CAP has no jacob */

     for (auto tml = _nt->tml; tml; tml = tml->next)

         if (corenrn.get_memb_func(tml->index).jacob) {

             mod_f_t s = corenrn.get_memb_func(tml->index).jacob;

             std::string ss("cur-");

             ss += nrn_get_mechname(tml->index);

             Instrumentor::phase p(ss.c_str());

             (*s)(_nt, tml->ml, tml->index);

 #ifdef DEBUG

             if (errno) {

                 hoc_warning("errno set during calculation of jacobian", (char*) 0);

             }

 #endif

         }

     /* now the cap current can be computed because any change to cm by another model

     has taken effect

     */

     /* note, the first is CAP if there are any nodes*/

     if (_nt->end && _nt->tml) {

         assert(_nt->tml->index == CAP);

         nrn_jacob_capacitance(_nt, _nt->tml->ml, _nt->tml->index);

     }


     double* vec_d = &(VEC_D(0));

     double* vec_a = &(VEC_A(0));

     double* vec_b = &(VEC_B(0));

     int* parent_index = _nt->_v_parent_index;


     if (_nt->nrn_fast_imem) {

         /* nrn_sav_d has only the contribution of electrode current

            here we transform so it only has membrane current contribution

         */

         double* p = _nt->nrn_fast_imem->nrn_sav_d;

         nrn_pragma_acc(parallel loop present(p, vec_d) if (_nt->compute_gpu) async(_nt->stream_id))

         nrn_pragma_omp(target teams distribute parallel for if(_nt->compute_gpu))

         for (int i = i1; i < i3; ++i) {

             p[i] = vec_d[i] - p[i];

         }

     }


     /* now add the axial currents */

     nrn_pragma_acc(parallel loop present(

         vec_d [0:i3], vec_a [0:i3], vec_b [0:i3], parent_index [0:i3]) if (_nt->compute_gpu)

                        async(_nt->stream_id))

     nrn_pragma_omp(target teams distribute parallel for if(_nt->compute_gpu))

     for (int i = i2; i < i3; ++i) {

         nrn_pragma_acc(atomic update)

         nrn_pragma_omp(atomic update)

         vec_d[i] -= vec_b[i];

         nrn_pragma_acc(atomic update)

         nrn_pragma_omp(atomic update)

         vec_d[parent_index[i]] -= vec_a[i];

     }

 }


 /* for the fixed step method */

 void* setup_tree_matrix_minimal(NrnThread* _nt) {

     nrn_rhs(_nt);

     nrn_lhs(_nt);

     return nullptr;

 }

 }  // namespace coreneuron

coreneuron::CoreNeuron::get_memb_func
auto & get_memb_func(size_t idx)
Definition: coreneuron.hpp:135

i
#define i
Definition: md1redef.h:19

profiler_interface.h

nrn_pragma_omp
nrn_pragma_acc(routine seq) nrn_pragma_omp(declare target) philox4x32_ctr_t coreneuron_random123_philox4x32_helper(coreneuron nrn_pragma_omp(end declare target) namespace coreneuron
Provide a helper function in global namespace that is declared target for OpenMP offloading to functi...
Definition: nrnran123.h:66

coreneuron.hpp

assert
#define assert(ex)
Definition: hocassrt.h:24

CAP
#define CAP
Definition: membfunc.hpp:60

BEFORE_BREAKPOINT
#define BEFORE_BREAKPOINT
Definition: membfunc.hpp:69

multicore.hpp

coreneuron
THIS FILE IS AUTO GENERATED DONT MODIFY IT.
Definition: corenrn_parameters.cpp:12

coreneuron::mod_f_t
void(*)(NrnThread *, Memb_list *, int) mod_f_t
Definition: membfunc.hpp:24

coreneuron::update
void update(NrnThread *_nt)
Definition: fadvance_core.cpp:201

coreneuron::nrn_lhs
static void nrn_lhs(NrnThread *_nt)
Definition: treeset_core.cpp:117

coreneuron::nrn_get_mechname
const char * nrn_get_mechname(int type)
Definition: mk_mech.cpp:152

coreneuron::setup_tree_matrix_minimal
void * setup_tree_matrix_minimal(NrnThread *)
Definition: treeset_core.cpp:178

coreneuron::corenrn
CoreNeuron corenrn
Definition: multicore.cpp:53

coreneuron::nrn_rhs
static void nrn_rhs(NrnThread *_nt)
Definition: treeset_core.cpp:23

coreneuron::nrn_pragma_acc
nrn_pragma_acc(routine seq) int vector_capacity(void *v)
Definition: ivocvect.cpp:30

coreneuron::nrn_jacob_capacitance
void nrn_jacob_capacitance(NrnThread *, Memb_list *, int)
Definition: capac.cpp:55

coreneuron::hoc_warning
void hoc_warning(const char *s1, const char *s2)
Definition: nrnoc_aux.cpp:44

coreneuron::nrn_ba
void nrn_ba(NrnThread *nt, int bat)
Definition: fadvance_core.cpp:258

neuron::vec_d
auto *const vec_d
Definition: cellorder.cpp:615

neuron::vec_b
auto *const vec_b
Definition: cellorder.cpp:614

neuron::vec_rhs
auto *const vec_rhs
Definition: cellorder.cpp:616

nrnconf.h

VEC_D
#define VEC_D(i)
Definition: nrnconf.h:29

VEC_B
#define VEC_B(i)
Definition: nrnconf.h:28

VEC_RHS
#define VEC_RHS(i)
Definition: nrnconf.h:30

VEC_A
#define VEC_A(i)
Definition: nrnconf.h:27

VEC_V
#define VEC_V(i)
Definition: nrnconf.h:31

p
size_t p
Definition: nrngsl_hc_radix2.cpp:49

s
s
Definition: multisend.cpp:521

nrnoc_aux.hpp

coreneuron::Instrumentor::phase
Definition: profiler_interface.h:353

coreneuron::NrnFastImem::nrn_sav_rhs
double * nrn_sav_rhs
Definition: multicore.hpp:53

coreneuron::NrnFastImem::nrn_sav_d
double * nrn_sav_d
Definition: multicore.hpp:54

coreneuron::NrnThread
Definition: multicore.hpp:75

coreneuron::NrnThread::compute_gpu
int compute_gpu
Definition: multicore.hpp:136

coreneuron::NrnThread::ncell
int ncell
Definition: multicore.hpp:97

coreneuron::NrnThread::nrn_fast_imem
NrnFastImem * nrn_fast_imem
Definition: multicore.hpp:124

coreneuron::NrnThread::end
int end
Definition: multicore.hpp:98

coreneuron::NrnThread::_v_parent_index
int * _v_parent_index
Definition: multicore.hpp:126

coreneuron::NrnThread::stream_id
int stream_id
Definition: multicore.hpp:137

coreneuron::NrnThread::tml
NrnThreadMembList * tml
Definition: multicore.hpp:80

coreneuron::NrnThreadMembList::ml
Memb_list * ml
Definition: multicore.hpp:34

coreneuron::NrnThreadMembList::next
NrnThreadMembList * next
Definition: multicore.hpp:33

coreneuron::NrnThreadMembList::index
int index
Definition: multicore.hpp:35