Line data Source code
1 : /*
2 : * SPDX-License-Identifier: MPL-2.0
3 : *
4 : * This Source Code Form is subject to the terms of the Mozilla Public
5 : * License, v. 2.0. If a copy of the MPL was not distributed with this
6 : * file, You can obtain one at http://mozilla.org/MPL/2.0/.
7 : *
8 : * Copyright 2024 MonetDB Foundation;
9 : * Copyright August 2008 - 2023 MonetDB B.V.;
10 : * Copyright 1997 - July 2008 CWI.
11 : */
12 :
13 : #include "monetdb_config.h"
14 : #include "gdk.h"
15 : #include "gdk_private.h"
16 : #include "gdk_calc_private.h"
17 :
18 : /* grouped aggregates
19 : *
20 : * The following functions take two to four input BATs and produce a
21 : * single output BAT.
22 : *
23 : * The input BATs are
24 : * - b, a dense-headed BAT with the values to work on in the tail;
25 : * - g, a dense-headed BAT, aligned with b, with group ids (OID) in
26 : * the tail;
27 : * - e, optional but recommended, a dense-headed BAT with the list of
28 : * group ids in the head(!) (the tail is completely ignored);
29 : * - s, optional, a dense-headed bat with a list of candidate ids in
30 : * the tail.
31 : *
32 : * The tail values of s refer to the head of b and g. Only entries at
33 : * the specified ids are taken into account for the grouped
34 : * aggregates. All other values are ignored. s is compatible with
35 : * the result of BATselect().
36 : *
37 : * If e is not specified, we need to do an extra scan over g to find
38 : * out the range of the group ids that are used. e is defined in such
39 : * a way that it can be either the extents or the histo result from
40 : * BATgroups().
41 : *
42 : * All functions calculate grouped aggregates. There are as many
43 : * groups as there are entries in e. If e is not specified, the
44 : * number of groups is equal to the difference between the maximum and
45 : * minimum values in g.
46 : *
47 : * If a group is empty, the result for that group is nil.
48 : *
49 : * If there is overflow during the calculation of an aggregate, the
50 : * whole operation fails.
51 : *
52 : * If skip_nils is non-zero, a nil value in b is ignored, otherwise a
53 : * nil in b results in a nil result for the group.
54 : */
55 :
56 : /* helper function
57 : *
58 : * This function finds the minimum and maximum group id (and the
59 : * number of groups) and initializes the variables for candidates
60 : * selection.
61 : *
62 : * In case of error, returns an error message.
63 : */
64 : const char *
65 46872 : BATgroupaggrinit(BAT *b, BAT *g, BAT *e, BAT *s,
66 : /* outputs: */
67 : oid *minp, oid *maxp, BUN *ngrpp,
68 : struct canditer *ci)
69 : {
70 46872 : oid min, max;
71 46872 : BUN i, ngrp;
72 46872 : const oid *restrict gids;
73 :
74 46872 : if (b == NULL)
75 : return "b must exist";
76 46872 : canditer_init(ci, b, s);
77 46910 : if (g) {
78 37649 : if (ci->ncand != BATcount(g) ||
79 21679 : (ci->ncand != 0 && ci->seq != g->hseqbase))
80 : return "b with s and g must be aligned";
81 37645 : assert(BATttype(g) == TYPE_oid);
82 : }
83 : if (g == NULL) {
84 : min = 0;
85 : max = 0;
86 : ngrp = 1;
87 37645 : } else if (e == NULL) {
88 8 : if (g->tmaxpos != BUN_NONE) {
89 3 : min = 0;
90 3 : max = BUNtoid(g, g->tmaxpos);
91 : } else {
92 5 : min = oid_nil; /* note that oid_nil > 0! (unsigned) */
93 5 : max = 0;
94 5 : if (BATtdense(g)) {
95 4 : min = g->tseqbase;
96 4 : max = g->tseqbase + BATcount(g) - 1;
97 1 : } else if (g->tsorted) {
98 1 : gids = (const oid *) Tloc(g, 0);
99 : /* find first non-nil */
100 1 : for (i = 0, ngrp = BATcount(g); i < ngrp; i++) {
101 1 : if (!is_oid_nil(gids[i])) {
102 : min = gids[i];
103 : break;
104 : }
105 : }
106 1 : if (!is_oid_nil(min)) {
107 : /* found a non-nil, max must be last
108 : * value (and there is one!) */
109 1 : max = gids[BATcount(g) - 1];
110 : }
111 : } else {
112 0 : const ValRecord *prop;
113 0 : prop = BATgetprop(g, GDK_MAX_BOUND);
114 0 : if (prop != NULL) {
115 0 : assert(prop->vtype == TYPE_oid);
116 0 : min = 0; /* just assume it starts at 0 */
117 0 : max = prop->val.oval - 1; /* bound is exclusive */
118 : } else {
119 : /* we'll do a complete scan */
120 0 : gids = (const oid *) Tloc(g, 0);
121 0 : for (i = 0, ngrp = BATcount(g); i < ngrp; i++) {
122 0 : if (!is_oid_nil(gids[i])) {
123 0 : if (gids[i] < min)
124 : min = gids[i];
125 0 : if (gids[i] > max)
126 : max = gids[i];
127 : }
128 : }
129 : /* note: max < min is possible
130 : * if all groups are nil (or
131 : * BATcount(g)==0) */
132 : }
133 : }
134 : }
135 8 : ngrp = max < min ? 0 : max - min + 1;
136 : } else {
137 37637 : ngrp = BATcount(e);
138 37637 : min = e->hseqbase;
139 37637 : max = e->hseqbase + ngrp - 1;
140 : }
141 46906 : *minp = min;
142 46906 : *maxp = max;
143 46906 : *ngrpp = ngrp;
144 :
145 46906 : return NULL;
146 : }
147 :
148 : /* ---------------------------------------------------------------------- */
149 : /* sum */
150 :
151 : static inline bool
152 1105 : samesign(double x, double y)
153 : {
154 1105 : return (x >= 0) == (y >= 0);
155 : }
156 :
157 : /* Add two values, producing the sum and the remainder due to limited
158 : * range of floating point arithmetic. This function depends on the
159 : * fact that the sum returns INFINITY in *hi of the correct sign
160 : * (i.e. isinf() returns TRUE) in case of overflow. */
161 : static inline void
162 32784 : twosum(volatile double *hi, volatile double *lo, double x, double y)
163 : {
164 32784 : volatile double yr;
165 :
166 32784 : assert(fabs(x) >= fabs(y));
167 :
168 32784 : *hi = x + y;
169 32784 : yr = *hi - x;
170 32784 : *lo = y - yr;
171 32784 : }
172 :
173 : static inline void
174 14861 : exchange(double *x, double *y)
175 : {
176 14861 : double t = *x;
177 14861 : *x = *y;
178 14861 : *y = t;
179 14861 : }
180 :
181 : /* this function was adapted from https://bugs.python.org/file10357/msum4.py */
182 : BUN
183 1114 : dofsum(const void *restrict values, oid seqb,
184 : struct canditer *restrict ci,
185 : void *restrict results, BUN ngrp, int tp1, int tp2,
186 : const oid *restrict gids,
187 : oid min, oid max, bool skip_nils, bool nil_if_empty)
188 : {
189 1114 : struct pergroup {
190 : int npartials;
191 : int maxpartials;
192 : bool valseen;
193 : #ifdef INFINITES_ALLOWED
194 : float infs;
195 : #else
196 : int infs;
197 : #endif
198 : double *partials;
199 : } *pergroup;
200 1114 : BUN listi;
201 1114 : int parti;
202 1114 : int i;
203 1114 : BUN grp;
204 1114 : double x, y;
205 1114 : volatile double lo, hi;
206 1114 : double twopow = pow((double) FLT_RADIX, (double) (DBL_MAX_EXP - 1));
207 1114 : BUN nils = 0;
208 1114 : volatile flt f;
209 :
210 1114 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
211 :
212 : /* we only deal with the two floating point types */
213 1114 : assert(tp1 == TYPE_flt || tp1 == TYPE_dbl);
214 1114 : assert(tp2 == TYPE_flt || tp2 == TYPE_dbl);
215 : /* if input is dbl, then so it output */
216 1114 : assert(tp2 == TYPE_flt || tp1 == TYPE_dbl);
217 : /* if no gids, then we have a single group */
218 1114 : assert(ngrp == 1 || gids != NULL);
219 1114 : if (gids == NULL || ngrp == 1) {
220 1097 : min = max = 0;
221 1097 : ngrp = 1;
222 1097 : gids = NULL;
223 : }
224 1114 : pergroup = GDKmalloc(ngrp * sizeof(*pergroup));
225 1114 : if (pergroup == NULL)
226 : return BUN_NONE;
227 10759 : for (grp = 0; grp < ngrp; grp++) {
228 19290 : pergroup[grp] = (struct pergroup) {
229 : .maxpartials = 2,
230 9645 : .partials = GDKmalloc(2 * sizeof(double)),
231 : };
232 9645 : if (pergroup[grp].partials == NULL) {
233 0 : while (grp > 0)
234 0 : GDKfree(pergroup[--grp].partials);
235 0 : GDKfree(pergroup);
236 0 : return BUN_NONE;
237 : }
238 : }
239 29311 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
240 27083 : listi = canditer_next(ci) - seqb;
241 27083 : grp = gids ? gids[listi] : 0;
242 27083 : if (grp < min || grp > max)
243 0 : continue;
244 27083 : if (pergroup[grp].partials == NULL)
245 0 : continue;
246 27083 : if (tp1 == TYPE_flt && !is_flt_nil(((const flt *) values)[listi]))
247 16 : x = ((const flt *) values)[listi];
248 27067 : else if (tp1 == TYPE_dbl && !is_dbl_nil(((const dbl *) values)[listi]))
249 : x = ((const dbl *) values)[listi];
250 : else {
251 : /* it's a nil */
252 87 : if (!skip_nils) {
253 0 : if (tp2 == TYPE_flt)
254 0 : ((flt *) results)[grp] = flt_nil;
255 : else
256 0 : ((dbl *) results)[grp] = dbl_nil;
257 0 : GDKfree(pergroup[grp].partials);
258 0 : pergroup[grp].partials = NULL;
259 0 : if (++nils == ngrp)
260 0 : TIMEOUT_LOOP_BREAK;
261 : }
262 87 : continue;
263 : }
264 26996 : pergroup[grp].valseen = true;
265 : #ifdef INFINITES_ALLOWED
266 : if (isinf(x)) {
267 : pergroup[grp].infs += x;
268 : continue;
269 : }
270 : #endif
271 26996 : i = 0;
272 58239 : for (parti = 0; parti < pergroup[grp].npartials; parti++) {
273 31243 : y = pergroup[grp].partials[parti];
274 31243 : if (fabs(x) < fabs(y))
275 14853 : exchange(&x, &y);
276 31243 : twosum(&hi, &lo, x, y);
277 31243 : if (isinf(hi)) {
278 58 : int sign = hi > 0 ? 1 : -1;
279 58 : hi = x - twopow * sign;
280 58 : x = hi - twopow * sign;
281 58 : pergroup[grp].infs += sign;
282 58 : if (fabs(x) < fabs(y))
283 8 : exchange(&x, &y);
284 58 : twosum(&hi, &lo, x, y);
285 : }
286 31243 : if (lo != 0)
287 16428 : pergroup[grp].partials[i++] = lo;
288 31243 : x = hi;
289 : }
290 26996 : if (x != 0) {
291 26925 : if (i == pergroup[grp].maxpartials) {
292 1063 : double *temp;
293 1063 : pergroup[grp].maxpartials += pergroup[grp].maxpartials;
294 1063 : temp = GDKrealloc(pergroup[grp].partials, pergroup[grp].maxpartials * sizeof(double));
295 1063 : if (temp == NULL)
296 0 : goto bailout;
297 1063 : pergroup[grp].partials = temp;
298 : }
299 26925 : pergroup[grp].partials[i++] = x;
300 : }
301 26996 : pergroup[grp].npartials = i;
302 : }
303 1114 : TIMEOUT_CHECK(qry_ctx, GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx));
304 10731 : for (grp = 0; grp < ngrp; grp++) {
305 9645 : if (pergroup[grp].partials == NULL)
306 0 : continue;
307 9645 : if (!pergroup[grp].valseen) {
308 31 : if (tp2 == TYPE_flt)
309 5 : ((flt *) results)[grp] = nil_if_empty ? flt_nil : 0;
310 : else
311 26 : ((dbl *) results)[grp] = nil_if_empty ? dbl_nil : 0;
312 31 : nils += nil_if_empty;
313 31 : GDKfree(pergroup[grp].partials);
314 31 : pergroup[grp].partials = NULL;
315 31 : continue;
316 : }
317 : #ifdef INFINITES_ALLOWED
318 : if (isinf(pergroup[grp].infs) || isnan(pergroup[grp].infs)) {
319 : goto overflow;
320 : }
321 : #endif
322 :
323 9614 : if ((pergroup[grp].infs == 1 || pergroup[grp].infs == -1) &&
324 42 : pergroup[grp].npartials > 0 &&
325 38 : !samesign(pergroup[grp].infs, pergroup[grp].partials[pergroup[grp].npartials - 1])) {
326 34 : twosum(&hi, &lo, pergroup[grp].infs * twopow, pergroup[grp].partials[pergroup[grp].npartials - 1] / 2);
327 34 : if (isinf(2 * hi)) {
328 22 : y = 2 * lo;
329 22 : x = hi + y;
330 22 : x -= hi;
331 22 : if (x == y &&
332 18 : pergroup[grp].npartials > 1 &&
333 12 : samesign(lo, pergroup[grp].partials[pergroup[grp].npartials - 2])) {
334 6 : GDKfree(pergroup[grp].partials);
335 6 : pergroup[grp].partials = NULL;
336 6 : x = 2 * (hi + y);
337 6 : if (tp2 == TYPE_flt) {
338 0 : f = (flt) x;
339 0 : if (isinf(f) ||
340 0 : isnan(f) ||
341 0 : is_flt_nil(f)) {
342 0 : goto overflow;
343 : } else {
344 0 : ((flt *) results)[grp] = f;
345 : }
346 6 : } else if (is_dbl_nil(x)) {
347 0 : goto overflow;
348 : } else
349 6 : ((dbl *) results)[grp] = x;
350 6 : continue;
351 : }
352 : } else {
353 12 : if (lo) {
354 2 : if (pergroup[grp].npartials == pergroup[grp].maxpartials) {
355 0 : double *temp;
356 : /* we need space for one more */
357 0 : pergroup[grp].maxpartials++;
358 0 : temp = GDKrealloc(pergroup[grp].partials, pergroup[grp].maxpartials * sizeof(double));
359 0 : if (temp == NULL)
360 0 : goto bailout;
361 0 : pergroup[grp].partials = temp;
362 : }
363 2 : pergroup[grp].partials[pergroup[grp].npartials - 1] = 2 * lo;
364 2 : pergroup[grp].partials[pergroup[grp].npartials++] = 2 * hi;
365 : } else {
366 10 : pergroup[grp].partials[pergroup[grp].npartials - 1] = 2 * hi;
367 : }
368 12 : pergroup[grp].infs = 0;
369 : }
370 : }
371 :
372 9608 : if (pergroup[grp].infs != 0)
373 28 : goto overflow;
374 :
375 9580 : if (pergroup[grp].npartials == 0) {
376 14 : GDKfree(pergroup[grp].partials);
377 14 : pergroup[grp].partials = NULL;
378 14 : if (tp2 == TYPE_flt)
379 0 : ((flt *) results)[grp] = 0;
380 : else
381 14 : ((dbl *) results)[grp] = 0;
382 14 : continue;
383 : }
384 :
385 : /* accumulate into hi */
386 9566 : hi = pergroup[grp].partials[--pergroup[grp].npartials];
387 9566 : while (pergroup[grp].npartials > 0) {
388 1449 : twosum(&hi, &lo, hi, pergroup[grp].partials[--pergroup[grp].npartials]);
389 1449 : if (lo) {
390 1449 : pergroup[grp].partials[pergroup[grp].npartials++] = lo;
391 1449 : break;
392 : }
393 : }
394 :
395 9566 : if (pergroup[grp].npartials >= 2 &&
396 1055 : samesign(pergroup[grp].partials[pergroup[grp].npartials - 1], pergroup[grp].partials[pergroup[grp].npartials - 2]) &&
397 51 : hi + 2 * pergroup[grp].partials[pergroup[grp].npartials - 1] - hi == 2 * pergroup[grp].partials[pergroup[grp].npartials - 1]) {
398 30 : hi += 2 * pergroup[grp].partials[pergroup[grp].npartials - 1];
399 30 : pergroup[grp].partials[pergroup[grp].npartials - 1] = -pergroup[grp].partials[pergroup[grp].npartials - 1];
400 : }
401 :
402 9566 : GDKfree(pergroup[grp].partials);
403 9566 : pergroup[grp].partials = NULL;
404 9566 : if (tp2 == TYPE_flt) {
405 11 : f = (flt) hi;
406 11 : if (isinf(f) || isnan(f) || is_flt_nil(f)) {
407 0 : goto overflow;
408 : } else {
409 11 : ((flt *) results)[grp] = f;
410 : }
411 9555 : } else if (is_dbl_nil(hi)) {
412 0 : goto overflow;
413 : } else {
414 9555 : ((dbl *) results)[grp] = hi;
415 : }
416 : }
417 1086 : GDKfree(pergroup);
418 1086 : return nils;
419 :
420 28 : overflow:
421 28 : GDKerror("22003!overflow in sum aggregate.\n");
422 : bailout:
423 56 : for (grp = 0; grp < ngrp; grp++)
424 28 : GDKfree(pergroup[grp].partials);
425 28 : GDKfree(pergroup);
426 28 : return BUN_NONE;
427 : }
428 :
429 : #define AGGR_SUM(TYPE1, TYPE2) \
430 : do { \
431 : TYPE1 x; \
432 : const TYPE1 *restrict vals = (const TYPE1 *) values; \
433 : if (ngrp == 1 && ci->tpe == cand_dense) { \
434 : /* single group, no candidate list */ \
435 : TYPE2 sum; \
436 : *algo = "sum: no candidates, no groups"; \
437 : sum = 0; \
438 : if (nonil) { \
439 : *seen = ci->ncand > 0; \
440 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
441 : x = vals[ci->seq + i - seqb]; \
442 : ADDI_WITH_CHECK(x, sum, \
443 : TYPE2, sum, \
444 : GDK_##TYPE2##_max, \
445 : goto overflow); \
446 : } \
447 : TIMEOUT_CHECK(qry_ctx, \
448 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
449 : } else { \
450 : bool seenval = false; \
451 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
452 : x = vals[ci->seq + i - seqb]; \
453 : if (is_##TYPE1##_nil(x)) { \
454 : if (!skip_nils) { \
455 : sum = TYPE2##_nil; \
456 : nils = 1; \
457 : TIMEOUT_LOOP_BREAK; \
458 : } \
459 : } else { \
460 : ADDI_WITH_CHECK(x, sum, \
461 : TYPE2, sum, \
462 : GDK_##TYPE2##_max, \
463 : goto overflow); \
464 : seenval = true; \
465 : } \
466 : } \
467 : TIMEOUT_CHECK(qry_ctx, \
468 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
469 : *seen = seenval; \
470 : } \
471 : if (*seen) \
472 : *sums = sum; \
473 : } else if (ngrp == 1) { \
474 : /* single group, with candidate list */ \
475 : TYPE2 sum; \
476 : bool seenval = false; \
477 : *algo = "sum: with candidates, no groups"; \
478 : sum = 0; \
479 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
480 : x = vals[canditer_next(ci) - seqb]; \
481 : if (is_##TYPE1##_nil(x)) { \
482 : if (!skip_nils) { \
483 : sum = TYPE2##_nil; \
484 : nils = 1; \
485 : TIMEOUT_LOOP_BREAK; \
486 : } \
487 : } else { \
488 : ADDI_WITH_CHECK(x, sum, \
489 : TYPE2, sum, \
490 : GDK_##TYPE2##_max, \
491 : goto overflow); \
492 : seenval = true; \
493 : } \
494 : } \
495 : TIMEOUT_CHECK(qry_ctx, \
496 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
497 : if (seenval) \
498 : *sums = sum; \
499 : } else if (ci->tpe == cand_dense) { \
500 : /* multiple groups, no candidate list */ \
501 : *algo = "sum: no candidates, with groups"; \
502 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
503 : if (gids == NULL || \
504 : (gids[i] >= min && gids[i] <= max)) { \
505 : gid = gids ? gids[i] - min : (oid) i; \
506 : x = vals[ci->seq + i - seqb]; \
507 : if (is_##TYPE1##_nil(x)) { \
508 : if (!skip_nils) { \
509 : sums[gid] = TYPE2##_nil; \
510 : nils++; \
511 : } \
512 : } else { \
513 : if (nil_if_empty && \
514 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
515 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
516 : sums[gid] = 0; \
517 : } \
518 : if (!is_##TYPE2##_nil(sums[gid])) { \
519 : ADDI_WITH_CHECK( \
520 : x, \
521 : sums[gid], \
522 : TYPE2, \
523 : sums[gid], \
524 : GDK_##TYPE2##_max, \
525 : goto overflow); \
526 : } \
527 : } \
528 : } \
529 : } \
530 : TIMEOUT_CHECK(qry_ctx, \
531 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
532 : } else { \
533 : /* multiple groups, with candidate list */ \
534 : *algo = "sum: with candidates, with groups"; \
535 : TIMEOUT_LOOP(ci->ncand, qry_ctx) { \
536 : i = canditer_next(ci) - seqb; \
537 : if (gids == NULL || \
538 : (gids[i] >= min && gids[i] <= max)) { \
539 : gid = gids ? gids[i] - min : (oid) i; \
540 : x = vals[i]; \
541 : if (is_##TYPE1##_nil(x)) { \
542 : if (!skip_nils) { \
543 : sums[gid] = TYPE2##_nil; \
544 : nils++; \
545 : } \
546 : } else { \
547 : if (nil_if_empty && \
548 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
549 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
550 : sums[gid] = 0; \
551 : } \
552 : if (!is_##TYPE2##_nil(sums[gid])) { \
553 : ADDI_WITH_CHECK( \
554 : x, \
555 : sums[gid], \
556 : TYPE2, \
557 : sums[gid], \
558 : GDK_##TYPE2##_max, \
559 : goto overflow); \
560 : } \
561 : } \
562 : } \
563 : } \
564 : TIMEOUT_CHECK(qry_ctx, \
565 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
566 : } \
567 : } while (0)
568 :
569 : #define AGGR_SUM_NOOVL(TYPE1, TYPE2) \
570 : do { \
571 : TYPE1 x; \
572 : const TYPE1 *restrict vals = (const TYPE1 *) values; \
573 : if (ngrp == 1 && ci->tpe == cand_dense) { \
574 : /* single group, no candidate list */ \
575 : TYPE2 sum; \
576 : sum = 0; \
577 : if (nonil) { \
578 : *algo = "sum: no candidates, no groups, no nils, no overflow"; \
579 : *seen = ci->ncand > 0; \
580 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
581 : sum += vals[ci->seq + i - seqb]; \
582 : } \
583 : TIMEOUT_CHECK(qry_ctx, \
584 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
585 : } else { \
586 : bool seenval = false; \
587 : *algo = "sum: no candidates, no groups, no overflow"; \
588 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
589 : x = vals[ci->seq + i - seqb]; \
590 : if (is_##TYPE1##_nil(x)) { \
591 : if (!skip_nils) { \
592 : sum = TYPE2##_nil; \
593 : nils = 1; \
594 : TIMEOUT_LOOP_BREAK; \
595 : } \
596 : } else { \
597 : sum += x; \
598 : seenval = true; \
599 : } \
600 : } \
601 : TIMEOUT_CHECK(qry_ctx, \
602 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
603 : *seen = seenval; \
604 : } \
605 : if (*seen) \
606 : *sums = sum; \
607 : } else if (ngrp == 1) { \
608 : /* single group, with candidate list */ \
609 : TYPE2 sum; \
610 : bool seenval = false; \
611 : *algo = "sum: with candidates, no groups, no overflow"; \
612 : sum = 0; \
613 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
614 : x = vals[canditer_next(ci) - seqb]; \
615 : if (is_##TYPE1##_nil(x)) { \
616 : if (!skip_nils) { \
617 : sum = TYPE2##_nil; \
618 : nils = 1; \
619 : TIMEOUT_LOOP_BREAK; \
620 : } \
621 : } else { \
622 : sum += x; \
623 : seenval = true; \
624 : } \
625 : } \
626 : TIMEOUT_CHECK(qry_ctx, \
627 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
628 : if (seenval) \
629 : *sums = sum; \
630 : } else if (ci->tpe == cand_dense) { \
631 : /* multiple groups, no candidate list */ \
632 : if (nonil) { \
633 : *algo = "sum: no candidates, with groups, no nils, no overflow"; \
634 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
635 : if (gids == NULL || \
636 : (gids[i] >= min && gids[i] <= max)) { \
637 : gid = gids ? gids[i] - min : (oid) i; \
638 : x = vals[ci->seq + i - seqb]; \
639 : if (nil_if_empty && \
640 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
641 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
642 : sums[gid] = 0; \
643 : } \
644 : sums[gid] += x; \
645 : } \
646 : } \
647 : TIMEOUT_CHECK(qry_ctx, \
648 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
649 : } else { \
650 : *algo = "sum: no candidates, with groups, no overflow"; \
651 : TIMEOUT_LOOP_IDX(i, ci->ncand, qry_ctx) { \
652 : if (gids == NULL || \
653 : (gids[i] >= min && gids[i] <= max)) { \
654 : gid = gids ? gids[i] - min : (oid) i; \
655 : x = vals[ci->seq + i - seqb]; \
656 : if (is_##TYPE1##_nil(x)) { \
657 : if (!skip_nils) { \
658 : sums[gid] = TYPE2##_nil; \
659 : nils++; \
660 : } \
661 : } else { \
662 : if (nil_if_empty && \
663 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
664 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
665 : sums[gid] = 0; \
666 : } \
667 : if (!is_##TYPE2##_nil(sums[gid])) { \
668 : sums[gid] += x; \
669 : } \
670 : } \
671 : } \
672 : } \
673 : TIMEOUT_CHECK(qry_ctx, \
674 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
675 : } \
676 : } else { \
677 : /* multiple groups, with candidate list */ \
678 : *algo = "sum: with candidates, with groups, no overflow"; \
679 : TIMEOUT_LOOP(ci->ncand, qry_ctx) { \
680 : i = canditer_next(ci) - seqb; \
681 : if (gids == NULL || \
682 : (gids[i] >= min && gids[i] <= max)) { \
683 : gid = gids ? gids[i] - min : (oid) i; \
684 : x = vals[i]; \
685 : if (is_##TYPE1##_nil(x)) { \
686 : if (!skip_nils) { \
687 : sums[gid] = TYPE2##_nil; \
688 : nils++; \
689 : } \
690 : } else { \
691 : if (nil_if_empty && \
692 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
693 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
694 : sums[gid] = 0; \
695 : } \
696 : if (!is_##TYPE2##_nil(sums[gid])) { \
697 : sums[gid] += x; \
698 : } \
699 : } \
700 : } \
701 : } \
702 : TIMEOUT_CHECK(qry_ctx, \
703 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
704 : } \
705 : } while (0)
706 :
707 : static BUN
708 11590 : dosum(const void *restrict values, bool nonil, oid seqb,
709 : struct canditer *restrict ci,
710 : void *restrict results, BUN ngrp, int tp1, int tp2,
711 : const oid *restrict gids,
712 : oid min, oid max, bool skip_nils,
713 : bool nil_if_empty, const char *func, const char **algo)
714 : {
715 11590 : BUN nils = 0;
716 11590 : BUN i;
717 11590 : oid gid;
718 11590 : unsigned int *restrict seen = NULL; /* bitmask for groups that we've seen */
719 :
720 11590 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
721 :
722 11598 : switch (tp2) {
723 12 : case TYPE_flt:
724 12 : if (tp1 != TYPE_flt)
725 0 : goto unsupported;
726 : /* fall through */
727 : case TYPE_dbl:
728 1096 : if (tp1 != TYPE_flt && tp1 != TYPE_dbl)
729 0 : goto unsupported;
730 1108 : *algo = "sum: floating point";
731 1108 : return dofsum(values, seqb, ci, results, ngrp, tp1, tp2,
732 : gids, min, max, skip_nils,
733 : nil_if_empty);
734 : }
735 :
736 : /* allocate bitmap for seen group ids */
737 10490 : seen = GDKzalloc(((ngrp + 31) / 32) * sizeof(int));
738 10478 : if (seen == NULL) {
739 : return BUN_NONE;
740 : }
741 :
742 10478 : switch (tp2) {
743 9 : case TYPE_bte: {
744 9 : bte *restrict sums = (bte *) results;
745 9 : switch (tp1) {
746 9 : case TYPE_bte:
747 39 : AGGR_SUM(bte, bte);
748 : break;
749 0 : default:
750 0 : goto unsupported;
751 : }
752 : break;
753 : }
754 25 : case TYPE_sht: {
755 25 : sht *restrict sums = (sht *) results;
756 25 : switch (tp1) {
757 15 : case TYPE_bte:
758 15 : if (ci->ncand < ((BUN) 1 << ((sizeof(sht) - sizeof(bte)) << 3)))
759 187 : AGGR_SUM_NOOVL(bte, sht);
760 : else
761 0 : AGGR_SUM(bte, sht);
762 : break;
763 10 : case TYPE_sht:
764 57 : AGGR_SUM(sht, sht);
765 : break;
766 0 : default:
767 0 : goto unsupported;
768 : }
769 : break;
770 : }
771 1016 : case TYPE_int: {
772 1016 : int *restrict sums = (int *) results;
773 1016 : switch (tp1) {
774 0 : case TYPE_bte:
775 0 : if (ci->ncand < ((BUN) 1 << ((sizeof(int) - sizeof(bte)) << 3)))
776 0 : AGGR_SUM_NOOVL(bte, int);
777 : else
778 0 : AGGR_SUM(bte, int);
779 : break;
780 4 : case TYPE_sht:
781 4 : if (ci->ncand < ((BUN) 1 << ((sizeof(int) - sizeof(sht)) << 3)))
782 44 : AGGR_SUM_NOOVL(sht, int);
783 : else
784 0 : AGGR_SUM(sht, int);
785 : break;
786 1012 : case TYPE_int:
787 6244 : AGGR_SUM(int, int);
788 : break;
789 0 : default:
790 0 : goto unsupported;
791 : }
792 : break;
793 : }
794 7690 : case TYPE_lng: {
795 7690 : lng *restrict sums = (lng *) results;
796 7690 : switch (tp1) {
797 : #if SIZEOF_BUN == 4
798 : case TYPE_bte:
799 : AGGR_SUM_NOOVL(bte, lng);
800 : break;
801 : case TYPE_sht:
802 : AGGR_SUM_NOOVL(sht, lng);
803 : break;
804 : case TYPE_int:
805 : AGGR_SUM_NOOVL(int, lng);
806 : break;
807 : #else
808 0 : case TYPE_bte:
809 0 : if (ci->ncand < ((BUN) 1 << ((sizeof(lng) - sizeof(bte)) << 3)))
810 0 : AGGR_SUM_NOOVL(bte, lng);
811 : else
812 0 : AGGR_SUM(bte, lng);
813 : break;
814 0 : case TYPE_sht:
815 0 : if (ci->ncand < ((BUN) 1 << ((sizeof(lng) - sizeof(sht)) << 3)))
816 0 : AGGR_SUM_NOOVL(sht, lng);
817 : else
818 0 : AGGR_SUM(sht, lng);
819 : break;
820 116 : case TYPE_int:
821 116 : if (ci->ncand < ((BUN) 1 << ((sizeof(lng) - sizeof(int)) << 3)))
822 512120 : AGGR_SUM_NOOVL(int, lng);
823 : else
824 0 : AGGR_SUM(int, lng);
825 : break;
826 : #endif
827 7574 : case TYPE_lng:
828 8583052 : AGGR_SUM(lng, lng);
829 : break;
830 0 : default:
831 0 : goto unsupported;
832 : }
833 : break;
834 : }
835 : #ifdef HAVE_HGE
836 1738 : case TYPE_hge: {
837 1738 : hge *sums = (hge *) results;
838 1738 : switch (tp1) {
839 169 : case TYPE_bte:
840 4623315 : AGGR_SUM_NOOVL(bte, hge);
841 : break;
842 13 : case TYPE_sht:
843 197 : AGGR_SUM_NOOVL(sht, hge);
844 : break;
845 901 : case TYPE_int:
846 60441518 : AGGR_SUM_NOOVL(int, hge);
847 : break;
848 57 : case TYPE_lng:
849 5016520 : AGGR_SUM_NOOVL(lng, hge);
850 : break;
851 598 : case TYPE_hge:
852 35261671 : AGGR_SUM(hge, hge);
853 : break;
854 0 : default:
855 0 : goto unsupported;
856 : }
857 : break;
858 : }
859 : #endif
860 0 : default:
861 0 : goto unsupported;
862 : }
863 :
864 10495 : if (nils == 0 && nil_if_empty) {
865 : /* figure out whether there were any empty groups
866 : * (that result in a nil value) */
867 10485 : if (ngrp & 0x1F) {
868 : /* fill last slot */
869 10474 : seen[ngrp >> 5] |= ~0U << (ngrp & 0x1F);
870 : }
871 232761 : for (i = 0, ngrp = (ngrp + 31) / 32; i < ngrp; i++) {
872 222853 : if (seen[i] != ~0U) {
873 : nils = 1;
874 : break;
875 : }
876 : }
877 : }
878 10495 : GDKfree(seen);
879 :
880 10495 : return nils;
881 :
882 0 : unsupported:
883 0 : GDKfree(seen);
884 0 : GDKerror("%s: type combination (sum(%s)->%s) not supported.\n",
885 : func, ATOMname(tp1), ATOMname(tp2));
886 0 : return BUN_NONE;
887 :
888 0 : overflow:
889 0 : GDKfree(seen);
890 0 : GDKerror("22003!overflow in sum aggregate.\n");
891 0 : return BUN_NONE;
892 :
893 1 : bailout:
894 1 : GDKfree(seen);
895 1 : return BUN_NONE;
896 : }
897 :
898 : /* calculate group sums with optional candidates list */
899 : BAT *
900 6707 : BATgroupsum(BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
901 : {
902 6707 : const oid *restrict gids;
903 6707 : oid min, max;
904 6707 : BUN ngrp;
905 6707 : BUN nils;
906 6707 : BAT *bn;
907 6707 : struct canditer ci;
908 6707 : const char *err;
909 6707 : const char *algo = NULL;
910 6707 : lng t0 = 0;
911 :
912 6707 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
913 :
914 6707 : if ((err = BATgroupaggrinit(b, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
915 0 : GDKerror("%s\n", err);
916 0 : return NULL;
917 : }
918 6706 : if (g == NULL) {
919 0 : GDKerror("b and g must be aligned\n");
920 0 : return NULL;
921 : }
922 :
923 6706 : if (ci.ncand == 0 || ngrp == 0) {
924 : /* trivial: no sums, so return bat aligned with g with
925 : * nil in the tail */
926 2014 : return BATconstant(ngrp == 0 ? 0 : min, tp, ATOMnilptr(tp), ngrp, TRANSIENT);
927 : }
928 :
929 4692 : if ((e == NULL ||
930 4692 : (BATcount(e) == ci.ncand && e->hseqbase == ci.hseq)) &&
931 1601 : (BATtdense(g) || (g->tkey && g->tnonil))) {
932 : /* trivial: singleton groups, so all results are equal
933 : * to the inputs (but possibly a different type) */
934 1601 : return BATconvert(b, s, tp, 0, 0, 0);
935 : }
936 :
937 3091 : bn = BATconstant(min, tp, ATOMnilptr(tp), ngrp, TRANSIENT);
938 3086 : if (bn == NULL) {
939 : return NULL;
940 : }
941 :
942 3086 : if (BATtdense(g))
943 : gids = NULL;
944 : else
945 2690 : gids = (const oid *) Tloc(g, 0);
946 :
947 3086 : BATiter bi = bat_iterator(b);
948 6190 : nils = dosum(bi.base, bi.nonil, b->hseqbase, &ci,
949 3093 : Tloc(bn, 0), ngrp, bi.type, tp, gids, min, max,
950 : skip_nils, true, __func__, &algo);
951 3097 : bat_iterator_end(&bi);
952 :
953 3087 : if (nils < BUN_NONE) {
954 3087 : BATsetcount(bn, ngrp);
955 3093 : bn->tkey = BATcount(bn) <= 1;
956 3093 : bn->tsorted = BATcount(bn) <= 1;
957 3093 : bn->trevsorted = BATcount(bn) <= 1;
958 3093 : bn->tnil = nils != 0;
959 3093 : bn->tnonil = nils == 0;
960 : } else {
961 0 : BBPunfix(bn->batCacheid);
962 0 : bn = NULL;
963 : }
964 :
965 3095 : if (algo)
966 3095 : MT_thread_setalgorithm(algo);
967 3082 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",g=" ALGOOPTBATFMT ","
968 : "e=" ALGOOPTBATFMT ",s=" ALGOOPTBATFMT " -> " ALGOOPTBATFMT
969 : "; start " OIDFMT ", count " BUNFMT " (%s -- " LLFMT " usec)\n",
970 : ALGOBATPAR(b), ALGOOPTBATPAR(g), ALGOOPTBATPAR(e),
971 : ALGOOPTBATPAR(s), ALGOOPTBATPAR(bn),
972 : ci.seq, ci.ncand, algo ? algo : "", GDKusec() - t0);
973 : return bn;
974 : }
975 :
976 : static BUN
977 30 : mskCountOnes(BAT *b, struct canditer *ci)
978 : {
979 30 : BUN cnt = 0, ncand = ci->ncand;
980 :
981 30 : if (ci->s == NULL && mask_cand(b))
982 30 : return BATcount(b);
983 0 : if (ci->tpe == cand_dense && ncand > 0 && !mask_cand(b)) {
984 0 : BATiter bi = bat_iterator(b);
985 0 : const uint32_t *restrict src = (const uint32_t *) bi.base + (ci->seq - b->hseqbase) / 32;
986 0 : int bits = (ci->seq - b->hseqbase) % 32;
987 0 : if (bits + ncand <= 32) {
988 0 : if (ncand == 32)
989 0 : cnt = candmask_pop(src[0]);
990 : else
991 0 : cnt = candmask_pop(src[0] & (((1U << ncand) - 1) << bits));
992 0 : bat_iterator_end(&bi);
993 0 : return cnt;
994 : }
995 0 : if (bits != 0) {
996 0 : cnt = candmask_pop(src[0] & (~0U << bits));
997 0 : src++;
998 0 : ncand -= 32 - bits;
999 : }
1000 0 : while (ncand >= 32) {
1001 0 : cnt += candmask_pop(*src);
1002 0 : src++;
1003 0 : ncand -= 32;
1004 : }
1005 0 : if (ncand > 0)
1006 0 : cnt += candmask_pop(*src & ((1U << ncand) - 1));
1007 0 : bat_iterator_end(&bi);
1008 0 : return cnt;
1009 : }
1010 0 : for (BUN i = 0; i < ncand; i++) {
1011 0 : BUN x = canditer_next(ci) - b->hseqbase;
1012 0 : cnt += mskGetVal(b, x);
1013 : }
1014 : return cnt;
1015 : }
1016 :
1017 : gdk_return
1018 8935 : BATsum(void *res, int tp, BAT *b, BAT *s, bool skip_nils, bool nil_if_empty)
1019 : {
1020 8935 : oid min, max;
1021 8935 : BUN ngrp;
1022 8935 : struct canditer ci;
1023 8935 : const char *err;
1024 8935 : const char *algo = NULL;
1025 8935 : lng t0 = 0;
1026 :
1027 8935 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
1028 :
1029 8935 : if ((err = BATgroupaggrinit(b, NULL, NULL, s, &min, &max, &ngrp, &ci)) != NULL) {
1030 0 : GDKerror("%s\n", err);
1031 0 : return GDK_FAIL;
1032 : }
1033 8930 : if (ATOMstorage(b->ttype) == TYPE_msk || mask_cand(b)) {
1034 30 : BUN n = mskCountOnes(b, &ci);
1035 30 : switch (tp) {
1036 0 : case TYPE_bte:
1037 0 : if (n > GDK_bte_max) {
1038 0 : GDKerror("22003!overflow in sum aggregate.\n");
1039 0 : return GDK_FAIL;
1040 : }
1041 0 : * (bte *) res = (bte) n;
1042 0 : break;
1043 0 : case TYPE_sht:
1044 0 : if (n > GDK_sht_max) {
1045 0 : GDKerror("22003!overflow in sum aggregate.\n");
1046 0 : return GDK_FAIL;
1047 : }
1048 0 : * (sht *) res = (sht) n;
1049 0 : break;
1050 0 : case TYPE_int:
1051 : #if SIZEOF_BUN > 4
1052 0 : if (n > GDK_int_max) {
1053 0 : GDKerror("22003!overflow in sum aggregate.\n");
1054 0 : return GDK_FAIL;
1055 : }
1056 : #endif
1057 0 : * (int *) res = (int) n;
1058 0 : break;
1059 30 : case TYPE_lng:
1060 30 : * (lng *) res = (lng) n;
1061 30 : break;
1062 : #ifdef HAVE_HGE
1063 0 : case TYPE_hge:
1064 0 : * (hge *) res = (hge) n;
1065 0 : break;
1066 : #endif
1067 0 : case TYPE_flt:
1068 0 : * (flt *) res = (flt) n;
1069 0 : break;
1070 0 : case TYPE_dbl:
1071 0 : * (dbl *) res = (dbl) n;
1072 0 : break;
1073 0 : default:
1074 0 : GDKerror("type combination (sum(%s)->%s) not supported.\n",
1075 : ATOMname(b->ttype), ATOMname(tp));
1076 0 : return GDK_FAIL;
1077 : }
1078 30 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",s=" ALGOOPTBATFMT "; "
1079 : "start " OIDFMT ", count " BUNFMT " (pop count -- " LLFMT " usec)\n",
1080 : ALGOBATPAR(b), ALGOOPTBATPAR(s),
1081 : ci.seq, ci.ncand, GDKusec() - t0);
1082 30 : return GDK_SUCCEED;
1083 : }
1084 8900 : switch (tp) {
1085 9 : case TYPE_bte:
1086 9 : * (bte *) res = nil_if_empty ? bte_nil : 0;
1087 9 : break;
1088 17 : case TYPE_sht:
1089 17 : * (sht *) res = nil_if_empty ? sht_nil : 0;
1090 17 : break;
1091 517 : case TYPE_int:
1092 517 : * (int *) res = nil_if_empty ? int_nil : 0;
1093 517 : break;
1094 6603 : case TYPE_lng:
1095 6603 : * (lng *) res = nil_if_empty ? lng_nil : 0;
1096 6603 : break;
1097 : #ifdef HAVE_HGE
1098 565 : case TYPE_hge:
1099 565 : * (hge *) res = nil_if_empty ? hge_nil : 0;
1100 565 : break;
1101 : #endif
1102 1189 : case TYPE_flt:
1103 : case TYPE_dbl:
1104 1189 : switch (b->ttype) {
1105 1 : case TYPE_bte:
1106 : case TYPE_sht:
1107 : case TYPE_int:
1108 : case TYPE_lng:
1109 : #ifdef HAVE_HGE
1110 : case TYPE_hge:
1111 : #endif
1112 : {
1113 : /* special case for summing integer types into
1114 : * a floating point: We calculate the average
1115 : * (which is done exactly), and multiply the
1116 : * result by the count to get the sum. Note
1117 : * that if we just summed into a floating
1118 : * point number, we could loose too much
1119 : * accuracy, and if we summed into lng first,
1120 : * we could get unnecessary overflow. */
1121 1 : dbl avg;
1122 1 : BUN cnt;
1123 :
1124 1 : if (BATcalcavg(b, s, &avg, &cnt, 0) != GDK_SUCCEED)
1125 : return GDK_FAIL;
1126 1 : if (cnt == 0) {
1127 0 : avg = nil_if_empty ? dbl_nil : 0;
1128 : }
1129 1 : if (cnt < ci.ncand && !skip_nils) {
1130 : /* there were nils */
1131 0 : avg = dbl_nil;
1132 : }
1133 1 : if (tp == TYPE_flt) {
1134 0 : if (is_dbl_nil(avg))
1135 0 : *(flt *) res = flt_nil;
1136 0 : else if (cnt > 0 &&
1137 0 : GDK_flt_max / cnt < fabs(avg)) {
1138 0 : GDKerror("22003!overflow in sum aggregate.\n");
1139 0 : return GDK_FAIL;
1140 : } else {
1141 0 : *(flt *) res = (flt) avg * cnt;
1142 : }
1143 : } else {
1144 1 : if (is_dbl_nil(avg)) {
1145 0 : *(dbl *) res = dbl_nil;
1146 1 : } else if (cnt > 0 &&
1147 1 : GDK_dbl_max / cnt < fabs(avg)) {
1148 0 : GDKerror("22003!overflow in sum aggregate.\n");
1149 0 : return GDK_FAIL;
1150 : } else {
1151 1 : *(dbl *) res = avg * cnt;
1152 : }
1153 : }
1154 : return GDK_SUCCEED;
1155 : }
1156 : default:
1157 1188 : break;
1158 : }
1159 1188 : if (b->ttype == TYPE_dbl)
1160 1176 : * (dbl *) res = nil_if_empty ? dbl_nil : 0;
1161 : else
1162 12 : * (flt *) res = nil_if_empty ? flt_nil : 0;
1163 : break;
1164 0 : default:
1165 0 : GDKerror("type combination (sum(%s)->%s) not supported.\n",
1166 : ATOMname(b->ttype), ATOMname(tp));
1167 0 : return GDK_FAIL;
1168 : }
1169 8899 : if (ci.ncand == 0)
1170 : return GDK_SUCCEED;
1171 8504 : BATiter bi = bat_iterator(b);
1172 17035 : BUN nils = dosum(bi.base, bi.nonil, b->hseqbase, &ci,
1173 8518 : res, true, bi.type, tp, &min, min, max,
1174 : skip_nils, nil_if_empty, __func__, &algo);
1175 8517 : bat_iterator_end(&bi);
1176 8508 : if (algo)
1177 8508 : MT_thread_setalgorithm(algo);
1178 8510 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",s=" ALGOOPTBATFMT "; "
1179 : "start " OIDFMT ", count " BUNFMT " (%s -- " LLFMT " usec)\n",
1180 : ALGOBATPAR(b), ALGOOPTBATPAR(s),
1181 : ci.seq, ci.ncand, algo ? algo : "", GDKusec() - t0);
1182 8510 : return nils < BUN_NONE ? GDK_SUCCEED : GDK_FAIL;
1183 : }
1184 :
1185 : /* ---------------------------------------------------------------------- */
1186 : /* product */
1187 :
1188 : #define AGGR_PROD(TYPE1, TYPE2, TYPE3) \
1189 : do { \
1190 : const TYPE1 *restrict vals = (const TYPE1 *) values; \
1191 : gid = 0; /* doesn't change if gidincr == false */ \
1192 : TIMEOUT_LOOP(ci->ncand, qry_ctx) { \
1193 : i = canditer_next(ci) - seqb; \
1194 : if (gids == NULL || !gidincr || \
1195 : (gids[i] >= min && gids[i] <= max)) { \
1196 : if (gidincr) { \
1197 : if (gids) \
1198 : gid = gids[i] - min; \
1199 : else \
1200 : gid = (oid) i; \
1201 : } \
1202 : if (is_##TYPE1##_nil(vals[i])) { \
1203 : if (!skip_nils) { \
1204 : prods[gid] = TYPE2##_nil; \
1205 : nils++; \
1206 : } \
1207 : } else { \
1208 : if (nil_if_empty && \
1209 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
1210 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
1211 : prods[gid] = 1; \
1212 : } \
1213 : if (!is_##TYPE2##_nil(prods[gid])) { \
1214 : MULI4_WITH_CHECK( \
1215 : vals[i], \
1216 : prods[gid], \
1217 : TYPE2, prods[gid], \
1218 : GDK_##TYPE2##_max, \
1219 : TYPE3, \
1220 : goto overflow); \
1221 : } \
1222 : } \
1223 : } \
1224 : } \
1225 : TIMEOUT_CHECK(qry_ctx, \
1226 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
1227 : } while (0)
1228 :
1229 : #ifdef HAVE_HGE
1230 : #define AGGR_PROD_HGE(TYPE) \
1231 : do { \
1232 : const TYPE *vals = (const TYPE *) values; \
1233 : gid = 0; /* doesn't change if gidincr == false */ \
1234 : TIMEOUT_LOOP(ci->ncand, qry_ctx) { \
1235 : i = canditer_next(ci) - seqb; \
1236 : if (gids == NULL || !gidincr || \
1237 : (gids[i] >= min && gids[i] <= max)) { \
1238 : if (gidincr) { \
1239 : if (gids) \
1240 : gid = gids[i] - min; \
1241 : else \
1242 : gid = (oid) i; \
1243 : } \
1244 : if (nil_if_empty && \
1245 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
1246 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
1247 : prods[gid] = 1; \
1248 : } \
1249 : if (is_##TYPE##_nil(vals[i])) { \
1250 : if (!skip_nils) { \
1251 : prods[gid] = hge_nil; \
1252 : nils++; \
1253 : } \
1254 : } else if (!is_hge_nil(prods[gid])) { \
1255 : HGEMUL_CHECK(vals[i], \
1256 : prods[gid], \
1257 : prods[gid], \
1258 : GDK_hge_max, \
1259 : goto overflow); \
1260 : } \
1261 : } \
1262 : } \
1263 : TIMEOUT_CHECK(qry_ctx, \
1264 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
1265 : } while (0)
1266 : #else
1267 : #define AGGR_PROD_LNG(TYPE) \
1268 : do { \
1269 : const TYPE *restrict vals = (const TYPE *) values; \
1270 : gid = 0; /* doesn't change if gidincr == false */ \
1271 : TIMEOUT_LOOP(ci->ncand, qry_ctx) { \
1272 : i = canditer_next(ci) - seqb; \
1273 : if (gids == NULL || !gidincr || \
1274 : (gids[i] >= min && gids[i] <= max)) { \
1275 : if (gidincr) { \
1276 : if (gids) \
1277 : gid = gids[i] - min; \
1278 : else \
1279 : gid = (oid) i; \
1280 : } \
1281 : if (is_##TYPE##_nil(vals[i])) { \
1282 : if (!skip_nils) { \
1283 : prods[gid] = lng_nil; \
1284 : nils++; \
1285 : } \
1286 : } else { \
1287 : if (nil_if_empty && \
1288 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
1289 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
1290 : prods[gid] = 1; \
1291 : } \
1292 : if (!is_lng_nil(prods[gid])) { \
1293 : LNGMUL_CHECK( \
1294 : vals[i], \
1295 : prods[gid], \
1296 : prods[gid], \
1297 : GDK_lng_max, \
1298 : goto overflow); \
1299 : } \
1300 : } \
1301 : } \
1302 : } \
1303 : TIMEOUT_CHECK(qry_ctx, \
1304 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
1305 : } while (0)
1306 : #endif
1307 :
1308 : #define AGGR_PROD_FLOAT(TYPE1, TYPE2) \
1309 : do { \
1310 : const TYPE1 *restrict vals = (const TYPE1 *) values; \
1311 : gid = 0; /* doesn't change if gidincr == false */ \
1312 : TIMEOUT_LOOP(ci->ncand, qry_ctx) { \
1313 : i = canditer_next(ci) - seqb; \
1314 : if (gids == NULL || !gidincr || \
1315 : (gids[i] >= min && gids[i] <= max)) { \
1316 : if (gidincr) { \
1317 : if (gids) \
1318 : gid = gids[i] - min; \
1319 : else \
1320 : gid = (oid) i; \
1321 : } \
1322 : if (is_##TYPE1##_nil(vals[i])) { \
1323 : if (!skip_nils) { \
1324 : prods[gid] = TYPE2##_nil; \
1325 : nils++; \
1326 : } \
1327 : } else { \
1328 : if (nil_if_empty && \
1329 : !(seen[gid >> 5] & (1U << (gid & 0x1F)))) { \
1330 : seen[gid >> 5] |= 1U << (gid & 0x1F); \
1331 : prods[gid] = 1; \
1332 : } \
1333 : if (!is_##TYPE2##_nil(prods[gid])) { \
1334 : if (ABSOLUTE(vals[i]) > 1 && \
1335 : GDK_##TYPE2##_max / ABSOLUTE(vals[i]) < ABSOLUTE(prods[gid])) { \
1336 : goto overflow; \
1337 : } else { \
1338 : prods[gid] *= vals[i]; \
1339 : } \
1340 : } \
1341 : } \
1342 : } \
1343 : } \
1344 : TIMEOUT_CHECK(qry_ctx, \
1345 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
1346 : } while (0)
1347 :
1348 : static BUN
1349 45 : doprod(const void *restrict values, oid seqb, struct canditer *restrict ci,
1350 : void *restrict results, BUN ngrp, int tp1, int tp2,
1351 : const oid *restrict gids, bool gidincr, oid min, oid max,
1352 : bool skip_nils, bool nil_if_empty, const char *func)
1353 : {
1354 45 : BUN nils = 0;
1355 45 : BUN i;
1356 45 : oid gid;
1357 45 : unsigned int *restrict seen; /* bitmask for groups that we've seen */
1358 :
1359 45 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
1360 :
1361 : /* allocate bitmap for seen group ids */
1362 45 : seen = GDKzalloc(((ngrp + 31) / 32) * sizeof(int));
1363 45 : if (seen == NULL) {
1364 : return BUN_NONE;
1365 : }
1366 :
1367 45 : switch (tp2) {
1368 0 : case TYPE_bte: {
1369 0 : bte *restrict prods = (bte *) results;
1370 0 : switch (tp1) {
1371 0 : case TYPE_bte:
1372 0 : AGGR_PROD(bte, bte, sht);
1373 : break;
1374 0 : default:
1375 0 : goto unsupported;
1376 : }
1377 : break;
1378 : }
1379 0 : case TYPE_sht: {
1380 0 : sht *restrict prods = (sht *) results;
1381 0 : switch (tp1) {
1382 0 : case TYPE_bte:
1383 0 : AGGR_PROD(bte, sht, int);
1384 : break;
1385 0 : case TYPE_sht:
1386 0 : AGGR_PROD(sht, sht, int);
1387 : break;
1388 0 : default:
1389 0 : goto unsupported;
1390 : }
1391 : break;
1392 : }
1393 0 : case TYPE_int: {
1394 0 : int *restrict prods = (int *) results;
1395 0 : switch (tp1) {
1396 0 : case TYPE_bte:
1397 0 : AGGR_PROD(bte, int, lng);
1398 : break;
1399 0 : case TYPE_sht:
1400 0 : AGGR_PROD(sht, int, lng);
1401 : break;
1402 0 : case TYPE_int:
1403 0 : AGGR_PROD(int, int, lng);
1404 : break;
1405 0 : default:
1406 0 : goto unsupported;
1407 : }
1408 : break;
1409 : }
1410 : #ifdef HAVE_HGE
1411 0 : case TYPE_lng: {
1412 0 : lng *prods = (lng *) results;
1413 0 : switch (tp1) {
1414 0 : case TYPE_bte:
1415 0 : AGGR_PROD(bte, lng, hge);
1416 : break;
1417 0 : case TYPE_sht:
1418 0 : AGGR_PROD(sht, lng, hge);
1419 : break;
1420 0 : case TYPE_int:
1421 0 : AGGR_PROD(int, lng, hge);
1422 : break;
1423 0 : case TYPE_lng:
1424 0 : AGGR_PROD(lng, lng, hge);
1425 : break;
1426 0 : default:
1427 0 : goto unsupported;
1428 : }
1429 : break;
1430 : }
1431 35 : case TYPE_hge: {
1432 35 : hge *prods = (hge *) results;
1433 35 : switch (tp1) {
1434 6 : case TYPE_bte:
1435 18 : AGGR_PROD_HGE(bte);
1436 : break;
1437 6 : case TYPE_sht:
1438 18 : AGGR_PROD_HGE(sht);
1439 : break;
1440 6 : case TYPE_int:
1441 18 : AGGR_PROD_HGE(int);
1442 : break;
1443 12 : case TYPE_lng:
1444 36 : AGGR_PROD_HGE(lng);
1445 : break;
1446 5 : case TYPE_hge:
1447 40 : AGGR_PROD_HGE(hge);
1448 : break;
1449 0 : default:
1450 0 : goto unsupported;
1451 : }
1452 : break;
1453 : }
1454 : #else
1455 : case TYPE_lng: {
1456 : lng *restrict prods = (lng *) results;
1457 : switch (tp1) {
1458 : case TYPE_bte:
1459 : AGGR_PROD_LNG(bte);
1460 : break;
1461 : case TYPE_sht:
1462 : AGGR_PROD_LNG(sht);
1463 : break;
1464 : case TYPE_int:
1465 : AGGR_PROD_LNG(int);
1466 : break;
1467 : case TYPE_lng:
1468 : AGGR_PROD_LNG(lng);
1469 : break;
1470 : default:
1471 : goto unsupported;
1472 : }
1473 : break;
1474 : }
1475 : #endif
1476 0 : case TYPE_flt: {
1477 0 : flt *restrict prods = (flt *) results;
1478 0 : switch (tp1) {
1479 0 : case TYPE_bte:
1480 0 : AGGR_PROD_FLOAT(bte, flt);
1481 : break;
1482 0 : case TYPE_sht:
1483 0 : AGGR_PROD_FLOAT(sht, flt);
1484 : break;
1485 0 : case TYPE_int:
1486 0 : AGGR_PROD_FLOAT(int, flt);
1487 : break;
1488 0 : case TYPE_lng:
1489 0 : AGGR_PROD_FLOAT(lng, flt);
1490 : break;
1491 : #ifdef HAVE_HGE
1492 0 : case TYPE_hge:
1493 0 : AGGR_PROD_FLOAT(hge, flt);
1494 : break;
1495 : #endif
1496 0 : case TYPE_flt:
1497 0 : AGGR_PROD_FLOAT(flt, flt);
1498 : break;
1499 0 : default:
1500 0 : goto unsupported;
1501 : }
1502 : break;
1503 : }
1504 10 : case TYPE_dbl: {
1505 10 : dbl *restrict prods = (dbl *) results;
1506 10 : switch (tp1) {
1507 0 : case TYPE_bte:
1508 0 : AGGR_PROD_FLOAT(bte, dbl);
1509 : break;
1510 0 : case TYPE_sht:
1511 0 : AGGR_PROD_FLOAT(sht, dbl);
1512 : break;
1513 0 : case TYPE_int:
1514 0 : AGGR_PROD_FLOAT(int, dbl);
1515 : break;
1516 0 : case TYPE_lng:
1517 0 : AGGR_PROD_FLOAT(lng, dbl);
1518 : break;
1519 : #ifdef HAVE_HGE
1520 0 : case TYPE_hge:
1521 0 : AGGR_PROD_FLOAT(hge, dbl);
1522 : break;
1523 : #endif
1524 0 : case TYPE_flt:
1525 0 : AGGR_PROD_FLOAT(flt, dbl);
1526 : break;
1527 10 : case TYPE_dbl:
1528 44 : AGGR_PROD_FLOAT(dbl, dbl);
1529 : break;
1530 0 : default:
1531 0 : goto unsupported;
1532 : }
1533 : break;
1534 : }
1535 0 : default:
1536 0 : goto unsupported;
1537 : }
1538 :
1539 45 : if (nils == 0 && nil_if_empty) {
1540 : /* figure out whether there were any empty groups
1541 : * (that result in a nil value) */
1542 45 : if (ngrp & 0x1F) {
1543 : /* fill last slot */
1544 45 : seen[ngrp >> 5] |= ~0U << (ngrp & 0x1F);
1545 : }
1546 90 : for (i = 0, ngrp = (ngrp + 31) / 32; i < ngrp; i++) {
1547 45 : if (seen[i] != ~0U) {
1548 : nils = 1;
1549 : break;
1550 : }
1551 : }
1552 : }
1553 45 : GDKfree(seen);
1554 :
1555 45 : return nils;
1556 :
1557 0 : unsupported:
1558 0 : GDKfree(seen);
1559 0 : GDKerror("%s: type combination (mul(%s)->%s) not supported.\n",
1560 : func, ATOMname(tp1), ATOMname(tp2));
1561 0 : return BUN_NONE;
1562 :
1563 0 : overflow:
1564 0 : GDKfree(seen);
1565 0 : GDKerror("22003!overflow in product aggregate.\n");
1566 0 : return BUN_NONE;
1567 :
1568 0 : bailout:
1569 0 : GDKfree(seen);
1570 0 : return BUN_NONE;
1571 : }
1572 :
1573 : /* calculate group products with optional candidates list */
1574 : BAT *
1575 12 : BATgroupprod(BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
1576 : {
1577 12 : const oid *restrict gids;
1578 12 : oid min, max;
1579 12 : BUN ngrp;
1580 12 : BUN nils;
1581 12 : BAT *bn;
1582 12 : struct canditer ci;
1583 12 : const char *err;
1584 12 : lng t0 = 0;
1585 :
1586 12 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
1587 :
1588 12 : if ((err = BATgroupaggrinit(b, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
1589 0 : GDKerror("%s\n", err);
1590 0 : return NULL;
1591 : }
1592 12 : if (g == NULL) {
1593 0 : GDKerror("b and g must be aligned\n");
1594 0 : return NULL;
1595 : }
1596 :
1597 12 : if (ci.ncand == 0 || ngrp == 0) {
1598 : /* trivial: no products, so return bat aligned with g
1599 : * with nil in the tail */
1600 5 : return BATconstant(ngrp == 0 ? 0 : min, tp, ATOMnilptr(tp), ngrp, TRANSIENT);
1601 : }
1602 :
1603 7 : if ((e == NULL ||
1604 7 : (BATcount(e) == ci.ncand && e->hseqbase == ci.hseq)) &&
1605 6 : (BATtdense(g) || (g->tkey && g->tnonil))) {
1606 : /* trivial: singleton groups, so all results are equal
1607 : * to the inputs (but possibly a different type) */
1608 6 : return BATconvert(b, s, tp, 0, 0, 0);
1609 : }
1610 :
1611 1 : bn = BATconstant(min, tp, ATOMnilptr(tp), ngrp, TRANSIENT);
1612 1 : if (bn == NULL) {
1613 : return NULL;
1614 : }
1615 :
1616 1 : if (BATtdense(g))
1617 : gids = NULL;
1618 : else
1619 1 : gids = (const oid *) Tloc(g, 0);
1620 :
1621 1 : BATiter bi = bat_iterator(b);
1622 2 : nils = doprod(bi.base, b->hseqbase, &ci, Tloc(bn, 0), ngrp,
1623 1 : bi.type, tp, gids, true, min, max, skip_nils,
1624 : true, __func__);
1625 1 : bat_iterator_end(&bi);
1626 :
1627 1 : if (nils < BUN_NONE) {
1628 1 : BATsetcount(bn, ngrp);
1629 1 : bn->tkey = BATcount(bn) <= 1;
1630 1 : bn->tsorted = BATcount(bn) <= 1;
1631 1 : bn->trevsorted = BATcount(bn) <= 1;
1632 1 : bn->tnil = nils != 0;
1633 1 : bn->tnonil = nils == 0;
1634 : } else {
1635 0 : BBPunfix(bn->batCacheid);
1636 0 : bn = NULL;
1637 : }
1638 :
1639 1 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",g=" ALGOOPTBATFMT ","
1640 : "e=" ALGOOPTBATFMT ",s=" ALGOOPTBATFMT " -> " ALGOOPTBATFMT
1641 : "; start " OIDFMT ", count " BUNFMT " (" LLFMT " usec)\n",
1642 : ALGOBATPAR(b), ALGOOPTBATPAR(g), ALGOOPTBATPAR(e),
1643 : ALGOOPTBATPAR(s), ALGOOPTBATPAR(bn),
1644 : ci.seq, ci.ncand, GDKusec() - t0);
1645 :
1646 : return bn;
1647 : }
1648 :
1649 : gdk_return
1650 49 : BATprod(void *res, int tp, BAT *b, BAT *s, bool skip_nils, bool nil_if_empty)
1651 : {
1652 49 : oid min, max;
1653 49 : BUN ngrp;
1654 49 : BUN nils;
1655 49 : struct canditer ci;
1656 49 : const char *err;
1657 49 : lng t0 = 0;
1658 :
1659 49 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
1660 :
1661 49 : if ((err = BATgroupaggrinit(b, NULL, NULL, s, &min, &max, &ngrp, &ci)) != NULL) {
1662 0 : GDKerror("%s\n", err);
1663 0 : return GDK_FAIL;
1664 : }
1665 49 : switch (tp) {
1666 0 : case TYPE_bte:
1667 0 : * (bte *) res = nil_if_empty ? bte_nil : (bte) 1;
1668 0 : break;
1669 0 : case TYPE_sht:
1670 0 : * (sht *) res = nil_if_empty ? sht_nil : (sht) 1;
1671 0 : break;
1672 0 : case TYPE_int:
1673 0 : * (int *) res = nil_if_empty ? int_nil : (int) 1;
1674 0 : break;
1675 0 : case TYPE_lng:
1676 0 : * (lng *) res = nil_if_empty ? lng_nil : (lng) 1;
1677 0 : break;
1678 : #ifdef HAVE_HGE
1679 35 : case TYPE_hge:
1680 35 : * (hge *) res = nil_if_empty ? hge_nil : (hge) 1;
1681 35 : break;
1682 : #endif
1683 0 : case TYPE_flt:
1684 0 : * (flt *) res = nil_if_empty ? flt_nil : (flt) 1;
1685 0 : break;
1686 14 : case TYPE_dbl:
1687 14 : * (dbl *) res = nil_if_empty ? dbl_nil : (dbl) 1;
1688 14 : break;
1689 0 : default:
1690 0 : GDKerror("type combination (prod(%s)->%s) not supported.\n",
1691 : ATOMname(b->ttype), ATOMname(tp));
1692 0 : return GDK_FAIL;
1693 : }
1694 49 : if (ci.ncand == 0)
1695 : return GDK_SUCCEED;
1696 44 : BATiter bi = bat_iterator(b);
1697 88 : nils = doprod(bi.base, b->hseqbase, &ci, res, true,
1698 44 : bi.type, tp, &min, false, min, max,
1699 : skip_nils, nil_if_empty, __func__);
1700 44 : bat_iterator_end(&bi);
1701 44 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",s=" ALGOOPTBATFMT "; "
1702 : "start " OIDFMT ", count " BUNFMT " (" LLFMT " usec)\n",
1703 : ALGOBATPAR(b), ALGOOPTBATPAR(s),
1704 : ci.seq, ci.ncand, GDKusec() - t0);
1705 44 : return nils < BUN_NONE ? GDK_SUCCEED : GDK_FAIL;
1706 : }
1707 :
1708 : /* ---------------------------------------------------------------------- */
1709 : /* average */
1710 :
1711 : #define GOTO_BAILOUT() \
1712 : do { \
1713 : GDKfree(avgs); \
1714 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx); \
1715 : } while (0)
1716 :
1717 : #define AGGR_AVG(TYPE) \
1718 : do { \
1719 : const TYPE *restrict vals = (const TYPE *) bi.base; \
1720 : TYPE *restrict avgs = GDKzalloc(ngrp * sizeof(TYPE)); \
1721 : if (avgs == NULL) \
1722 : goto bailout; \
1723 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
1724 : i = canditer_next(&ci) - b->hseqbase; \
1725 : if (gids == NULL || \
1726 : (gids[i] >= min && gids[i] <= max)) { \
1727 : if (gids) \
1728 : gid = gids[i] - min; \
1729 : else \
1730 : gid = (oid) i; \
1731 : if (is_##TYPE##_nil(vals[i])) { \
1732 : if (!skip_nils) \
1733 : cnts[gid] = lng_nil; \
1734 : } else if (!is_lng_nil(cnts[gid])) { \
1735 : AVERAGE_ITER(TYPE, vals[i], \
1736 : avgs[gid], \
1737 : rems[gid], \
1738 : cnts[gid]); \
1739 : } \
1740 : } \
1741 : } \
1742 : TIMEOUT_CHECK(qry_ctx, GOTO_BAILOUT()); \
1743 : for (i = 0; i < ngrp; i++) { \
1744 : if (cnts[i] == 0 || is_lng_nil(cnts[i])) { \
1745 : dbls[i] = dbl_nil; \
1746 : cnts[i] = 0; \
1747 : nils++; \
1748 : } else { \
1749 : dbls[i] = avgs[i] + (dbl) rems[i] / cnts[i]; \
1750 : } \
1751 : } \
1752 : GDKfree(avgs); \
1753 : } while (0)
1754 :
1755 : #define AGGR_AVG_FLOAT(TYPE) \
1756 : do { \
1757 : const TYPE *restrict vals = (const TYPE *) bi.base; \
1758 : for (i = 0; i < ngrp; i++) \
1759 : dbls[i] = 0; \
1760 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
1761 : i = canditer_next(&ci) - b->hseqbase; \
1762 : if (gids == NULL || \
1763 : (gids[i] >= min && gids[i] <= max)) { \
1764 : if (gids) \
1765 : gid = gids[i] - min; \
1766 : else \
1767 : gid = (oid) i; \
1768 : if (is_##TYPE##_nil(vals[i])) { \
1769 : if (!skip_nils) \
1770 : cnts[gid] = lng_nil; \
1771 : } else if (!is_lng_nil(cnts[gid])) { \
1772 : AVERAGE_ITER_FLOAT(TYPE, vals[i], \
1773 : dbls[gid], \
1774 : cnts[gid]); \
1775 : } \
1776 : } \
1777 : } \
1778 : TIMEOUT_CHECK(qry_ctx, \
1779 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
1780 : for (i = 0; i < ngrp; i++) { \
1781 : if (cnts[i] == 0 || is_lng_nil(cnts[i])) { \
1782 : dbls[i] = dbl_nil; \
1783 : cnts[i] = 0; \
1784 : nils++; \
1785 : } \
1786 : } \
1787 : } while (0)
1788 :
1789 : /* There are three functions that are used for calculating averages.
1790 : * The first one (BATgroupavg) returns averages as a floating point
1791 : * value, the other two (BATgroupavg3 and BATgroupavg3combine) work
1792 : * together to return averages in the domain type (which should be an
1793 : * integer type). */
1794 :
1795 : /* Calculate group averages with optional candidates list. The average
1796 : * that is calculated is returned in a dbl, independent of the type of
1797 : * the input. The average is calculated exactly, so not in a floating
1798 : * point which could potentially losse bits during processing
1799 : * (e.g. average of 2**62 and a billion 1's). */
1800 : gdk_return
1801 318 : BATgroupavg(BAT **bnp, BAT **cntsp, BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils, int scale)
1802 : {
1803 318 : const oid *restrict gids;
1804 318 : oid gid;
1805 318 : oid min, max;
1806 318 : BUN i, ngrp;
1807 318 : BUN nils = 0;
1808 318 : lng *restrict rems = NULL;
1809 318 : lng *restrict cnts = NULL;
1810 318 : dbl *restrict dbls;
1811 318 : BAT *bn = NULL, *cn = NULL;
1812 318 : struct canditer ci;
1813 318 : const char *err;
1814 318 : lng t0 = 0;
1815 318 : BATiter bi = {0};
1816 :
1817 318 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
1818 :
1819 318 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
1820 :
1821 318 : assert(tp == TYPE_dbl);
1822 318 : (void) tp; /* compatibility (with other BATgroup*
1823 : * functions) argument */
1824 :
1825 318 : if ((err = BATgroupaggrinit(b, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
1826 0 : GDKerror("%s\n", err);
1827 0 : return GDK_FAIL;
1828 : }
1829 319 : if (g == NULL) {
1830 0 : GDKerror("b and g must be aligned\n");
1831 0 : return GDK_FAIL;
1832 : }
1833 :
1834 319 : if (ci.ncand == 0 || ngrp == 0) {
1835 : /* trivial: no averages, so return bat aligned with g
1836 : * with nil in the tail */
1837 9 : bn = BATconstant(ngrp == 0 ? 0 : min, TYPE_dbl, &dbl_nil, ngrp, TRANSIENT);
1838 9 : if (bn == NULL) {
1839 : return GDK_FAIL;
1840 : }
1841 9 : if (cntsp) {
1842 2 : lng zero = 0;
1843 2 : if ((cn = BATconstant(ngrp == 0 ? 0 : min, TYPE_lng, &zero, ngrp, TRANSIENT)) == NULL) {
1844 0 : BBPreclaim(bn);
1845 0 : return GDK_FAIL;
1846 : }
1847 2 : *cntsp = cn;
1848 : }
1849 9 : *bnp = bn;
1850 9 : return GDK_SUCCEED;
1851 : }
1852 :
1853 310 : if ((!skip_nils || cntsp == NULL || b->tnonil) &&
1854 254 : (e == NULL ||
1855 254 : (BATcount(e) == ci.ncand && e->hseqbase == b->hseqbase)) &&
1856 131 : (BATtdense(g) || (g->tkey && g->tnonil))) {
1857 : /* trivial: singleton groups, so all results are equal
1858 : * to the inputs (but possibly a different type) */
1859 131 : if ((bn = BATconvert(b, s, TYPE_dbl, 0, 0, 0)) == NULL)
1860 : return GDK_FAIL;
1861 130 : if (cntsp) {
1862 30 : lng one = 1;
1863 30 : if ((cn = BATconstant(ngrp == 0 ? 0 : min, TYPE_lng, &one, ngrp, TRANSIENT)) == NULL) {
1864 0 : BBPreclaim(bn);
1865 0 : return GDK_FAIL;
1866 : }
1867 30 : *cntsp = cn;
1868 : }
1869 130 : *bnp = bn;
1870 130 : return GDK_SUCCEED;
1871 : }
1872 :
1873 : /* allocate temporary space to do per group calculations */
1874 179 : switch (b->ttype) {
1875 153 : case TYPE_bte:
1876 : case TYPE_sht:
1877 : case TYPE_int:
1878 : case TYPE_lng:
1879 : #ifdef HAVE_HGE
1880 : case TYPE_hge:
1881 : #endif
1882 153 : rems = GDKzalloc(ngrp * sizeof(lng));
1883 153 : if (rems == NULL)
1884 0 : goto bailout1;
1885 : break;
1886 : default:
1887 : break;
1888 : }
1889 179 : if (cntsp) {
1890 157 : if ((cn = COLnew(min, TYPE_lng, ngrp, TRANSIENT)) == NULL)
1891 0 : goto bailout1;
1892 157 : cnts = (lng *) Tloc(cn, 0);
1893 157 : memset(cnts, 0, ngrp * sizeof(lng));
1894 : } else {
1895 22 : cnts = GDKzalloc(ngrp * sizeof(lng));
1896 22 : if (cnts == NULL)
1897 0 : goto bailout1;
1898 : }
1899 :
1900 179 : bn = COLnew(min, TYPE_dbl, ngrp, TRANSIENT);
1901 179 : if (bn == NULL)
1902 0 : goto bailout1;
1903 179 : dbls = (dbl *) Tloc(bn, 0);
1904 :
1905 179 : if (BATtdense(g))
1906 : gids = NULL;
1907 : else
1908 109 : gids = (const oid *) Tloc(g, 0);
1909 :
1910 179 : bi = bat_iterator(b);
1911 179 : switch (b->ttype) {
1912 0 : case TYPE_bte:
1913 0 : AGGR_AVG(bte);
1914 0 : break;
1915 4 : case TYPE_sht:
1916 20 : AGGR_AVG(sht);
1917 4 : break;
1918 131 : case TYPE_int:
1919 22813184 : AGGR_AVG(int);
1920 131 : break;
1921 18 : case TYPE_lng:
1922 96 : AGGR_AVG(lng);
1923 18 : break;
1924 : #ifdef HAVE_HGE
1925 0 : case TYPE_hge:
1926 0 : AGGR_AVG(hge);
1927 0 : break;
1928 : #endif
1929 9 : case TYPE_flt:
1930 3261 : AGGR_AVG_FLOAT(flt);
1931 : break;
1932 17 : case TYPE_dbl:
1933 335 : AGGR_AVG_FLOAT(dbl);
1934 : break;
1935 0 : default:
1936 0 : GDKerror("type (%s) not supported.\n", ATOMname(bi.type));
1937 0 : goto bailout;
1938 : }
1939 179 : bat_iterator_end(&bi);
1940 178 : GDKfree(rems);
1941 179 : if (cn == NULL)
1942 22 : GDKfree(cnts);
1943 : else {
1944 157 : BATsetcount(cn, ngrp);
1945 157 : cn->tkey = BATcount(cn) <= 1;
1946 157 : cn->tsorted = BATcount(cn) <= 1;
1947 157 : cn->trevsorted = BATcount(cn) <= 1;
1948 157 : cn->tnil = false;
1949 157 : cn->tnonil = true;
1950 157 : *cntsp = cn;
1951 : }
1952 179 : if (scale != 0) {
1953 0 : dbl fac = pow(10.0, (double) scale);
1954 0 : for (i = 0; i < ngrp; i++) {
1955 0 : if (!is_dbl_nil(dbls[i]))
1956 0 : dbls[i] /= fac;
1957 : }
1958 : }
1959 179 : BATsetcount(bn, ngrp);
1960 179 : bn->tkey = BATcount(bn) <= 1;
1961 179 : bn->tsorted = BATcount(bn) <= 1;
1962 179 : bn->trevsorted = BATcount(bn) <= 1;
1963 179 : bn->tnil = nils != 0;
1964 179 : bn->tnonil = nils == 0;
1965 179 : *bnp = bn;
1966 179 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",g=" ALGOOPTBATFMT ","
1967 : "e=" ALGOOPTBATFMT ",s=" ALGOOPTBATFMT " -> " ALGOOPTBATFMT
1968 : "; start " OIDFMT ", count " BUNFMT " (" LLFMT " usec)\n",
1969 : ALGOBATPAR(b), ALGOOPTBATPAR(g), ALGOOPTBATPAR(e),
1970 : ALGOOPTBATPAR(s), ALGOOPTBATPAR(bn),
1971 : ci.seq, ci.ncand, GDKusec() - t0);
1972 : return GDK_SUCCEED;
1973 0 : bailout:
1974 0 : bat_iterator_end(&bi);
1975 0 : bailout1:
1976 0 : BBPreclaim(bn);
1977 0 : GDKfree(rems);
1978 0 : if (cntsp) {
1979 0 : BBPreclaim(*cntsp);
1980 0 : *cntsp = NULL;
1981 0 : } else if (cnts) {
1982 0 : GDKfree(cnts);
1983 : }
1984 : return GDK_FAIL;
1985 : }
1986 :
1987 : /* An exact numeric average of a bunch of values consists of three
1988 : * parts: the average rounded down (towards minus infinity), the number
1989 : * of values that participated in the calculation, and the remainder.
1990 : * The remainder is in the range 0 (inclusive) to count (not inclusive).
1991 : * BATgroupavg3 calculates these values for each given group. The
1992 : * function below, BATgroupavg3combine, combines averages calculated
1993 : * this way to correct averages by rounding or truncating towards zero
1994 : * (depending on the symbol TRUNCATE_NUMBERS). */
1995 : gdk_return
1996 409 : BATgroupavg3(BAT **avgp, BAT **remp, BAT **cntp, BAT *b, BAT *g, BAT *e, BAT *s, bool skip_nils)
1997 : {
1998 409 : const char *err;
1999 409 : oid min, max;
2000 409 : BUN ngrp;
2001 409 : struct canditer ci;
2002 409 : BAT *bn, *rn, *cn;
2003 409 : BUN i;
2004 409 : oid o;
2005 :
2006 409 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
2007 :
2008 409 : if ((err = BATgroupaggrinit(b, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
2009 0 : GDKerror("%s\n", err);
2010 0 : return GDK_FAIL;
2011 : }
2012 411 : if (ci.ncand == 0 || ngrp == 0) {
2013 40 : if (ngrp == 0)
2014 28 : min = 0;
2015 40 : bn = BATconstant(min, b->ttype, ATOMnilptr(b->ttype),
2016 : ngrp, TRANSIENT);
2017 41 : rn = BATconstant(min, TYPE_lng, &lng_nil, ngrp, TRANSIENT);
2018 41 : cn = BATconstant(min, TYPE_lng, &(lng){0}, ngrp, TRANSIENT);
2019 41 : if (bn == NULL || rn == NULL || cn == NULL) {
2020 0 : BBPreclaim(bn);
2021 0 : BBPreclaim(rn);
2022 0 : BBPreclaim(cn);
2023 0 : return GDK_FAIL;
2024 : }
2025 41 : *avgp = bn;
2026 41 : *remp = rn;
2027 41 : *cntp = cn;
2028 41 : return GDK_SUCCEED;
2029 : }
2030 371 : ValRecord zero;
2031 371 : (void) VALinit(&zero, TYPE_bte, &(bte){0});
2032 369 : bn = BATconstant(min, b->ttype, VALconvert(b->ttype, &zero),
2033 : ngrp, TRANSIENT);
2034 369 : rn = BATconstant(min, TYPE_lng, &(lng){0}, ngrp, TRANSIENT);
2035 371 : cn = BATconstant(min, TYPE_lng, &(lng){0}, ngrp, TRANSIENT);
2036 371 : if (bn == NULL || rn == NULL || cn == NULL) {
2037 0 : BBPreclaim(bn);
2038 0 : BBPreclaim(rn);
2039 0 : BBPreclaim(cn);
2040 0 : return GDK_FAIL;
2041 : }
2042 371 : lng *rems = Tloc(rn, 0);
2043 371 : lng *cnts = Tloc(cn, 0);
2044 371 : const oid *gids = g && !BATtdense(g) ? Tloc(g, 0) : NULL;
2045 371 : oid gid = ngrp == 1 && gids ? gids[0] - min : 0;
2046 :
2047 371 : BATiter bi = bat_iterator(b);
2048 :
2049 740 : switch (ATOMbasetype(b->ttype)) {
2050 16 : case TYPE_bte: {
2051 16 : const bte *vals = (const bte *) bi.base;
2052 16 : bte *avgs = Tloc(bn, 0);
2053 284 : TIMEOUT_LOOP(ci.ncand, qry_ctx) {
2054 252 : o = canditer_next(&ci) - b->hseqbase;
2055 252 : if (ngrp > 1)
2056 0 : gid = gids ? gids[o] - min : o;
2057 252 : if (is_bte_nil(vals[o])) {
2058 0 : if (!skip_nils) {
2059 0 : avgs[gid] = bte_nil;
2060 0 : rems[gid] = lng_nil;
2061 0 : cnts[gid] = lng_nil;
2062 0 : bn->tnil = true;
2063 0 : rn->tnil = true;
2064 0 : cn->tnil = true;
2065 : }
2066 252 : } else if (!is_lng_nil(cnts[gid])) {
2067 252 : AVERAGE_ITER(bte, vals[o], avgs[gid], rems[gid], cnts[gid]);
2068 : }
2069 : }
2070 48 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2071 16 : if (cnts[i] == 0) {
2072 0 : avgs[i] = bte_nil;
2073 0 : bn->tnil = true;
2074 : } else
2075 : #ifdef TRUNCATE_NUMBERS
2076 : if (!is_bte_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0) {
2077 : avgs[i]++;
2078 : rems[i] -= cnts[i];
2079 : }
2080 : #else
2081 16 : if (!is_bte_nil(avgs[i]) && rems[i] > 0) {
2082 15 : if (avgs[i] < 0) {
2083 0 : if (2*rems[i] > cnts[i]) {
2084 0 : avgs[i]++;
2085 0 : rems[i] -= cnts[i];
2086 : }
2087 : } else {
2088 15 : if (2*rems[i] >= cnts[i]) {
2089 8 : avgs[i]++;
2090 8 : rems[i] -= cnts[i];
2091 : }
2092 : }
2093 : }
2094 : #endif
2095 : }
2096 : break;
2097 : }
2098 1 : case TYPE_sht: {
2099 1 : const sht *vals = (const sht *) bi.base;
2100 1 : sht *avgs = Tloc(bn, 0);
2101 21 : TIMEOUT_LOOP(ci.ncand, qry_ctx) {
2102 19 : o = canditer_next(&ci) - b->hseqbase;
2103 19 : if (ngrp > 1)
2104 0 : gid = gids ? gids[o] - min : o;
2105 19 : if (is_sht_nil(vals[o])) {
2106 0 : if (!skip_nils) {
2107 0 : avgs[gid] = sht_nil;
2108 0 : rems[gid] = lng_nil;
2109 0 : cnts[gid] = lng_nil;
2110 0 : bn->tnil = true;
2111 0 : rn->tnil = true;
2112 0 : cn->tnil = true;
2113 : }
2114 19 : } else if (!is_lng_nil(cnts[gid])) {
2115 19 : AVERAGE_ITER(sht, vals[o], avgs[gid], rems[gid], cnts[gid]);
2116 : }
2117 : }
2118 3 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2119 1 : if (cnts[i] == 0) {
2120 0 : avgs[i] = sht_nil;
2121 0 : bn->tnil = true;
2122 : } else
2123 : #ifdef TRUNCATE_NUMBERS
2124 : if (!is_sht_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0) {
2125 : avgs[i]++;
2126 : rems[i] -= cnts[i];
2127 : }
2128 : #else
2129 1 : if (!is_sht_nil(avgs[i]) && rems[i] > 0) {
2130 1 : if (avgs[i] < 0) {
2131 0 : if (2*rems[i] > cnts[i]) {
2132 0 : avgs[i]++;
2133 0 : rems[i] -= cnts[i];
2134 : }
2135 : } else {
2136 1 : if (2*rems[i] >= cnts[i]) {
2137 0 : avgs[i]++;
2138 0 : rems[i] -= cnts[i];
2139 : }
2140 : }
2141 : }
2142 : #endif
2143 : }
2144 : break;
2145 : }
2146 241 : case TYPE_int: {
2147 241 : const int *vals = (const int *) bi.base;
2148 241 : int *avgs = Tloc(bn, 0);
2149 2826545 : TIMEOUT_LOOP(ci.ncand, qry_ctx) {
2150 2825718 : o = canditer_next(&ci) - b->hseqbase;
2151 2825718 : if (ngrp > 1)
2152 383417 : gid = gids ? gids[o] - min : o;
2153 2825718 : if (is_int_nil(vals[o])) {
2154 127430 : if (!skip_nils) {
2155 0 : avgs[gid] = int_nil;
2156 0 : rems[gid] = lng_nil;
2157 0 : cnts[gid] = lng_nil;
2158 0 : bn->tnil = true;
2159 0 : rn->tnil = true;
2160 0 : cn->tnil = true;
2161 : }
2162 2698288 : } else if (!is_lng_nil(cnts[gid])) {
2163 2848210 : AVERAGE_ITER(int, vals[o], avgs[gid], rems[gid], cnts[gid]);
2164 : }
2165 : }
2166 220266 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2167 219780 : if (cnts[i] == 0) {
2168 1090 : avgs[i] = int_nil;
2169 1090 : bn->tnil = true;
2170 : } else
2171 : #ifdef TRUNCATE_NUMBERS
2172 : if (!is_int_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0) {
2173 : avgs[i]++;
2174 : rems[i] -= cnts[i];
2175 : }
2176 : #else
2177 218690 : if (!is_int_nil(avgs[i]) && rems[i] > 0) {
2178 78412 : if (avgs[i] < 0) {
2179 59062 : if (2*rems[i] > cnts[i]) {
2180 22040 : avgs[i]++;
2181 22040 : rems[i] -= cnts[i];
2182 : }
2183 : } else {
2184 19350 : if (2*rems[i] >= cnts[i]) {
2185 14979 : avgs[i]++;
2186 14979 : rems[i] -= cnts[i];
2187 : }
2188 : }
2189 : }
2190 : #endif
2191 : }
2192 : break;
2193 : }
2194 102 : case TYPE_lng: {
2195 102 : const lng *vals = (const lng *) bi.base;
2196 102 : lng *avgs = Tloc(bn, 0);
2197 226374 : TIMEOUT_LOOP(ci.ncand, qry_ctx) {
2198 226172 : o = canditer_next(&ci) - b->hseqbase;
2199 226171 : if (ngrp > 1)
2200 205318 : gid = gids ? gids[o] - min : o;
2201 226171 : if (is_lng_nil(vals[o])) {
2202 210 : if (!skip_nils) {
2203 0 : avgs[gid] = lng_nil;
2204 0 : rems[gid] = lng_nil;
2205 0 : cnts[gid] = lng_nil;
2206 0 : bn->tnil = true;
2207 0 : rn->tnil = true;
2208 0 : cn->tnil = true;
2209 : }
2210 225961 : } else if (!is_lng_nil(cnts[gid])) {
2211 226701 : AVERAGE_ITER(lng, vals[o], avgs[gid], rems[gid], cnts[gid]);
2212 : }
2213 : }
2214 63381 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2215 63180 : if (cnts[i] == 0) {
2216 165 : avgs[i] = lng_nil;
2217 165 : bn->tnil = true;
2218 : } else
2219 : #ifdef TRUNCATE_NUMBERS
2220 : if (!is_lng_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0) {
2221 : avgs[i]++;
2222 : rems[i] -= cnts[i];
2223 : }
2224 : #else
2225 63015 : if (!is_lng_nil(avgs[i]) && rems[i] > 0) {
2226 831 : if (avgs[i] < 0) {
2227 129 : if (2*rems[i] > cnts[i]) {
2228 0 : avgs[i]++;
2229 0 : rems[i] -= cnts[i];
2230 : }
2231 : } else {
2232 702 : if (2*rems[i] >= cnts[i]) {
2233 718 : avgs[i]++;
2234 718 : rems[i] -= cnts[i];
2235 : }
2236 : }
2237 : }
2238 : #endif
2239 : }
2240 : break;
2241 : }
2242 : #ifdef HAVE_HGE
2243 10 : case TYPE_hge: {
2244 10 : const hge *vals = (const hge *) bi.base;
2245 10 : hge *avgs = Tloc(bn, 0);
2246 11896801 : TIMEOUT_LOOP(ci.ncand, qry_ctx) {
2247 11896058 : o = canditer_next(&ci) - b->hseqbase;
2248 11896058 : if (ngrp > 1)
2249 150700 : gid = gids ? gids[o] - min : o;
2250 11896058 : if (is_hge_nil(vals[o])) {
2251 248594 : if (!skip_nils) {
2252 0 : avgs[gid] = hge_nil;
2253 0 : rems[gid] = lng_nil;
2254 0 : cnts[gid] = lng_nil;
2255 0 : bn->tnil = true;
2256 0 : rn->tnil = true;
2257 0 : cn->tnil = true;
2258 : }
2259 11647464 : } else if (!is_lng_nil(cnts[gid])) {
2260 11896058 : AVERAGE_ITER(hge, vals[o], avgs[gid], rems[gid], cnts[gid]);
2261 : }
2262 : }
2263 139 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2264 119 : if (cnts[i] == 0) {
2265 0 : avgs[i] = hge_nil;
2266 0 : bn->tnil = true;
2267 : } else
2268 : #ifdef TRUNCATE_NUMBERS
2269 : if (!is_hge_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0) {
2270 : avgs[i]++;
2271 : rems[i] -= cnts[i];
2272 : }
2273 : #else
2274 119 : if (!is_hge_nil(avgs[i]) && rems[i] > 0) {
2275 119 : if (avgs[i] < 0) {
2276 0 : if (2*rems[i] > cnts[i]) {
2277 0 : avgs[i]++;
2278 0 : rems[i] -= cnts[i];
2279 : }
2280 : } else {
2281 119 : if (2*rems[i] >= cnts[i]) {
2282 56 : avgs[i]++;
2283 56 : rems[i] -= cnts[i];
2284 : }
2285 : }
2286 : }
2287 : #endif
2288 : }
2289 : break;
2290 : }
2291 : #endif
2292 : }
2293 370 : bat_iterator_end(&bi);
2294 371 : TIMEOUT_CHECK(qry_ctx, GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx));
2295 371 : BATsetcount(bn, ngrp);
2296 371 : BATsetcount(rn, ngrp);
2297 371 : BATsetcount(cn, ngrp);
2298 371 : bn->tnonil = !bn->tnil;
2299 371 : rn->tnonil = !rn->tnil;
2300 371 : cn->tnonil = !cn->tnil;
2301 371 : bn->tkey = rn->tkey = cn->tkey = ngrp == 1;
2302 371 : bn->tsorted = rn->tsorted = cn->tsorted = ngrp == 1;
2303 371 : bn->trevsorted = rn->trevsorted = cn->trevsorted = ngrp == 1;
2304 371 : *avgp = bn;
2305 371 : *remp = rn;
2306 371 : *cntp = cn;
2307 371 : return GDK_SUCCEED;
2308 :
2309 0 : bailout:
2310 0 : BBPreclaim(bn);
2311 0 : BBPreclaim(rn);
2312 0 : BBPreclaim(cn);
2313 0 : return GDK_FAIL;
2314 : }
2315 :
2316 : #ifdef HAVE_HGE
2317 : #define BIGINT uhge
2318 : #else
2319 : #define BIGINT uint64_t
2320 : #endif
2321 : /* calculate the values (a*b)/c and (a*b)%c but without causing overflow
2322 : *
2323 : * this function is from https://stackoverflow.com/a/8757419, only with the
2324 : * slight addition of returning the remainder and changing the first argument
2325 : * and return value to BIGINT */
2326 : static inline BIGINT
2327 0 : multdiv(BIGINT a, uint64_t b, uint64_t c, uint64_t *rem)
2328 : {
2329 0 : static BIGINT const base = ((BIGINT)1)<<(sizeof(BIGINT)*4);
2330 : // static BIGINT const maxdiv = (base-1)*base + (base-1);
2331 0 : static BIGINT const maxdiv = ~(BIGINT)0;
2332 :
2333 : // First get the easy thing
2334 0 : BIGINT res = (a/c) * b + (a%c) * (b/c);
2335 0 : a %= c;
2336 0 : b %= c;
2337 : // Are we done?
2338 0 : if (a == 0 || b == 0) {
2339 0 : *rem = 0;
2340 0 : return res;
2341 : }
2342 : // Is it easy to compute what remain to be added?
2343 0 : if (c < base) {
2344 0 : *rem = (uint64_t) ((a*b)%c);
2345 0 : return res + (a*b/c);
2346 : }
2347 : // Now 0 < a < c, 0 < b < c, c >= 1ULL
2348 : // Normalize
2349 : BIGINT norm = maxdiv/c;
2350 : BIGINT cbig = c * norm; // orig: c *= norm; and below cbig was plain c
2351 : a *= norm;
2352 : // split into 2 digits
2353 : BIGINT ah = a / base, al = a % base;
2354 : BIGINT bh = b / base, bl = b % base;
2355 : BIGINT ch = cbig / base, cl = cbig % base;
2356 : // compute the product
2357 : BIGINT p0 = al*bl;
2358 : BIGINT p1 = p0 / base + al*bh;
2359 : p0 %= base;
2360 : BIGINT p2 = p1 / base + ah*bh;
2361 : p1 = (p1 % base) + ah * bl;
2362 : p2 += p1 / base;
2363 : p1 %= base;
2364 : // p2 holds 2 digits, p1 and p0 one
2365 :
2366 : // first digit is easy, not null only in case of overflow
2367 : //BIGINT q2 = p2 / cbig;
2368 : p2 = p2 % cbig;
2369 :
2370 : // second digit, estimate
2371 : BIGINT q1 = p2 / ch;
2372 : // and now adjust
2373 : BIGINT rhat = p2 % ch;
2374 : // the loop can be unrolled, it will be executed at most twice for
2375 : // even bases -- three times for odd one -- due to the normalisation above
2376 : while (q1 >= base || (rhat < base && q1*cl > rhat*base+p1)) {
2377 : q1--;
2378 : rhat += ch;
2379 : }
2380 : // subtract
2381 : p1 = ((p2 % base) * base + p1) - q1 * cl;
2382 : p2 = (p2 / base * base + p1 / base) - q1 * ch;
2383 : p1 = p1 % base + (p2 % base) * base;
2384 :
2385 : // now p1 hold 2 digits, p0 one and p2 is to be ignored
2386 : BIGINT q0 = p1 / ch;
2387 : rhat = p1 % ch;
2388 : while (q0 >= base || (rhat < base && q0*cl > rhat*base+p0)) {
2389 : q0--;
2390 : rhat += ch;
2391 : }
2392 : // subtract
2393 : p0 = ((p1 % base) * base + p0) - q0 * cl;
2394 : p1 = (p1 / base * base + p0 / base) - q0 * ch;
2395 : p0 = p0 % base + (p1 % base) * base;
2396 :
2397 : *rem = p0 / norm;
2398 : return res + q0 + q1 * base; // + q2 *base*base
2399 : }
2400 :
2401 : static inline void
2402 16 : combine_averages_bte(bte *avgp, lng *remp, lng *cntp,
2403 : bte avg1, lng rem1, lng cnt1,
2404 : bte avg2, lng rem2, lng cnt2)
2405 : {
2406 16 : lng cnt = cnt1 + cnt2;
2407 :
2408 16 : if (rem2 < 0) {
2409 8 : avg2--;
2410 8 : rem2 += cnt2;
2411 : }
2412 16 : *cntp = cnt;
2413 16 : lng v = avg1 * cnt1 + rem1 + avg2 * cnt2 + rem2;
2414 16 : bte a = (bte) (v / cnt);
2415 16 : v %= cnt;
2416 16 : if (v < 0) {
2417 0 : a--;
2418 0 : v += cnt;
2419 : }
2420 16 : *avgp = a;
2421 16 : *remp = v;
2422 16 : }
2423 :
2424 : static inline void
2425 1 : combine_averages_sht(sht *avgp, lng *remp, lng *cntp,
2426 : sht avg1, lng rem1, lng cnt1,
2427 : sht avg2, lng rem2, lng cnt2)
2428 : {
2429 1 : lng cnt = cnt1 + cnt2;
2430 :
2431 1 : if (rem2 < 0) {
2432 0 : avg2--;
2433 0 : rem2 += cnt2;
2434 : }
2435 1 : *cntp = cnt;
2436 1 : lng v = avg1 * cnt1 + rem1 + avg2 * cnt2 + rem2;
2437 1 : sht a = (sht) (v / cnt);
2438 1 : v %= cnt;
2439 1 : if (v < 0) {
2440 0 : a--;
2441 0 : v += cnt;
2442 : }
2443 1 : *avgp = a;
2444 1 : *remp = v;
2445 1 : }
2446 :
2447 :
2448 : static inline void
2449 141764 : combine_averages_int(int *avgp, lng *remp, lng *cntp,
2450 : int avg1, lng rem1, lng cnt1,
2451 : int avg2, lng rem2, lng cnt2)
2452 : {
2453 141764 : lng cnt = cnt1 + cnt2;
2454 :
2455 141764 : if (rem2 < 0) {
2456 28981 : avg2--;
2457 28981 : rem2 += cnt2;
2458 : }
2459 141764 : *cntp = cnt;
2460 : #ifdef HAVE_HGE
2461 141764 : hge v = avg1 * cnt1 + rem1 + avg2 * cnt2 + rem2;
2462 141764 : int a = (int) (v / cnt);
2463 141764 : v %= cnt;
2464 141764 : if (v < 0) {
2465 104955 : a--;
2466 104955 : v += cnt;
2467 : }
2468 141764 : *avgp = a;
2469 141764 : *remp = (lng) v;
2470 : #else
2471 : if (cnt1 == 0) {
2472 : avg1 = 0;
2473 : rem1 = 0;
2474 : }
2475 : lng rem = rem1 + rem2;
2476 : lng v;
2477 : uint64_t r;
2478 : if (avg1 < 0) {
2479 : avg1 = (int) multdiv((uint64_t) -avg1, cnt1, cnt, &r);
2480 : if (r > 0) {
2481 : avg1 = -avg1 - 1;
2482 : r = cnt - r;
2483 : } else {
2484 : avg1 = -avg1;
2485 : }
2486 : } else {
2487 : avg1 = (int) multdiv((uint64_t) avg1, cnt1, cnt, &r);
2488 : }
2489 : v = avg1;
2490 : rem += r;
2491 : if (avg2 < 0) {
2492 : avg2 = (int) multdiv((uint64_t) -avg2, cnt2, cnt, &r);
2493 : if (r > 0) {
2494 : avg2 = -avg2 - 1;
2495 : r = cnt - r;
2496 : } else {
2497 : avg2 = -avg2;
2498 : }
2499 : } else {
2500 : avg2 = (int) multdiv((uint64_t) avg2, cnt2, cnt, &r);
2501 : }
2502 : v += avg2;
2503 : rem += r;
2504 : while (rem >= cnt) { /* max twice */
2505 : v++;
2506 : rem -= cnt;
2507 : }
2508 : *avgp = (int) v;
2509 : *remp = rem;
2510 : #endif
2511 141764 : }
2512 :
2513 : static inline void
2514 96 : combine_averages_lng(lng *avgp, lng *remp, lng *cntp,
2515 : lng avg1, lng rem1, lng cnt1,
2516 : lng avg2, lng rem2, lng cnt2)
2517 : {
2518 96 : lng cnt = cnt1 + cnt2;
2519 :
2520 96 : if (rem2 < 0) {
2521 52 : avg2--;
2522 52 : rem2 += cnt2;
2523 : }
2524 96 : *cntp = cnt;
2525 : #ifdef HAVE_HGE
2526 96 : hge v = avg1 * cnt1 + rem1 + avg2 * cnt2 + rem2;
2527 96 : lng a = (lng) (v / cnt);
2528 96 : v %= cnt;
2529 96 : if (v < 0) {
2530 0 : a--;
2531 0 : v += cnt;
2532 : }
2533 96 : *avgp = a;
2534 96 : *remp = (lng) v;
2535 : #else
2536 : if (cnt1 == 0) {
2537 : avg1 = 0;
2538 : rem1 = 0;
2539 : }
2540 : lng rem = rem1 + rem2;
2541 : lng v;
2542 : uint64_t r;
2543 : if (avg1 < 0) {
2544 : avg1 = (lng) multdiv((uint64_t) -avg1, cnt1, cnt, &r);
2545 : if (r > 0) {
2546 : avg1 = -avg1 - 1;
2547 : r = cnt - r;
2548 : } else {
2549 : avg1 = -avg1;
2550 : }
2551 : } else {
2552 : avg1 = (lng) multdiv((uint64_t) avg1, cnt1, cnt, &r);
2553 : }
2554 : v = avg1;
2555 : rem += r;
2556 : if (avg2 < 0) {
2557 : avg2 = (lng) multdiv((uint64_t) -avg2, cnt2, cnt, &r);
2558 : if (r > 0) {
2559 : avg2 = -avg2 - 1;
2560 : r = cnt - r;
2561 : } else {
2562 : avg2 = -avg2;
2563 : }
2564 : } else {
2565 : avg2 = (lng) multdiv((uint64_t) avg2, cnt2, cnt, &r);
2566 : }
2567 : v += avg2;
2568 : rem += r;
2569 : while (rem >= cnt) { /* max twice */
2570 : v++;
2571 : rem -= cnt;
2572 : }
2573 : *avgp = v;
2574 : *remp = rem;
2575 : #endif
2576 96 : }
2577 :
2578 : #ifdef HAVE_HGE
2579 : static inline void
2580 0 : combine_averages_hge(hge *avgp, lng *remp, lng *cntp,
2581 : hge avg1, lng rem1, lng cnt1,
2582 : hge avg2, lng rem2, lng cnt2)
2583 : {
2584 0 : if (cnt1 == 0) {
2585 0 : avg1 = 0;
2586 0 : rem1 = 0;
2587 : }
2588 0 : if (rem2 < 0) {
2589 0 : avg2--;
2590 0 : rem2 += cnt2;
2591 : }
2592 0 : lng cnt = cnt1 + cnt2;
2593 0 : lng rem = rem1 + rem2;
2594 0 : hge v;
2595 0 : uint64_t r;
2596 :
2597 0 : *cntp = cnt;
2598 0 : if (avg1 < 0) {
2599 0 : avg1 = (hge) multdiv((uhge) -avg1, cnt1, cnt, &r);
2600 0 : if (r > 0) {
2601 0 : avg1 = -avg1 - 1;
2602 0 : r = cnt - r;
2603 : } else {
2604 0 : avg1 = -avg1;
2605 : }
2606 : } else {
2607 0 : avg1 = (hge) multdiv((uhge) avg1, cnt1, cnt, &r);
2608 : }
2609 0 : v = avg1;
2610 0 : rem += r;
2611 0 : if (avg2 < 0) {
2612 0 : avg2 = (hge) multdiv((uhge) -avg2, cnt2, cnt, &r);
2613 0 : if (r > 0) {
2614 0 : avg2 = -avg2 - 1;
2615 0 : r = cnt - r;
2616 : } else {
2617 0 : avg2 = -avg2;
2618 : }
2619 : } else {
2620 0 : avg2 = (hge) multdiv((uhge) avg2, cnt2, cnt, &r);
2621 : }
2622 0 : v += avg2;
2623 0 : rem += r;
2624 0 : while (rem >= cnt) { /* max twice */
2625 0 : v++;
2626 0 : rem -= cnt;
2627 : }
2628 0 : *avgp = v;
2629 0 : *remp = rem;
2630 0 : }
2631 : #endif
2632 :
2633 : BAT *
2634 40 : BATgroupavg3combine(BAT *avg, BAT *rem, BAT *cnt, BAT *g, BAT *e, bool skip_nils)
2635 : {
2636 40 : const char *err;
2637 40 : oid min, max;
2638 40 : BUN ngrp;
2639 40 : struct canditer ci;
2640 40 : BUN i;
2641 40 : BAT *bn, *rn, *cn;
2642 :
2643 40 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
2644 :
2645 40 : if ((err = BATgroupaggrinit(avg, g, e, NULL, &min, &max, &ngrp, &ci)) != NULL) {
2646 0 : GDKerror("%s\n", err);
2647 0 : return NULL;
2648 : }
2649 39 : assert(ci.tpe == cand_dense);
2650 39 : if (ci.ncand != BATcount(rem) || ci.ncand != BATcount(cnt)) {
2651 0 : GDKerror("input bats not aligned");
2652 0 : return NULL;
2653 : }
2654 39 : if (ci.ncand == 0 || ngrp == 0) {
2655 1 : return BATconstant(ngrp == 0 ? 0 : min, avg->ttype,
2656 1 : ATOMnilptr(avg->ttype), ngrp, TRANSIENT);
2657 : }
2658 38 : ValRecord zero;
2659 38 : (void) VALinit(&zero, TYPE_bte, &(bte){0});
2660 38 : bn = BATconstant(min, avg->ttype, VALconvert(avg->ttype, &zero),
2661 : ngrp, TRANSIENT);
2662 : /* rn and cn are temporary storage of intermediates */
2663 38 : rn = BATconstant(min, TYPE_lng, &(lng){0}, ngrp, TRANSIENT);
2664 39 : cn = BATconstant(min, TYPE_lng, &(lng){0}, ngrp, TRANSIENT);
2665 39 : if (bn == NULL || rn == NULL || cn == NULL) {
2666 0 : BBPreclaim(bn);
2667 0 : BBPreclaim(rn);
2668 0 : BBPreclaim(cn);
2669 0 : return NULL;
2670 : }
2671 39 : lng *rems = Tloc(rn, 0);
2672 39 : lng *cnts = Tloc(cn, 0);
2673 39 : const lng *orems = Tloc(rem, 0);
2674 39 : const lng *ocnts = Tloc(cnt, 0);
2675 39 : const oid *gids = g && !BATtdense(g) ? Tloc(g, 0) : NULL;
2676 39 : oid gid = ngrp == 1 && gids ? gids[0] - min : 0;
2677 :
2678 39 : BATiter bi = bat_iterator(avg);
2679 :
2680 76 : switch (ATOMbasetype(avg->ttype)) {
2681 2 : case TYPE_bte: {
2682 2 : const bte *vals = (const bte *) bi.base;
2683 2 : bte *avgs = Tloc(bn, 0);
2684 22 : TIMEOUT_LOOP_IDX(i, ci.ncand, qry_ctx) {
2685 16 : if (ngrp > 1)
2686 0 : gid = gids ? gids[i] - min : i;
2687 16 : if (is_bte_nil(vals[i])) {
2688 0 : if (!skip_nils) {
2689 0 : avgs[gid] = bte_nil;
2690 0 : bn->tnil = true;
2691 : }
2692 16 : } else if (!is_bte_nil(avgs[gid])) {
2693 16 : combine_averages_bte(&avgs[gid], &rems[gid],
2694 : &cnts[gid], avgs[gid],
2695 16 : rems[gid], cnts[gid],
2696 16 : vals[i], orems[i],
2697 16 : ocnts[i]);
2698 : }
2699 : }
2700 6 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2701 2 : if (cnts[i] == 0) {
2702 0 : avgs[i] = bte_nil;
2703 0 : bn->tnil = true;
2704 : } else
2705 : #ifdef TRUNCATE_NUMBERS
2706 : if (!is_bte_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0)
2707 : avgs[i]++;
2708 : #else
2709 2 : if (!is_bte_nil(avgs[i]) && rems[i] > 0) {
2710 2 : if (avgs[i] < 0) {
2711 0 : if (2*rems[i] > cnts[i])
2712 0 : avgs[i]++;
2713 : } else {
2714 2 : if (2*rems[i] >= cnts[i])
2715 0 : avgs[i]++;
2716 : }
2717 : }
2718 : #endif
2719 : }
2720 : break;
2721 : }
2722 1 : case TYPE_sht: {
2723 1 : const sht *vals = (const sht *) bi.base;
2724 1 : sht *avgs = Tloc(bn, 0);
2725 4 : TIMEOUT_LOOP_IDX(i, ci.ncand, qry_ctx) {
2726 1 : if (ngrp > 1)
2727 0 : gid = gids ? gids[i] - min : i;
2728 1 : if (is_sht_nil(vals[i])) {
2729 0 : if (!skip_nils) {
2730 0 : avgs[gid] = sht_nil;
2731 0 : bn->tnil = true;
2732 : }
2733 1 : } else if (!is_sht_nil(avgs[gid])) {
2734 1 : combine_averages_sht(&avgs[gid], &rems[gid],
2735 : &cnts[gid], avgs[gid],
2736 1 : rems[gid], cnts[gid],
2737 1 : vals[i], orems[i],
2738 1 : ocnts[i]);
2739 : }
2740 : }
2741 3 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2742 1 : if (cnts[i] == 0) {
2743 0 : avgs[i] = sht_nil;
2744 0 : bn->tnil = true;
2745 : } else
2746 : #ifdef TRUNCATE_NUMBERS
2747 : if (!is_sht_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0)
2748 : avgs[i]++;
2749 : #else
2750 1 : if (!is_sht_nil(avgs[i]) && rems[i] > 0) {
2751 1 : if (avgs[i] < 0) {
2752 0 : if (2*rems[i] > cnts[i])
2753 0 : avgs[i]++;
2754 : } else {
2755 1 : if (2*rems[i] >= cnts[i])
2756 0 : avgs[i]++;
2757 : }
2758 : }
2759 : #endif
2760 : }
2761 : break;
2762 : }
2763 32 : case TYPE_int: {
2764 32 : const int *vals = (const int *) bi.base;
2765 32 : int *avgs = Tloc(bn, 0);
2766 142581 : TIMEOUT_LOOP_IDX(i, ci.ncand, qry_ctx) {
2767 142469 : if (ngrp > 1)
2768 142306 : gid = gids ? gids[i] - min : i;
2769 142469 : if (is_int_nil(vals[i])) {
2770 705 : if (!skip_nils) {
2771 0 : avgs[gid] = int_nil;
2772 0 : bn->tnil = true;
2773 : }
2774 141764 : } else if (!is_int_nil(avgs[gid])) {
2775 141764 : combine_averages_int(&avgs[gid], &rems[gid],
2776 : &cnts[gid], avgs[gid],
2777 141764 : rems[gid], cnts[gid],
2778 141764 : vals[i], orems[i],
2779 141764 : ocnts[i]);
2780 : }
2781 : }
2782 52824 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2783 52756 : if (cnts[i] == 0) {
2784 42 : avgs[i] = int_nil;
2785 42 : bn->tnil = true;
2786 : } else
2787 : #ifdef TRUNCATE_NUMBERS
2788 : if (!is_int_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0)
2789 : avgs[i]++;
2790 : #else
2791 52714 : if (!is_int_nil(avgs[i]) && rems[i] > 0) {
2792 36918 : if (avgs[i] < 0) {
2793 33434 : if (2*rems[i] > cnts[i])
2794 16188 : avgs[i]++;
2795 : } else {
2796 3484 : if (2*rems[i] >= cnts[i])
2797 3081 : avgs[i]++;
2798 : }
2799 : }
2800 : #endif
2801 : }
2802 : break;
2803 : }
2804 3 : case TYPE_lng: {
2805 3 : const lng *vals = (const lng *) bi.base;
2806 3 : lng *avgs = Tloc(bn, 0);
2807 105 : TIMEOUT_LOOP_IDX(i, ci.ncand, qry_ctx) {
2808 96 : if (ngrp > 1)
2809 96 : gid = gids ? gids[i] - min : i;
2810 96 : if (is_lng_nil(vals[i])) {
2811 0 : if (!skip_nils) {
2812 0 : avgs[gid] = lng_nil;
2813 0 : bn->tnil = true;
2814 : }
2815 96 : } else if (!is_lng_nil(avgs[gid])) {
2816 96 : combine_averages_lng(&avgs[gid], &rems[gid],
2817 : &cnts[gid], avgs[gid],
2818 96 : rems[gid], cnts[gid],
2819 96 : vals[i], orems[i],
2820 96 : ocnts[i]);
2821 : }
2822 : }
2823 18 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2824 12 : if (cnts[i] == 0) {
2825 0 : avgs[i] = lng_nil;
2826 0 : bn->tnil = true;
2827 : } else
2828 : #ifdef TRUNCATE_NUMBERS
2829 : if (!is_lng_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0)
2830 : avgs[i]++;
2831 : #else
2832 12 : if (!is_lng_nil(avgs[i]) && rems[i] > 0) {
2833 12 : if (avgs[i] < 0) {
2834 0 : if (2*rems[i] > cnts[i])
2835 0 : avgs[i]++;
2836 : } else {
2837 12 : if (2*rems[i] >= cnts[i])
2838 10 : avgs[i]++;
2839 : }
2840 : }
2841 : #endif
2842 : }
2843 : break;
2844 : }
2845 : #ifdef HAVE_HGE
2846 0 : case TYPE_hge: {
2847 0 : const hge *vals = (const hge *) bi.base;
2848 0 : hge *avgs = Tloc(bn, 0);
2849 0 : TIMEOUT_LOOP_IDX(i, ci.ncand, qry_ctx) {
2850 0 : if (ngrp > 1)
2851 0 : gid = gids ? gids[i] - min : i;
2852 0 : if (is_hge_nil(vals[i])) {
2853 0 : if (!skip_nils) {
2854 0 : avgs[gid] = hge_nil;
2855 0 : bn->tnil = true;
2856 : }
2857 0 : } else if (!is_hge_nil(avgs[gid])) {
2858 0 : combine_averages_hge(&avgs[gid], &rems[gid],
2859 : &cnts[gid], avgs[gid],
2860 0 : rems[gid], cnts[gid],
2861 0 : vals[i], orems[i],
2862 0 : ocnts[i]);
2863 : }
2864 : }
2865 0 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
2866 0 : if (cnts[i] == 0) {
2867 0 : avgs[i] = hge_nil;
2868 0 : bn->tnil = true;
2869 : } else
2870 : #ifdef TRUNCATE_NUMBERS
2871 : if (!is_hge_nil(avgs[i]) && rems[i] > 0 && avgs[i] < 0)
2872 : avgs[i]++;
2873 : #else
2874 0 : if (!is_hge_nil(avgs[i]) && rems[i] > 0) {
2875 0 : if (avgs[i] < 0) {
2876 0 : if (2*rems[i] > cnts[i])
2877 0 : avgs[i]++;
2878 : } else {
2879 0 : if (2*rems[i] >= cnts[i])
2880 0 : avgs[i]++;
2881 : }
2882 : }
2883 : #endif
2884 : }
2885 : break;
2886 : }
2887 : #endif
2888 : }
2889 39 : bat_iterator_end(&bi);
2890 39 : BBPreclaim(rn);
2891 39 : BBPreclaim(cn);
2892 39 : TIMEOUT_CHECK(qry_ctx, GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx));
2893 39 : BATsetcount(bn, ngrp);
2894 39 : bn->tnonil = !bn->tnil;
2895 39 : bn->tkey = ngrp == 1;
2896 39 : bn->tsorted = ngrp == 1;
2897 39 : bn->trevsorted = ngrp == 1;
2898 39 : return bn;
2899 :
2900 0 : bailout:
2901 0 : BBPreclaim(bn);
2902 0 : return NULL;
2903 : }
2904 :
2905 : #define AVERAGE_TYPE_LNG_HGE(TYPE,lng_hge) \
2906 : do { \
2907 : TYPE x, a; \
2908 : \
2909 : /* first try to calculate the sum of all values into a */ \
2910 : /* lng/hge */ \
2911 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
2912 : i = canditer_next(&ci) - b->hseqbase; \
2913 : x = ((const TYPE *) src)[i]; \
2914 : if (is_##TYPE##_nil(x)) \
2915 : continue; \
2916 : ADDI_WITH_CHECK(x, sum, \
2917 : lng_hge, sum, \
2918 : GDK_##lng_hge##_max, \
2919 : goto overflow##TYPE); \
2920 : /* don't count value until after overflow check */ \
2921 : n++; \
2922 : } \
2923 : /* the sum fit, so now we can calculate the average */ \
2924 : *avg = n > 0 ? (dbl) sum / n : dbl_nil; \
2925 : if (0) { \
2926 : overflow##TYPE: \
2927 : /* we get here if sum(x[0],...,x[i]) doesn't */ \
2928 : /* fit in a lng/hge but sum(x[0],...,x[i-1]) did */ \
2929 : /* the variable sum contains that sum */ \
2930 : /* the rest of the calculation is done */ \
2931 : /* according to the loop invariant described */ \
2932 : /* in the below loop */ \
2933 : /* note that n necessarily is > 0 (else no */ \
2934 : /* overflow possible) */ \
2935 : assert(n > 0); \
2936 : if (sum >= 0) { \
2937 : a = (TYPE) (sum / n); /* this fits */ \
2938 : r = (lng) (sum % n); \
2939 : } else { \
2940 : sum = -sum; \
2941 : a = - (TYPE) (sum / n); /* this fits */ \
2942 : r = (lng) (sum % n); \
2943 : if (r) { \
2944 : a--; \
2945 : r = n - r; \
2946 : } \
2947 : } \
2948 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
2949 : /* loop invariant: */ \
2950 : /* a + r/n == average(x[0],...,x[n]); */ \
2951 : /* 0 <= r < n */ \
2952 : i = canditer_next(&ci) - b->hseqbase; \
2953 : x = ((const TYPE *) src)[i]; \
2954 : if (is_##TYPE##_nil(x)) \
2955 : continue; \
2956 : AVERAGE_ITER(TYPE, x, a, r, n); \
2957 : } \
2958 : *avg = a + (dbl) r / n; \
2959 : } \
2960 : TIMEOUT_CHECK(qry_ctx, \
2961 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
2962 : } while (0)
2963 :
2964 : #ifdef HAVE_HGE
2965 : #define AVERAGE_TYPE(TYPE) AVERAGE_TYPE_LNG_HGE(TYPE,hge)
2966 : #else
2967 : #define AVERAGE_TYPE(TYPE) AVERAGE_TYPE_LNG_HGE(TYPE,lng)
2968 : #endif
2969 :
2970 : #define AVERAGE_FLOATTYPE(TYPE) \
2971 : do { \
2972 : double a = 0; \
2973 : TYPE x; \
2974 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
2975 : i = canditer_next(&ci) - b->hseqbase; \
2976 : x = ((const TYPE *) src)[i]; \
2977 : if (is_##TYPE##_nil(x)) \
2978 : continue; \
2979 : AVERAGE_ITER_FLOAT(TYPE, x, a, n); \
2980 : } \
2981 : TIMEOUT_CHECK(qry_ctx, \
2982 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
2983 : *avg = n > 0 ? a : dbl_nil; \
2984 : } while (0)
2985 :
2986 : gdk_return
2987 7987 : BATcalcavg(BAT *b, BAT *s, dbl *avg, BUN *vals, int scale)
2988 : {
2989 7987 : lng n = 0, r = 0;
2990 7987 : BUN i = 0;
2991 : #ifdef HAVE_HGE
2992 7987 : hge sum = 0;
2993 : #else
2994 : lng sum = 0;
2995 : #endif
2996 7987 : struct canditer ci;
2997 7987 : const void *restrict src;
2998 :
2999 7987 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
3000 :
3001 7987 : canditer_init(&ci, b, s);
3002 :
3003 7989 : BATiter bi = bat_iterator(b);
3004 7990 : src = bi.base;
3005 :
3006 7990 : switch (b->ttype) {
3007 8 : case TYPE_bte:
3008 24 : AVERAGE_TYPE(bte);
3009 : break;
3010 0 : case TYPE_sht:
3011 0 : AVERAGE_TYPE(sht);
3012 : break;
3013 7922 : case TYPE_int:
3014 4750158 : AVERAGE_TYPE(int);
3015 : break;
3016 9 : case TYPE_lng:
3017 10000637 : AVERAGE_TYPE(lng);
3018 : break;
3019 : #ifdef HAVE_HGE
3020 4 : case TYPE_hge:
3021 10 : AVERAGE_TYPE(hge);
3022 : break;
3023 : #endif
3024 1 : case TYPE_flt:
3025 100006105 : AVERAGE_FLOATTYPE(flt);
3026 1 : break;
3027 46 : case TYPE_dbl:
3028 163 : AVERAGE_FLOATTYPE(dbl);
3029 46 : break;
3030 0 : default:
3031 0 : GDKerror("average of type %s unsupported.\n",
3032 : ATOMname(bi.type));
3033 0 : goto bailout;
3034 : }
3035 7985 : bat_iterator_end(&bi);
3036 7985 : if (scale != 0 && !is_dbl_nil(*avg))
3037 0 : *avg /= pow(10.0, (double) scale);
3038 7985 : if (vals)
3039 7985 : *vals = (BUN) n;
3040 : return GDK_SUCCEED;
3041 0 : bailout:
3042 0 : bat_iterator_end(&bi);
3043 0 : return GDK_FAIL;
3044 : }
3045 :
3046 : /* ---------------------------------------------------------------------- */
3047 : /* count */
3048 :
3049 : #define AGGR_COUNT(TYPE) \
3050 : do { \
3051 : const TYPE *restrict vals = (const TYPE *) bi.base; \
3052 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
3053 : i = canditer_next(&ci) - b->hseqbase; \
3054 : if (gids == NULL || \
3055 : (gids[i] >= min && gids[i] <= max)) { \
3056 : if (gids) \
3057 : gid = gids[i] - min; \
3058 : else \
3059 : gid = (oid) i; \
3060 : if (!is_##TYPE##_nil(vals[i])) { \
3061 : cnts[gid]++; \
3062 : } \
3063 : } \
3064 : } \
3065 : } while (0)
3066 :
3067 : /* calculate group counts with optional candidates list */
3068 : BAT *
3069 28828 : BATgroupcount(BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
3070 : {
3071 28828 : const oid *restrict gids;
3072 28828 : oid gid;
3073 28828 : oid min, max;
3074 28828 : BUN i, ngrp;
3075 28828 : lng *restrict cnts;
3076 28828 : BAT *bn = NULL;
3077 28828 : int t;
3078 28828 : const void *nil;
3079 28828 : int (*atomcmp)(const void *, const void *);
3080 28828 : struct canditer ci;
3081 28828 : const char *err;
3082 28828 : lng t0 = 0;
3083 28828 : BATiter bi = {0};
3084 :
3085 28828 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
3086 :
3087 28832 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
3088 :
3089 28832 : assert(tp == TYPE_lng);
3090 28832 : (void) tp; /* compatibility (with other BATgroup* */
3091 :
3092 28832 : if ((err = BATgroupaggrinit(b, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
3093 0 : GDKerror("%s\n", err);
3094 0 : return NULL;
3095 : }
3096 28836 : if (g == NULL) {
3097 0 : GDKerror("b and g must be aligned\n");
3098 0 : return NULL;
3099 : }
3100 :
3101 28836 : if (ci.ncand == 0 || ngrp == 0) {
3102 : /* trivial: no counts, so return bat aligned with g
3103 : * with zero in the tail */
3104 13719 : lng zero = 0;
3105 13719 : return BATconstant(ngrp == 0 ? 0 : min, TYPE_lng, &zero, ngrp, TRANSIENT);
3106 : }
3107 :
3108 15117 : bn = COLnew(min, TYPE_lng, ngrp, TRANSIENT);
3109 15112 : if (bn == NULL)
3110 : return NULL;
3111 15112 : cnts = (lng *) Tloc(bn, 0);
3112 15112 : memset(cnts, 0, ngrp * sizeof(lng));
3113 :
3114 15112 : if (BATtdense(g))
3115 : gids = NULL;
3116 : else
3117 11528 : gids = (const oid *) Tloc(g, 0);
3118 :
3119 15112 : if (!skip_nils || b->tnonil) {
3120 : /* if nils are nothing special, or if there are no
3121 : * nils, we don't need to look at the values at all */
3122 15014 : if (gids) {
3123 18479404 : TIMEOUT_LOOP(ci.ncand, qry_ctx) {
3124 18455352 : i = canditer_next(&ci) - b->hseqbase;
3125 18455360 : if (gids[i] >= min && gids[i] <= max)
3126 18470142 : cnts[gids[i] - min]++;
3127 : }
3128 : } else {
3129 93511 : TIMEOUT_LOOP(ci.ncand, qry_ctx) {
3130 86479 : i = canditer_next(&ci) - b->hseqbase;
3131 86481 : cnts[i] = 1;
3132 : }
3133 : }
3134 : } else {
3135 98 : t = b->ttype;
3136 98 : nil = ATOMnilptr(t);
3137 98 : atomcmp = ATOMcompare(t);
3138 98 : t = ATOMbasetype(t);
3139 :
3140 98 : bi = bat_iterator(b);
3141 :
3142 98 : switch (t) {
3143 3 : case TYPE_bte:
3144 11 : AGGR_COUNT(bte);
3145 : break;
3146 0 : case TYPE_sht:
3147 0 : AGGR_COUNT(sht);
3148 : break;
3149 79 : case TYPE_int:
3150 15617 : AGGR_COUNT(int);
3151 : break;
3152 0 : case TYPE_lng:
3153 0 : AGGR_COUNT(lng);
3154 : break;
3155 : #ifdef HAVE_HGE
3156 0 : case TYPE_hge:
3157 0 : AGGR_COUNT(hge);
3158 : break;
3159 : #endif
3160 0 : case TYPE_flt:
3161 0 : AGGR_COUNT(flt);
3162 : break;
3163 5 : case TYPE_dbl:
3164 155 : AGGR_COUNT(dbl);
3165 : break;
3166 11 : default:
3167 127 : TIMEOUT_LOOP(ci.ncand, qry_ctx) {
3168 107 : i = canditer_next(&ci) - b->hseqbase;
3169 106 : if (gids == NULL ||
3170 104 : (gids[i] >= min && gids[i] <= max)) {
3171 104 : if (gids)
3172 104 : gid = gids[i] - min;
3173 : else
3174 : gid = (oid) i;
3175 106 : if ((*atomcmp)(BUNtail(bi, i), nil) != 0) {
3176 75 : cnts[gid]++;
3177 : }
3178 : }
3179 : }
3180 : break;
3181 : }
3182 97 : bat_iterator_end(&bi);
3183 : }
3184 15114 : TIMEOUT_CHECK(qry_ctx, GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx));
3185 15105 : BATsetcount(bn, ngrp);
3186 15105 : bn->tkey = BATcount(bn) <= 1;
3187 15105 : bn->tsorted = BATcount(bn) <= 1;
3188 15105 : bn->trevsorted = BATcount(bn) <= 1;
3189 15105 : bn->tnil = false;
3190 15105 : bn->tnonil = true;
3191 15105 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",g=" ALGOOPTBATFMT ","
3192 : "e=" ALGOOPTBATFMT ",s=" ALGOOPTBATFMT " -> " ALGOOPTBATFMT
3193 : "; start " OIDFMT ", count " BUNFMT " (" LLFMT " usec)\n",
3194 : ALGOBATPAR(b), ALGOOPTBATPAR(g), ALGOOPTBATPAR(e),
3195 : ALGOOPTBATPAR(s), ALGOOPTBATPAR(bn),
3196 : ci.seq, ci.ncand, GDKusec() - t0);
3197 : return bn;
3198 :
3199 0 : bailout:
3200 0 : BBPreclaim(bn);
3201 0 : return NULL;
3202 : }
3203 :
3204 : /* ---------------------------------------------------------------------- */
3205 : /* min and max */
3206 :
3207 : #define AGGR_CMP(TYPE, OP) \
3208 : do { \
3209 : const TYPE *restrict vals = (const TYPE *) bi->base; \
3210 : if (ngrp == ci->ncand) { \
3211 : /* single element groups */ \
3212 : TIMEOUT_LOOP(ci->ncand, qry_ctx) { \
3213 : i = canditer_next(ci) - hseq; \
3214 : if (!skip_nils || \
3215 : !is_##TYPE##_nil(vals[i])) { \
3216 : oids[gid] = i + hseq; \
3217 : nils--; \
3218 : } \
3219 : gid++; \
3220 : } \
3221 : } else { \
3222 : TIMEOUT_LOOP(ci->ncand, qry_ctx) { \
3223 : i = canditer_next(ci) - hseq; \
3224 : if (gids == NULL || \
3225 : (gids[i] >= min && gids[i] <= max)) { \
3226 : if (gids) \
3227 : gid = gids[i] - min; \
3228 : if (!skip_nils || !is_##TYPE##_nil(vals[i])) { \
3229 : if (is_oid_nil(oids[gid])) { \
3230 : oids[gid] = i + hseq; \
3231 : nils--; \
3232 : } else if (!is_##TYPE##_nil(vals[oids[gid] - hseq]) && \
3233 : (is_##TYPE##_nil(vals[i]) || \
3234 : OP(vals[i], vals[oids[gid] - hseq]))) \
3235 : oids[gid] = i + hseq; \
3236 : } \
3237 : } \
3238 : } \
3239 : } \
3240 : } while (0)
3241 :
3242 : /* calculate group minimums with optional candidates list
3243 : *
3244 : * note that this functions returns *positions* of where the minimum
3245 : * values occur */
3246 : static BUN
3247 589 : do_groupmin(oid *restrict oids, BATiter *bi, const oid *restrict gids, BUN ngrp,
3248 : oid min, oid max, struct canditer *restrict ci,
3249 : bool skip_nils, bool gdense)
3250 : {
3251 589 : oid gid = 0;
3252 589 : BUN i, nils;
3253 589 : int t;
3254 589 : const void *nil;
3255 589 : int (*atomcmp)(const void *, const void *);
3256 :
3257 589 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
3258 :
3259 589 : nils = ngrp;
3260 56204 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx)
3261 55025 : oids[i] = oid_nil;
3262 589 : if (ci->ncand == 0)
3263 : return nils;
3264 :
3265 589 : t = bi->b->ttype;
3266 589 : nil = ATOMnilptr(t);
3267 589 : atomcmp = ATOMcompare(t);
3268 589 : t = ATOMbasetype(t);
3269 589 : oid hseq = bi->b->hseqbase;
3270 :
3271 589 : switch (t) {
3272 12 : case TYPE_bte:
3273 70 : AGGR_CMP(bte, LT);
3274 : break;
3275 1 : case TYPE_sht:
3276 1746 : AGGR_CMP(sht, LT);
3277 : break;
3278 426 : case TYPE_int:
3279 62919 : AGGR_CMP(int, LT);
3280 : break;
3281 58 : case TYPE_lng:
3282 92832 : AGGR_CMP(lng, LT);
3283 : break;
3284 : #ifdef HAVE_HGE
3285 0 : case TYPE_hge:
3286 0 : AGGR_CMP(hge, LT);
3287 : break;
3288 : #endif
3289 0 : case TYPE_flt:
3290 0 : AGGR_CMP(flt, LT);
3291 : break;
3292 44 : case TYPE_dbl:
3293 356 : AGGR_CMP(dbl, LT);
3294 : break;
3295 0 : case TYPE_void:
3296 0 : if (!skip_nils || !is_oid_nil(bi->tseq)) {
3297 0 : if (!gdense && gids == NULL) {
3298 0 : oids[0] = canditer_next(ci);
3299 0 : nils--;
3300 0 : } else if (gdense) {
3301 : /* single element groups */
3302 0 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
3303 0 : i = canditer_next(ci);
3304 0 : oids[gid++] = i;
3305 0 : nils--;
3306 : }
3307 : } else {
3308 0 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
3309 0 : i = canditer_next(ci);
3310 0 : gid = gids[i - hseq] - min;
3311 0 : if (is_oid_nil(oids[gid])) {
3312 0 : oids[gid] = i;
3313 0 : nils--;
3314 : }
3315 : }
3316 : }
3317 : }
3318 : break;
3319 48 : default:
3320 48 : assert(bi->b->ttype != TYPE_oid);
3321 :
3322 48 : if (gdense) {
3323 : /* single element groups */
3324 24 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
3325 8 : i = canditer_next(ci) - hseq;
3326 16 : if (!skip_nils ||
3327 8 : (*atomcmp)(BUNtail(*bi, i), nil) != 0) {
3328 7 : oids[gid] = i + hseq;
3329 7 : nils--;
3330 : }
3331 8 : gid++;
3332 : }
3333 : } else {
3334 22231 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
3335 22151 : i = canditer_next(ci) - hseq;
3336 22151 : if (gids == NULL ||
3337 43 : (gids[i] >= min && gids[i] <= max)) {
3338 22151 : const void *v = BUNtail(*bi, i);
3339 22153 : if (gids)
3340 48 : gid = gids[i] - min;
3341 44302 : if (!skip_nils ||
3342 22151 : (*atomcmp)(v, nil) != 0) {
3343 19734 : if (is_oid_nil(oids[gid])) {
3344 58 : oids[gid] = i + hseq;
3345 58 : nils--;
3346 19676 : } else if (t != TYPE_void) {
3347 19676 : const void *g = BUNtail(*bi, (BUN) (oids[gid] - hseq));
3348 39353 : if ((*atomcmp)(g, nil) != 0 &&
3349 39354 : ((*atomcmp)(v, nil) == 0 ||
3350 19677 : LT((*atomcmp)(v, g), 0)))
3351 85 : oids[gid] = i + hseq;
3352 : }
3353 : }
3354 : }
3355 : }
3356 : }
3357 : break;
3358 : }
3359 589 : TIMEOUT_CHECK(qry_ctx, TIMEOUT_HANDLER(BUN_NONE, qry_ctx));
3360 :
3361 : return nils;
3362 : }
3363 :
3364 : /* calculate group maximums with optional candidates list
3365 : *
3366 : * note that this functions returns *positions* of where the maximum
3367 : * values occur */
3368 : static BUN
3369 646 : do_groupmax(oid *restrict oids, BATiter *bi, const oid *restrict gids, BUN ngrp,
3370 : oid min, oid max, struct canditer *restrict ci,
3371 : bool skip_nils, bool gdense)
3372 : {
3373 646 : oid gid = 0;
3374 646 : BUN i, nils;
3375 646 : int t;
3376 646 : const void *nil;
3377 646 : int (*atomcmp)(const void *, const void *);
3378 :
3379 646 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
3380 :
3381 645 : nils = ngrp;
3382 681132 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx)
3383 679769 : oids[i] = oid_nil;
3384 644 : if (ci->ncand == 0)
3385 : return nils;
3386 :
3387 644 : t = bi->b->ttype;
3388 644 : nil = ATOMnilptr(t);
3389 644 : atomcmp = ATOMcompare(t);
3390 644 : t = ATOMbasetype(t);
3391 644 : oid hseq = bi->b->hseqbase;
3392 :
3393 644 : switch (t) {
3394 25 : case TYPE_bte:
3395 164 : AGGR_CMP(bte, GT);
3396 : break;
3397 1 : case TYPE_sht:
3398 169 : AGGR_CMP(sht, GT);
3399 : break;
3400 468 : case TYPE_int:
3401 75281 : AGGR_CMP(int, GT);
3402 : break;
3403 73 : case TYPE_lng:
3404 93459 : AGGR_CMP(lng, GT);
3405 : break;
3406 : #ifdef HAVE_HGE
3407 5 : case TYPE_hge:
3408 35423991 : AGGR_CMP(hge, GT);
3409 : break;
3410 : #endif
3411 1 : case TYPE_flt:
3412 8 : AGGR_CMP(flt, GT);
3413 : break;
3414 35 : case TYPE_dbl:
3415 279 : AGGR_CMP(dbl, GT);
3416 : break;
3417 0 : case TYPE_void:
3418 0 : if (!skip_nils || !is_oid_nil(bi->tseq)) {
3419 0 : if (!gdense && gids == NULL) {
3420 0 : oids[0] = canditer_last(ci);
3421 0 : nils--;
3422 0 : } else if (gdense) {
3423 : /* single element groups */
3424 0 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
3425 0 : i = canditer_next(ci);
3426 0 : oids[gid++] = i;
3427 0 : nils--;
3428 : }
3429 : } else {
3430 0 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
3431 0 : i = canditer_next(ci);
3432 0 : gid = gids[i - hseq] - min;
3433 0 : if (is_oid_nil(oids[gid]))
3434 0 : nils--;
3435 0 : oids[gid] = i;
3436 : }
3437 : }
3438 : }
3439 : break;
3440 36 : default:
3441 36 : assert(bi->b->ttype != TYPE_oid);
3442 :
3443 36 : if (gdense) {
3444 : /* single element groups */
3445 30 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
3446 10 : i = canditer_next(ci) - hseq;
3447 20 : if (!skip_nils ||
3448 10 : (*atomcmp)(BUNtail(*bi, i), nil) != 0) {
3449 10 : oids[gid] = i + hseq;
3450 10 : nils--;
3451 : }
3452 10 : gid++;
3453 : }
3454 : } else {
3455 21264 : TIMEOUT_LOOP(ci->ncand, qry_ctx) {
3456 21212 : i = canditer_next(ci) - hseq;
3457 21212 : if (gids == NULL ||
3458 20 : (gids[i] >= min && gids[i] <= max)) {
3459 21212 : const void *v = BUNtail(*bi, i);
3460 21212 : if (gids)
3461 20 : gid = gids[i] - min;
3462 42424 : if (!skip_nils ||
3463 21212 : (*atomcmp)(v, nil) != 0) {
3464 18794 : if (is_oid_nil(oids[gid])) {
3465 31 : oids[gid] = i + hseq;
3466 31 : nils--;
3467 : } else {
3468 18763 : const void *g = BUNtail(*bi, (BUN) (oids[gid] - hseq));
3469 18763 : if (t == TYPE_void ||
3470 37526 : ((*atomcmp)(g, nil) != 0 &&
3471 37526 : ((*atomcmp)(v, nil) == 0 ||
3472 18763 : GT((*atomcmp)(v, g), 0))))
3473 206 : oids[gid] = i + hseq;
3474 : }
3475 : }
3476 : }
3477 : }
3478 : }
3479 : break;
3480 : }
3481 646 : TIMEOUT_CHECK(qry_ctx, TIMEOUT_HANDLER(BUN_NONE, qry_ctx));
3482 :
3483 : return nils;
3484 : }
3485 :
3486 : static BAT *
3487 1190 : BATgroupminmax(BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils,
3488 : BUN (*minmax)(oid *restrict, BATiter *, const oid *restrict, BUN,
3489 : oid, oid, struct canditer *restrict,
3490 : bool, bool),
3491 : const char *name)
3492 : {
3493 1190 : const oid *restrict gids;
3494 1190 : oid min, max;
3495 1190 : BUN ngrp;
3496 1190 : oid *restrict oids;
3497 1190 : BAT *bn = NULL;
3498 1190 : BUN nils;
3499 1190 : struct canditer ci;
3500 1190 : const char *err;
3501 1190 : lng t0 = 0;
3502 :
3503 1190 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
3504 :
3505 1190 : assert(tp == TYPE_oid);
3506 1190 : (void) tp; /* compatibility (with other BATgroup* */
3507 :
3508 1190 : if (!ATOMlinear(b->ttype)) {
3509 0 : GDKerror("%s: cannot determine minimum on "
3510 : "non-linear type %s\n", name, ATOMname(b->ttype));
3511 0 : return NULL;
3512 : }
3513 :
3514 1190 : if ((err = BATgroupaggrinit(b, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
3515 0 : GDKerror("%s: %s\n", name, err);
3516 0 : return NULL;
3517 : }
3518 :
3519 1190 : if (ci.ncand == 0 || ngrp == 0) {
3520 : /* trivial: no minimums, so return bat aligned with g
3521 : * with nil in the tail */
3522 140 : return BATconstant(ngrp == 0 ? 0 : min, TYPE_oid, &oid_nil, ngrp, TRANSIENT);
3523 : }
3524 :
3525 1050 : bn = COLnew(min, TYPE_oid, ngrp, TRANSIENT);
3526 1046 : if (bn == NULL)
3527 : return NULL;
3528 1046 : oids = (oid *) Tloc(bn, 0);
3529 :
3530 1046 : if (g == NULL || BATtdense(g))
3531 : gids = NULL;
3532 : else
3533 522 : gids = (const oid *) Tloc(g, 0);
3534 :
3535 1046 : BATiter bi = bat_iterator(b);
3536 1050 : nils = (*minmax)(oids, &bi, gids, ngrp, min, max, &ci,
3537 1050 : skip_nils, g && BATtdense(g));
3538 1047 : bat_iterator_end(&bi);
3539 1046 : if (nils == BUN_NONE) {
3540 0 : BBPreclaim(bn);
3541 0 : return NULL;
3542 : }
3543 :
3544 1046 : BATsetcount(bn, ngrp);
3545 :
3546 1050 : bn->tkey = BATcount(bn) <= 1;
3547 1050 : bn->tsorted = BATcount(bn) <= 1;
3548 1050 : bn->trevsorted = BATcount(bn) <= 1;
3549 1050 : bn->tnil = nils != 0;
3550 1050 : bn->tnonil = nils == 0;
3551 1050 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",g=" ALGOOPTBATFMT ","
3552 : "e=" ALGOOPTBATFMT ",s=" ALGOOPTBATFMT " -> " ALGOOPTBATFMT
3553 : "; start " OIDFMT ", count " BUNFMT " (%s -- " LLFMT " usec)\n",
3554 : ALGOBATPAR(b), ALGOOPTBATPAR(g), ALGOOPTBATPAR(e),
3555 : ALGOOPTBATPAR(s), ALGOOPTBATPAR(bn),
3556 : ci.seq, ci.ncand, name, GDKusec() - t0);
3557 : return bn;
3558 : }
3559 :
3560 : BAT *
3561 539 : BATgroupmin(BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
3562 : {
3563 539 : return BATgroupminmax(b, g, e, s, tp, skip_nils,
3564 : do_groupmin, __func__);
3565 : }
3566 :
3567 : /* return pointer to smallest non-nil value in b, or pointer to nil if
3568 : * there is no such value (no values at all, or only nil) */
3569 : void *
3570 1267 : BATmin_skipnil(BAT *b, void *aggr, bit skipnil)
3571 : {
3572 1267 : const void *res = NULL;
3573 1267 : size_t s;
3574 1267 : lng t0 = 0;
3575 :
3576 1267 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
3577 :
3578 1267 : if (!ATOMlinear(b->ttype)) {
3579 : /* there is no such thing as a smallest value if you
3580 : * can't compare values */
3581 0 : GDKerror("non-linear type");
3582 0 : return NULL;
3583 : }
3584 1267 : BATiter bi = bat_iterator(b);
3585 1269 : if (bi.count == 0) {
3586 289 : res = ATOMnilptr(bi.type);
3587 980 : } else if (bi.minpos != BUN_NONE) {
3588 355 : res = BUNtail(bi, bi.minpos);
3589 : } else {
3590 625 : oid pos;
3591 902 : BAT *pb = BATdescriptor(VIEWtparent(b));
3592 625 : Heap *oidxh = NULL;
3593 625 : bool usepoidx = false;
3594 :
3595 625 : if (BATordered(b)) {
3596 412 : if (skipnil && !bi.nonil) {
3597 119 : pos = binsearch(NULL, 0, bi.type, bi.base,
3598 119 : bi.vh ? bi.vh->base : NULL,
3599 119 : bi.width, 0, bi.count,
3600 119 : ATOMnilptr(bi.type), 1, 1);
3601 119 : if (pos == bi.count)
3602 53 : pos = oid_nil;
3603 : else
3604 66 : pos += b->hseqbase;
3605 : } else {
3606 293 : pos = b->hseqbase;
3607 : }
3608 213 : } else if (BATordered_rev(b)) {
3609 124 : if (skipnil && !bi.nonil) {
3610 119 : pos = binsearch(NULL, 0, bi.type, bi.base,
3611 119 : bi.vh ? bi.vh->base : NULL,
3612 119 : bi.width, 0, bi.count,
3613 119 : ATOMnilptr(bi.type), -1, 0);
3614 119 : if (pos == 0)
3615 0 : pos = oid_nil;
3616 : else
3617 119 : pos = pos + b->hseqbase - 1;
3618 : } else {
3619 5 : pos = bi.count + b->hseqbase - 1;
3620 : }
3621 : } else {
3622 89 : if (BATcheckorderidx(b)) {
3623 0 : MT_lock_set(&b->batIdxLock);
3624 0 : oidxh = b->torderidx;
3625 0 : if (oidxh != NULL)
3626 0 : HEAPincref(oidxh);
3627 0 : MT_lock_unset(&b->batIdxLock);
3628 : }
3629 89 : if (oidxh == NULL &&
3630 131 : pb != NULL &&
3631 42 : BATcheckorderidx(pb)) {
3632 : /* no lock on b needed since it's a view */
3633 0 : MT_lock_set(&pb->batIdxLock);
3634 0 : MT_lock_set(&pb->theaplock);
3635 0 : if (pb->tbaseoff == bi.baseoff &&
3636 0 : BATcount(pb) == bi.count &&
3637 0 : pb->hseqbase == b->hseqbase &&
3638 0 : (oidxh = pb->torderidx) != NULL) {
3639 0 : HEAPincref(oidxh);
3640 0 : usepoidx = true;
3641 : }
3642 0 : MT_lock_unset(&pb->batIdxLock);
3643 0 : MT_lock_unset(&pb->theaplock);
3644 : }
3645 89 : if (oidxh != NULL) {
3646 0 : const oid *ords = (const oid *) oidxh->base + ORDERIDXOFF;
3647 0 : BUN r;
3648 0 : if (skipnil && !bi.nonil) {
3649 0 : MT_thread_setalgorithm(usepoidx ? "binsearch on parent oidx" : "binsearch on oidx");
3650 0 : r = binsearch(ords, 0, bi.type, bi.base,
3651 0 : bi.vh ? bi.vh->base : NULL,
3652 0 : bi.width, 0, bi.count,
3653 0 : ATOMnilptr(bi.type), 1, 1);
3654 0 : if (r == 0) {
3655 : /* there are no nils, record that */
3656 0 : MT_lock_set(&b->theaplock);
3657 0 : if (b->batCount == bi.count) {
3658 0 : b->tnonil = true;
3659 : }
3660 0 : MT_lock_unset(&b->theaplock);
3661 : }
3662 : } else {
3663 : r = 0;
3664 : }
3665 0 : if (r == bi.count) {
3666 : /* no non-nil values */
3667 0 : pos = oid_nil;
3668 : } else {
3669 0 : MT_thread_setalgorithm(usepoidx ? "using parent oidx" : "using oidx");
3670 0 : pos = ords[r];
3671 : }
3672 0 : HEAPdecref(oidxh, false);
3673 : } else {
3674 89 : struct canditer ci;
3675 89 : canditer_init(&ci, b, NULL);
3676 89 : (void) do_groupmin(&pos, &bi, NULL, 1, 0, 0, &ci,
3677 : skipnil, false);
3678 : }
3679 : }
3680 625 : if (is_oid_nil(pos)) {
3681 53 : res = ATOMnilptr(bi.type);
3682 : } else {
3683 572 : bi.minpos = pos - b->hseqbase;
3684 572 : res = BUNtail(bi, bi.minpos);
3685 572 : MT_lock_set(&b->theaplock);
3686 572 : if (bi.count == BATcount(b) && bi.h == b->theap)
3687 572 : b->tminpos = bi.minpos;
3688 572 : MT_lock_unset(&b->theaplock);
3689 572 : if (pb) {
3690 334 : MT_lock_set(&pb->theaplock);
3691 334 : if (bi.count == BATcount(pb) &&
3692 61 : bi.h == pb->theap)
3693 61 : pb->tminpos = bi.minpos;
3694 334 : MT_lock_unset(&pb->theaplock);
3695 : }
3696 : }
3697 972 : BBPreclaim(pb);
3698 : }
3699 1268 : if (aggr == NULL) {
3700 528 : s = ATOMlen(bi.type, res);
3701 528 : aggr = GDKmalloc(s);
3702 : } else {
3703 1479 : s = ATOMsize(ATOMtype(bi.type));
3704 : }
3705 1269 : if (aggr != NULL) /* else: malloc error */
3706 1268 : memcpy(aggr, res, s);
3707 1269 : bat_iterator_end(&bi);
3708 1268 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",skipnil=%d; (" LLFMT " usec)\n",
3709 : ALGOBATPAR(b), skipnil, GDKusec() - t0);
3710 : return aggr;
3711 : }
3712 :
3713 : void *
3714 487 : BATmin(BAT *b, void *aggr)
3715 : {
3716 487 : return BATmin_skipnil(b, aggr, 1);
3717 : }
3718 :
3719 : BAT *
3720 651 : BATgroupmax(BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
3721 : {
3722 651 : return BATgroupminmax(b, g, e, s, tp, skip_nils,
3723 : do_groupmax, __func__);
3724 : }
3725 :
3726 : void *
3727 1349 : BATmax_skipnil(BAT *b, void *aggr, bit skipnil)
3728 : {
3729 1349 : const void *res = NULL;
3730 1349 : size_t s;
3731 1349 : lng t0 = 0;
3732 :
3733 1349 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
3734 :
3735 1349 : if (!ATOMlinear(b->ttype)) {
3736 : /* there is no such thing as a largest value if you
3737 : * can't compare values */
3738 0 : GDKerror("non-linear type");
3739 0 : return NULL;
3740 : }
3741 1349 : BATiter bi = bat_iterator(b);
3742 1352 : if (bi.count == 0) {
3743 224 : res = ATOMnilptr(bi.type);
3744 1128 : } else if (bi.maxpos != BUN_NONE) {
3745 642 : res = BUNtail(bi, bi.maxpos);
3746 : } else {
3747 486 : oid pos;
3748 663 : BAT *pb = BATdescriptor(VIEWtparent(b));
3749 486 : Heap *oidxh = NULL;
3750 486 : bool usepoidx = false;
3751 :
3752 486 : if (BATordered(b)) {
3753 349 : pos = bi.count - 1 + b->hseqbase;
3754 429 : if (skipnil && !bi.nonil &&
3755 80 : ATOMcmp(bi.type, BUNtail(bi, bi.count - 1),
3756 : ATOMnilptr(bi.type)) == 0)
3757 40 : pos = oid_nil; /* no non-nil values */
3758 136 : } else if (BATordered_rev(b)) {
3759 39 : pos = b->hseqbase;
3760 73 : if (skipnil && !bi.nonil &&
3761 34 : ATOMcmp(bi.type, BUNtail(bi, 0),
3762 : ATOMnilptr(bi.type)) == 0)
3763 0 : pos = oid_nil; /* no non-nil values */
3764 : } else {
3765 97 : if (BATcheckorderidx(b)) {
3766 0 : MT_lock_set(&b->batIdxLock);
3767 0 : oidxh = b->torderidx;
3768 0 : if (oidxh != NULL)
3769 0 : HEAPincref(oidxh);
3770 0 : MT_lock_unset(&b->batIdxLock);
3771 : }
3772 97 : if (oidxh == NULL &&
3773 135 : pb != NULL &&
3774 38 : BATcheckorderidx(pb)) {
3775 : /* no lock on b needed since it's a view */
3776 0 : MT_lock_set(&pb->batIdxLock);
3777 0 : MT_lock_set(&pb->theaplock);
3778 0 : if (pb->tbaseoff == bi.baseoff &&
3779 0 : BATcount(pb) == bi.count &&
3780 0 : pb->hseqbase == b->hseqbase &&
3781 0 : (oidxh = pb->torderidx) != NULL) {
3782 0 : HEAPincref(oidxh);
3783 0 : usepoidx = true;
3784 : }
3785 0 : MT_lock_unset(&pb->batIdxLock);
3786 0 : MT_lock_unset(&pb->theaplock);
3787 : }
3788 97 : if (oidxh != NULL) {
3789 0 : const oid *ords = (const oid *) oidxh->base + ORDERIDXOFF;
3790 :
3791 0 : MT_thread_setalgorithm(usepoidx ? "using parent oidx" : "using oids");
3792 0 : pos = ords[bi.count - 1];
3793 : /* nils are first, ie !skipnil, check for nils */
3794 0 : if (!skipnil) {
3795 0 : BUN z = ords[0];
3796 :
3797 0 : res = BUNtail(bi, z - b->hseqbase);
3798 :
3799 0 : if (ATOMcmp(bi.type, res, ATOMnilptr(bi.type)) == 0)
3800 0 : pos = z;
3801 : }
3802 0 : HEAPdecref(oidxh, false);
3803 : } else {
3804 97 : struct canditer ci;
3805 97 : canditer_init(&ci, b, NULL);
3806 97 : (void) do_groupmax(&pos, &bi, NULL, 1, 0, 0, &ci,
3807 : skipnil, false);
3808 : }
3809 : }
3810 485 : if (is_oid_nil(pos)) {
3811 40 : res = ATOMnilptr(bi.type);
3812 : } else {
3813 445 : bi.maxpos = pos - b->hseqbase;
3814 445 : res = BUNtail(bi, bi.maxpos);
3815 445 : MT_lock_set(&b->theaplock);
3816 446 : if (bi.count == BATcount(b) && bi.h == b->theap)
3817 446 : b->tmaxpos = bi.maxpos;
3818 446 : MT_lock_unset(&b->theaplock);
3819 446 : if (pb) {
3820 301 : MT_lock_set(&pb->theaplock);
3821 300 : if (bi.count == BATcount(pb) &&
3822 83 : bi.h == pb->theap)
3823 83 : pb->tmaxpos = bi.maxpos;
3824 300 : MT_lock_unset(&pb->theaplock);
3825 : }
3826 : }
3827 795 : BBPreclaim(pb);
3828 : }
3829 1352 : if (aggr == NULL) {
3830 554 : s = ATOMlen(bi.type, res);
3831 553 : aggr = GDKmalloc(s);
3832 : } else {
3833 1594 : s = ATOMsize(ATOMtype(bi.type));
3834 : }
3835 1353 : if (aggr != NULL) /* else: malloc error */
3836 1352 : memcpy(aggr, res, s);
3837 1353 : bat_iterator_end(&bi);
3838 1352 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",skipnil=%d; (" LLFMT " usec)\n",
3839 : ALGOBATPAR(b), skipnil, GDKusec() - t0);
3840 : return aggr;
3841 : }
3842 :
3843 : void *
3844 801 : BATmax(BAT *b, void *aggr)
3845 : {
3846 801 : return BATmax_skipnil(b, aggr, 1);
3847 : }
3848 :
3849 :
3850 : /* ---------------------------------------------------------------------- */
3851 : /* quantiles/median */
3852 :
3853 : #if SIZEOF_OID == SIZEOF_INT
3854 : #define binsearch_oid(indir, offset, vals, lo, hi, v, ordering, last) binsearch_int(indir, offset, (const int *) vals, lo, hi, (int) (v), ordering, last)
3855 : #endif
3856 : #if SIZEOF_OID == SIZEOF_LNG
3857 : #define binsearch_oid(indir, offset, vals, lo, hi, v, ordering, last) binsearch_lng(indir, offset, (const lng *) vals, lo, hi, (lng) (v), ordering, last)
3858 : #endif
3859 :
3860 : #define DO_QUANTILE_AVG(TPE) \
3861 : do { \
3862 : BUN idxlo, idxhi; \
3863 : if (ords) { \
3864 : idxlo = ords[r + (BUN) lo] - b->hseqbase; \
3865 : idxhi = ords[r + (BUN) hi] - b->hseqbase; \
3866 : } else { \
3867 : idxlo = r + (BUN) lo; \
3868 : idxhi = r + (BUN) hi; \
3869 : } \
3870 : TPE low = *(TPE*) BUNtloc(bi, idxhi); \
3871 : TPE high = *(TPE*) BUNtloc(bi, idxlo); \
3872 : if (is_##TPE##_nil(low) || is_##TPE##_nil(high)) { \
3873 : val = dbl_nil; \
3874 : nils++; \
3875 : } else { \
3876 : val = (f - lo) * low + (lo + 1 - f) * high; \
3877 : } \
3878 : } while (0)
3879 :
3880 : static BAT *
3881 65 : doBATgroupquantile(BAT *b, BAT *g, BAT *e, BAT *s, int tp, double quantile,
3882 : bool skip_nils, bool average)
3883 : {
3884 65 : BAT *origb = b;
3885 65 : BAT *origg = g;
3886 65 : oid min, max;
3887 65 : BUN ngrp;
3888 65 : BUN nils = 0;
3889 65 : BAT *bn = NULL;
3890 65 : struct canditer ci;
3891 65 : BAT *t1, *t2;
3892 65 : BATiter bi = {0};
3893 65 : const void *v;
3894 65 : const void *nil = ATOMnilptr(tp);
3895 65 : const void *dnil = nil;
3896 65 : dbl val; /* only used for average */
3897 65 : int (*atomcmp)(const void *, const void *) = ATOMcompare(tp);
3898 65 : const char *err;
3899 65 : lng t0 = 0;
3900 :
3901 65 : size_t counter = 0;
3902 65 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
3903 :
3904 65 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
3905 :
3906 65 : if (average) {
3907 12 : switch (ATOMbasetype(b->ttype)) {
3908 : case TYPE_bte:
3909 : case TYPE_sht:
3910 : case TYPE_int:
3911 : case TYPE_lng:
3912 : #ifdef HAVE_HGE
3913 : case TYPE_hge:
3914 : #endif
3915 : case TYPE_flt:
3916 : case TYPE_dbl:
3917 : break;
3918 0 : default:
3919 0 : GDKerror("incompatible type\n");
3920 0 : return NULL;
3921 : }
3922 : dnil = &dbl_nil;
3923 : }
3924 65 : if ((err = BATgroupaggrinit(b, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
3925 0 : GDKerror("%s\n", err);
3926 0 : return NULL;
3927 : }
3928 66 : assert(tp == b->ttype);
3929 66 : if (!ATOMlinear(tp)) {
3930 0 : GDKerror("cannot determine quantile on "
3931 : "non-linear type %s\n", ATOMname(tp));
3932 0 : return NULL;
3933 : }
3934 66 : if (quantile < 0 || quantile > 1) {
3935 2 : GDKerror("cannot determine quantile for "
3936 : "p=%f (p has to be in [0,1])\n", quantile);
3937 2 : return NULL;
3938 : }
3939 :
3940 64 : if (BATcount(b) == 0 || ngrp == 0 || is_dbl_nil(quantile)) {
3941 : /* trivial: no values, thus also no quantiles,
3942 : * so return bat aligned with e with nil in the tail
3943 : * The same happens for a NULL quantile */
3944 24 : return BATconstant(ngrp == 0 ? 0 : min, average ? TYPE_dbl : tp, dnil, ngrp, TRANSIENT);
3945 : }
3946 :
3947 52 : if (s) {
3948 : /* there is a candidate list, replace b (and g, if
3949 : * given) with just the values we're interested in */
3950 0 : b = BATproject(s, b);
3951 0 : if (b == NULL)
3952 : return NULL;
3953 0 : if (g) {
3954 0 : g = BATproject(s, g);
3955 0 : if (g == NULL)
3956 0 : goto bailout;
3957 : }
3958 : }
3959 :
3960 : /* we want to sort b so that we can figure out the quantile, but
3961 : * if g is given, sort g and subsort b so that we can get the
3962 : * quantile for each group */
3963 52 : if (g) {
3964 18 : const oid *restrict grps;
3965 18 : oid prev;
3966 18 : BUN p, q, r;
3967 :
3968 18 : if (BATtdense(g)) {
3969 : /* singleton groups, so calculating quantile is
3970 : * easy */
3971 1 : if (average)
3972 0 : bn = BATconvert(b, NULL, TYPE_dbl, 0, 0, 0);
3973 : else
3974 1 : bn = COLcopy(b, tp, false, TRANSIENT);
3975 1 : BAThseqbase(bn, g->tseqbase); /* deals with NULL */
3976 1 : if (b != origb)
3977 0 : BBPunfix(b->batCacheid);
3978 1 : if (g != origg)
3979 0 : BBPunfix(g->batCacheid);
3980 1 : return bn;
3981 : }
3982 17 : if (BATsort(&t1, &t2, NULL, g, NULL, NULL, false, false, false) != GDK_SUCCEED)
3983 0 : goto bailout;
3984 17 : if (g != origg)
3985 0 : BBPunfix(g->batCacheid);
3986 17 : g = t1;
3987 :
3988 17 : if (BATsort(&t1, NULL, NULL, b, t2, g, false, false, false) != GDK_SUCCEED) {
3989 0 : BBPunfix(t2->batCacheid);
3990 0 : goto bailout;
3991 : }
3992 17 : if (b != origb)
3993 0 : BBPunfix(b->batCacheid);
3994 17 : b = t1;
3995 17 : BBPunfix(t2->batCacheid);
3996 :
3997 16 : if (average)
3998 2 : bn = COLnew(min, TYPE_dbl, ngrp, TRANSIENT);
3999 : else
4000 14 : bn = COLnew(min, tp, ngrp, TRANSIENT);
4001 17 : if (bn == NULL)
4002 0 : goto bailout;
4003 :
4004 17 : bi = bat_iterator(b);
4005 :
4006 16 : grps = (const oid *) Tloc(g, 0);
4007 : /* for each group (r and p are the beginning and end
4008 : * of the current group, respectively) */
4009 69 : for (r = 0, q = BATcount(g); r < q; r = p) {
4010 53 : GDK_CHECK_TIMEOUT(qry_ctx, counter,
4011 : GOTO_LABEL_TIMEOUT_HANDLER(bunins_failed, qry_ctx));
4012 53 : BUN qindex;
4013 53 : prev = grps[r];
4014 : /* search for end of current group (grps is
4015 : * sorted so we can use binary search) */
4016 53 : p = binsearch_oid(NULL, 0, grps, r, q - 1, prev, 1, 1);
4017 52 : if (skip_nils && !bi.nonil) {
4018 : /* within group, locate start of non-nils */
4019 21 : r = binsearch(NULL, 0, tp, bi.base,
4020 21 : bi.vh ? bi.vh->base : NULL,
4021 21 : bi.width, r, p, nil,
4022 : 1, 1);
4023 : }
4024 52 : if (r == p) {
4025 : /* no non-nils found */
4026 11 : v = dnil;
4027 11 : nils++;
4028 41 : } else if (average) {
4029 4 : double f = (p - r - 1) * quantile;
4030 4 : double lo = floor(f);
4031 4 : double hi = ceil(f);
4032 4 : const oid *const ords = NULL;
4033 8 : switch (ATOMbasetype(tp)) {
4034 : case TYPE_bte:
4035 4 : DO_QUANTILE_AVG(bte);
4036 : break;
4037 : case TYPE_sht:
4038 0 : DO_QUANTILE_AVG(sht);
4039 : break;
4040 : case TYPE_int:
4041 0 : DO_QUANTILE_AVG(int);
4042 : break;
4043 : case TYPE_lng:
4044 0 : DO_QUANTILE_AVG(lng);
4045 : break;
4046 : #ifdef HAVE_HGE
4047 : case TYPE_hge:
4048 0 : DO_QUANTILE_AVG(hge);
4049 : break;
4050 : #endif
4051 : case TYPE_flt:
4052 0 : DO_QUANTILE_AVG(flt);
4053 : break;
4054 : case TYPE_dbl:
4055 0 : DO_QUANTILE_AVG(dbl);
4056 : break;
4057 : }
4058 52 : v = &val;
4059 : } else {
4060 : /* round *down* to nearest integer */
4061 37 : double f = (p - r - 1) * quantile;
4062 37 : qindex = r + p - (BUN) (p + 0.5 - f);
4063 : /* be a little paranoid about the index */
4064 37 : assert(qindex >= r && qindex < p);
4065 37 : v = BUNtail(bi, qindex);
4066 37 : if (!skip_nils && !bi.nonil)
4067 0 : nils += (*atomcmp)(v, dnil) == 0;
4068 : }
4069 52 : while (min < prev) {
4070 0 : if (bunfastapp_nocheck(bn, dnil) != GDK_SUCCEED)
4071 0 : goto bunins_failed;
4072 0 : min++;
4073 0 : nils++;
4074 : }
4075 52 : if (bunfastapp_nocheck(bn, v) != GDK_SUCCEED)
4076 0 : goto bunins_failed;
4077 53 : min++;
4078 : }
4079 16 : bat_iterator_end(&bi);
4080 17 : nils += ngrp - BATcount(bn);
4081 17 : while (BATcount(bn) < ngrp) {
4082 0 : if (bunfastapp_nocheck(bn, dnil) != GDK_SUCCEED)
4083 0 : goto bailout;
4084 : }
4085 17 : bn->theap->dirty = true;
4086 17 : BBPunfix(g->batCacheid);
4087 : } else {
4088 34 : BUN index, r, p = BATcount(b);
4089 34 : BAT *pb = NULL;
4090 34 : const oid *ords;
4091 34 : Heap *oidxh = NULL;
4092 :
4093 64 : bn = COLnew(0, average ? TYPE_dbl : tp, 1, TRANSIENT);
4094 34 : if (bn == NULL)
4095 0 : goto bailout;
4096 :
4097 34 : t1 = NULL;
4098 :
4099 34 : if (BATcheckorderidx(b)) {
4100 0 : MT_lock_set(&b->batIdxLock);
4101 0 : oidxh = b->torderidx;
4102 0 : if (oidxh != NULL)
4103 0 : HEAPincref(oidxh);
4104 0 : MT_lock_unset(&b->batIdxLock);
4105 : }
4106 11 : if (oidxh == NULL &&
4107 34 : VIEWtparent(b) &&
4108 11 : (pb = BATdescriptor(VIEWtparent(b))) != NULL) {
4109 11 : if (BATcheckorderidx(pb)) {
4110 : /* no lock on b needed since it's a view */
4111 0 : MT_lock_set(&pb->batIdxLock);
4112 0 : MT_lock_set(&pb->theaplock);
4113 0 : if (pb->tbaseoff == b->tbaseoff &&
4114 0 : BATcount(pb) == BATcount(b) &&
4115 0 : pb->hseqbase == b->hseqbase &&
4116 0 : (oidxh = pb->torderidx) != NULL) {
4117 0 : HEAPincref(oidxh);
4118 : }
4119 0 : MT_lock_unset(&pb->batIdxLock);
4120 0 : MT_lock_unset(&pb->theaplock);
4121 : }
4122 11 : BBPunfix(pb->batCacheid);
4123 : }
4124 34 : if (oidxh != NULL) {
4125 0 : MT_thread_setalgorithm(pb ? "using parent oidx" : "using oids");
4126 0 : ords = (const oid *) oidxh->base + ORDERIDXOFF;
4127 : } else {
4128 34 : if (BATsort(NULL, &t1, NULL, b, NULL, g, false, false, false) != GDK_SUCCEED)
4129 0 : goto bailout;
4130 34 : if (BATtdense(t1))
4131 : ords = NULL;
4132 : else
4133 0 : ords = (const oid *) Tloc(t1, 0);
4134 : }
4135 :
4136 34 : bi = bat_iterator(b);
4137 :
4138 34 : if (skip_nils && !bi.nonil)
4139 7 : r = binsearch(ords, 0, tp, bi.base,
4140 7 : bi.vh ? bi.vh->base : NULL,
4141 7 : bi.width, 0, p,
4142 : nil, 1, 1);
4143 : else
4144 : r = 0;
4145 :
4146 34 : if (r == p) {
4147 : /* no non-nil values, so quantile is nil */
4148 : v = dnil;
4149 : nils++;
4150 30 : } else if (average) {
4151 4 : double f = (p - r - 1) * quantile;
4152 4 : double lo = floor(f);
4153 4 : double hi = ceil(f);
4154 8 : switch (ATOMbasetype(tp)) {
4155 4 : case TYPE_bte:
4156 4 : DO_QUANTILE_AVG(bte);
4157 : break;
4158 0 : case TYPE_sht:
4159 0 : DO_QUANTILE_AVG(sht);
4160 : break;
4161 0 : case TYPE_int:
4162 0 : DO_QUANTILE_AVG(int);
4163 : break;
4164 0 : case TYPE_lng:
4165 0 : DO_QUANTILE_AVG(lng);
4166 : break;
4167 : #ifdef HAVE_HGE
4168 0 : case TYPE_hge:
4169 0 : DO_QUANTILE_AVG(hge);
4170 : break;
4171 : #endif
4172 0 : case TYPE_flt:
4173 0 : DO_QUANTILE_AVG(flt);
4174 : break;
4175 0 : case TYPE_dbl:
4176 0 : DO_QUANTILE_AVG(dbl);
4177 : break;
4178 : }
4179 : v = &val;
4180 : } else {
4181 26 : double f;
4182 : /* round (p-r-1)*quantile *down* to nearest
4183 : * integer (i.e., 1.49 and 1.5 are rounded to
4184 : * 1, 1.51 is rounded to 2) */
4185 26 : f = (p - r - 1) * quantile;
4186 26 : index = r + p - (BUN) (p + 0.5 - f);
4187 26 : if (ords)
4188 0 : index = ords[index] - b->hseqbase;
4189 : else
4190 26 : index = index + t1->tseqbase;
4191 26 : v = BUNtail(bi, index);
4192 26 : nils += (*atomcmp)(v, dnil) == 0;
4193 : }
4194 34 : if (oidxh != NULL)
4195 0 : HEAPdecref(oidxh, false);
4196 34 : BBPreclaim(t1);
4197 34 : gdk_return rc = BUNappend(bn, v, false);
4198 34 : bat_iterator_end(&bi);
4199 34 : if (rc != GDK_SUCCEED)
4200 0 : goto bailout;
4201 : }
4202 :
4203 51 : if (b != origb)
4204 17 : BBPunfix(b->batCacheid);
4205 :
4206 51 : bn->tkey = BATcount(bn) <= 1;
4207 51 : bn->tsorted = BATcount(bn) <= 1;
4208 51 : bn->trevsorted = BATcount(bn) <= 1;
4209 51 : bn->tnil = nils != 0;
4210 51 : bn->tnonil = nils == 0;
4211 51 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",g=" ALGOOPTBATFMT ","
4212 : "e=" ALGOOPTBATFMT ",s=" ALGOOPTBATFMT
4213 : ",quantile=%g,average=%s -> " ALGOOPTBATFMT
4214 : "; start " OIDFMT ", count " BUNFMT " (" LLFMT " usec)\n",
4215 : ALGOBATPAR(origb), ALGOOPTBATPAR(origg), ALGOOPTBATPAR(e),
4216 : ALGOOPTBATPAR(s), quantile, average ? "true" : "false",
4217 : ALGOOPTBATPAR(bn), ci.seq, ci.ncand, GDKusec() - t0);
4218 : return bn;
4219 :
4220 0 : bunins_failed:
4221 0 : bat_iterator_end(&bi);
4222 0 : bailout:
4223 0 : if (b && b != origb)
4224 0 : BBPunfix(b->batCacheid);
4225 0 : if (g && g != origg)
4226 0 : BBPunfix(g->batCacheid);
4227 0 : BBPreclaim(bn);
4228 : return NULL;
4229 : }
4230 :
4231 : BAT *
4232 29 : BATgroupmedian(BAT *b, BAT *g, BAT *e, BAT *s, int tp,
4233 : bool skip_nils)
4234 : {
4235 29 : return doBATgroupquantile(b, g, e, s, tp, 0.5,
4236 : skip_nils, false);
4237 : }
4238 :
4239 : BAT *
4240 31 : BATgroupquantile(BAT *b, BAT *g, BAT *e, BAT *s, int tp, double quantile,
4241 : bool skip_nils)
4242 : {
4243 31 : return doBATgroupquantile(b, g, e, s, tp, quantile,
4244 : skip_nils, false);
4245 : }
4246 :
4247 : BAT *
4248 3 : BATgroupmedian_avg(BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
4249 : {
4250 3 : return doBATgroupquantile(b, g, e, s, tp, 0.5, skip_nils, true);
4251 : }
4252 :
4253 : BAT *
4254 3 : BATgroupquantile_avg(BAT *b, BAT *g, BAT *e, BAT *s, int tp, double quantile,
4255 : bool skip_nils)
4256 : {
4257 3 : return doBATgroupquantile(b, g, e, s, tp, quantile,
4258 : skip_nils, true);
4259 : }
4260 :
4261 : /* ---------------------------------------------------------------------- */
4262 : /* standard deviation (both biased and non-biased) */
4263 :
4264 : #define AGGR_STDEV_SINGLE(TYPE) \
4265 : do { \
4266 : TYPE x; \
4267 : TIMEOUT_LOOP_IDX(i, cnt, qry_ctx) { \
4268 : x = ((const TYPE *) values)[i]; \
4269 : if (is_##TYPE##_nil(x)) \
4270 : continue; \
4271 : n++; \
4272 : delta = (dbl) x - mean; \
4273 : mean += delta / n; \
4274 : m2 += delta * ((dbl) x - mean); \
4275 : if (isinf(m2)) \
4276 : goto overflow; \
4277 : } \
4278 : TIMEOUT_CHECK(qry_ctx, \
4279 : TIMEOUT_HANDLER(dbl_nil, qry_ctx)); \
4280 : } while (0)
4281 :
4282 : static dbl
4283 27 : calcvariance(dbl *restrict avgp, const void *restrict values, BUN cnt, int tp, bool issample)
4284 : {
4285 27 : BUN n = 0, i;
4286 27 : dbl mean = 0;
4287 27 : dbl m2 = 0;
4288 27 : dbl delta;
4289 :
4290 27 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
4291 :
4292 27 : switch (tp) {
4293 : case TYPE_bte:
4294 18 : AGGR_STDEV_SINGLE(bte);
4295 : break;
4296 : case TYPE_sht:
4297 18 : AGGR_STDEV_SINGLE(sht);
4298 : break;
4299 : case TYPE_int:
4300 48 : AGGR_STDEV_SINGLE(int);
4301 : break;
4302 : case TYPE_lng:
4303 36 : AGGR_STDEV_SINGLE(lng);
4304 : break;
4305 : #ifdef HAVE_HGE
4306 : case TYPE_hge:
4307 0 : AGGR_STDEV_SINGLE(hge);
4308 : break;
4309 : #endif
4310 : case TYPE_flt:
4311 0 : AGGR_STDEV_SINGLE(flt);
4312 : break;
4313 : case TYPE_dbl:
4314 39 : AGGR_STDEV_SINGLE(dbl);
4315 : break;
4316 0 : default:
4317 0 : GDKerror("type (%s) not supported.\n", ATOMname(tp));
4318 0 : return dbl_nil;
4319 : }
4320 24 : if (n <= (BUN) issample) {
4321 7 : if (avgp)
4322 0 : *avgp = dbl_nil;
4323 7 : return dbl_nil;
4324 : }
4325 17 : if (avgp)
4326 0 : *avgp = mean;
4327 17 : return m2 / (n - issample);
4328 2 : overflow:
4329 2 : GDKerror("22003!overflow in calculation.\n");
4330 2 : return dbl_nil;
4331 : }
4332 :
4333 : dbl
4334 13 : BATcalcstdev_population(dbl *avgp, BAT *b)
4335 : {
4336 13 : lng t0 = 0;
4337 :
4338 13 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4339 13 : BATiter bi = bat_iterator(b);
4340 13 : dbl v = calcvariance(avgp, bi.base, bi.count, bi.type, false);
4341 13 : bat_iterator_end(&bi);
4342 13 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT " (" LLFMT " usec)\n",
4343 : ALGOBATPAR(b), GDKusec() - t0);
4344 13 : return is_dbl_nil(v) ? dbl_nil : sqrt(v);
4345 : }
4346 :
4347 : dbl
4348 7 : BATcalcstdev_sample(dbl *avgp, BAT *b)
4349 : {
4350 7 : lng t0 = 0;
4351 :
4352 7 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4353 7 : BATiter bi = bat_iterator(b);
4354 7 : dbl v = calcvariance(avgp, bi.base, bi.count, bi.type, true);
4355 7 : bat_iterator_end(&bi);
4356 7 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT " (" LLFMT " usec)\n",
4357 : ALGOBATPAR(b), GDKusec() - t0);
4358 7 : return is_dbl_nil(v) ? dbl_nil : sqrt(v);
4359 : }
4360 :
4361 : dbl
4362 5 : BATcalcvariance_population(dbl *avgp, BAT *b)
4363 : {
4364 5 : lng t0 = 0;
4365 :
4366 5 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4367 5 : BATiter bi = bat_iterator(b);
4368 5 : dbl v = calcvariance(avgp, bi.base, bi.count, bi.type, false);
4369 5 : bat_iterator_end(&bi);
4370 5 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT " (" LLFMT " usec)\n",
4371 : ALGOBATPAR(b), GDKusec() - t0);
4372 5 : return v;
4373 : }
4374 :
4375 : dbl
4376 2 : BATcalcvariance_sample(dbl *avgp, BAT *b)
4377 : {
4378 2 : lng t0 = 0;
4379 :
4380 2 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4381 2 : BATiter bi = bat_iterator(b);
4382 2 : dbl v = calcvariance(avgp, bi.base, bi.count, bi.type, true);
4383 2 : bat_iterator_end(&bi);
4384 2 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT " (" LLFMT " usec)\n",
4385 : ALGOBATPAR(b), GDKusec() - t0);
4386 2 : return v;
4387 : }
4388 :
4389 : #define AGGR_COVARIANCE_SINGLE(TYPE) \
4390 : do { \
4391 : TYPE x, y; \
4392 : TIMEOUT_LOOP_IDX(i, cnt, qry_ctx) { \
4393 : x = ((const TYPE *) v1)[i]; \
4394 : y = ((const TYPE *) v2)[i]; \
4395 : if (is_##TYPE##_nil(x) || is_##TYPE##_nil(y)) \
4396 : continue; \
4397 : n++; \
4398 : delta1 = (dbl) x - mean1; \
4399 : mean1 += delta1 / n; \
4400 : delta2 = (dbl) y - mean2; \
4401 : mean2 += delta2 / n; \
4402 : m2 += delta1 * ((dbl) y - mean2); \
4403 : if (isinf(m2)) \
4404 : goto overflow; \
4405 : } \
4406 : TIMEOUT_CHECK(qry_ctx, \
4407 : TIMEOUT_HANDLER(dbl_nil, qry_ctx)); \
4408 : } while (0)
4409 :
4410 : static dbl
4411 14 : calccovariance(const void *v1, const void *v2, BUN cnt, int tp, bool issample)
4412 : {
4413 14 : BUN n = 0, i;
4414 14 : dbl mean1 = 0, mean2 = 0, m2 = 0, delta1, delta2;
4415 :
4416 14 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
4417 :
4418 :
4419 14 : switch (tp) {
4420 : case TYPE_bte:
4421 0 : AGGR_COVARIANCE_SINGLE(bte);
4422 : break;
4423 : case TYPE_sht:
4424 0 : AGGR_COVARIANCE_SINGLE(sht);
4425 : break;
4426 : case TYPE_int:
4427 111 : AGGR_COVARIANCE_SINGLE(int);
4428 : break;
4429 : case TYPE_lng:
4430 0 : AGGR_COVARIANCE_SINGLE(lng);
4431 : break;
4432 : #ifdef HAVE_HGE
4433 : case TYPE_hge:
4434 0 : AGGR_COVARIANCE_SINGLE(hge);
4435 : break;
4436 : #endif
4437 : case TYPE_flt:
4438 0 : AGGR_COVARIANCE_SINGLE(flt);
4439 : break;
4440 : case TYPE_dbl:
4441 18 : AGGR_COVARIANCE_SINGLE(dbl);
4442 : break;
4443 0 : default:
4444 0 : GDKerror("type (%s) not supported.\n", ATOMname(tp));
4445 0 : return dbl_nil;
4446 : }
4447 13 : if (n <= (BUN) issample)
4448 1 : return dbl_nil;
4449 12 : return m2 / (n - issample);
4450 1 : overflow:
4451 1 : GDKerror("22003!overflow in calculation.\n");
4452 1 : return dbl_nil;
4453 : }
4454 :
4455 : dbl
4456 9 : BATcalccovariance_population(BAT *b1, BAT *b2)
4457 : {
4458 9 : lng t0 = 0;
4459 :
4460 9 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4461 9 : BATiter b1i = bat_iterator(b1), b2i = bat_iterator(b2);
4462 9 : dbl v = calccovariance(b1i.base, b2i.base, b1i.count, b1i.type, false);
4463 9 : bat_iterator_end(&b1i);
4464 9 : bat_iterator_end(&b2i);
4465 9 : TRC_DEBUG(ALGO, "b1=" ALGOBATFMT ",b2=" ALGOBATFMT " (" LLFMT " usec)\n",
4466 : ALGOBATPAR(b1), ALGOBATPAR(b2), GDKusec() - t0);
4467 9 : return v;
4468 : }
4469 :
4470 : dbl
4471 5 : BATcalccovariance_sample(BAT *b1, BAT *b2)
4472 : {
4473 5 : lng t0 = 0;
4474 :
4475 5 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4476 5 : BATiter b1i = bat_iterator(b1), b2i = bat_iterator(b2);
4477 5 : dbl v = calccovariance(b1i.base, b2i.base, b1i.count, b1i.type, true);
4478 5 : bat_iterator_end(&b1i);
4479 5 : bat_iterator_end(&b2i);
4480 5 : TRC_DEBUG(ALGO, "b1=" ALGOBATFMT ",b2=" ALGOBATFMT " (" LLFMT " usec)\n",
4481 : ALGOBATPAR(b1), ALGOBATPAR(b2), GDKusec() - t0);
4482 5 : return v;
4483 : }
4484 :
4485 : #define AGGR_CORRELATION_SINGLE(TYPE) \
4486 : do { \
4487 : TYPE x, y; \
4488 : TIMEOUT_LOOP_IDX(i, cnt, qry_ctx) { \
4489 : x = ((const TYPE *) v1)[i]; \
4490 : y = ((const TYPE *) v2)[i]; \
4491 : if (is_##TYPE##_nil(x) || is_##TYPE##_nil(y)) \
4492 : continue; \
4493 : n++; \
4494 : delta1 = (dbl) x - mean1; \
4495 : mean1 += delta1 / n; \
4496 : delta2 = (dbl) y - mean2; \
4497 : mean2 += delta2 / n; \
4498 : aux = (dbl) y - mean2; \
4499 : up += delta1 * aux; \
4500 : down1 += delta1 * ((dbl) x - mean1); \
4501 : down2 += delta2 * aux; \
4502 : if (isinf(up) || isinf(down1) || isinf(down2)) \
4503 : goto overflow; \
4504 : } \
4505 : TIMEOUT_CHECK(qry_ctx, \
4506 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
4507 : } while (0)
4508 :
4509 : dbl
4510 19 : BATcalccorrelation(BAT *b1, BAT *b2)
4511 : {
4512 19 : BUN n = 0, i, cnt = BATcount(b1);
4513 19 : dbl mean1 = 0, mean2 = 0, up = 0, down1 = 0, down2 = 0, delta1, delta2, aux;
4514 19 : BATiter b1i = bat_iterator(b1), b2i = bat_iterator(b2);
4515 19 : const void *v1 = b1i.base, *v2 = b2i.base;
4516 19 : int tp = b1i.type;
4517 19 : lng t0 = 0;
4518 :
4519 19 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
4520 :
4521 19 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4522 :
4523 19 : switch (tp) {
4524 : case TYPE_bte:
4525 11 : AGGR_CORRELATION_SINGLE(bte);
4526 : break;
4527 : case TYPE_sht:
4528 0 : AGGR_CORRELATION_SINGLE(sht);
4529 : break;
4530 : case TYPE_int:
4531 95 : AGGR_CORRELATION_SINGLE(int);
4532 : break;
4533 : case TYPE_lng:
4534 0 : AGGR_CORRELATION_SINGLE(lng);
4535 : break;
4536 : #ifdef HAVE_HGE
4537 : case TYPE_hge:
4538 0 : AGGR_CORRELATION_SINGLE(hge);
4539 : break;
4540 : #endif
4541 : case TYPE_flt:
4542 0 : AGGR_CORRELATION_SINGLE(flt);
4543 : break;
4544 : case TYPE_dbl:
4545 17 : AGGR_CORRELATION_SINGLE(dbl);
4546 : break;
4547 0 : default:
4548 0 : GDKerror("type (%s) not supported.\n", ATOMname(tp));
4549 0 : goto bailout;
4550 : }
4551 18 : bat_iterator_end(&b1i);
4552 18 : bat_iterator_end(&b2i);
4553 18 : if (n != 0 && down1 != 0 && down2 != 0)
4554 9 : aux = (up / n) / (sqrt(down1 / n) * sqrt(down2 / n));
4555 : else
4556 9 : aux = dbl_nil;
4557 18 : TRC_DEBUG(ALGO, "b1=" ALGOBATFMT ",b2=" ALGOBATFMT " (" LLFMT " usec)\n",
4558 : ALGOBATPAR(b1), ALGOBATPAR(b2), GDKusec() - t0);
4559 : return aux;
4560 1 : overflow:
4561 1 : GDKerror("22003!overflow in calculation.\n");
4562 1 : bailout:
4563 1 : bat_iterator_end(&b1i);
4564 1 : bat_iterator_end(&b2i);
4565 1 : return dbl_nil;
4566 : }
4567 :
4568 : #define AGGR_STDEV(TYPE) \
4569 : do { \
4570 : const TYPE *restrict vals = (const TYPE *) bi.base; \
4571 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
4572 : i = canditer_next(&ci) - b->hseqbase; \
4573 : if (gids == NULL || \
4574 : (gids[i] >= min && gids[i] <= max)) { \
4575 : if (gids) \
4576 : gid = gids[i] - min; \
4577 : else \
4578 : gid = (oid) i; \
4579 : if (is_##TYPE##_nil(vals[i])) { \
4580 : if (!skip_nils) \
4581 : cnts[gid] = BUN_NONE; \
4582 : } else if (cnts[gid] != BUN_NONE) { \
4583 : cnts[gid]++; \
4584 : delta[gid] = (dbl) vals[i] - mean[gid]; \
4585 : mean[gid] += delta[gid] / cnts[gid]; \
4586 : m2[gid] += delta[gid] * ((dbl) vals[i] - mean[gid]); \
4587 : } \
4588 : } \
4589 : } \
4590 : TIMEOUT_CHECK(qry_ctx, \
4591 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
4592 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) { \
4593 : if (cnts[i] == 0 || cnts[i] == BUN_NONE) { \
4594 : dbls[i] = dbl_nil; \
4595 : mean[i] = dbl_nil; \
4596 : nils++; \
4597 : } else if (cnts[i] == 1) { \
4598 : dbls[i] = issample ? dbl_nil : 0; \
4599 : nils2++; \
4600 : } else if (isinf(m2[i])) { \
4601 : goto overflow; \
4602 : } else if (variance) { \
4603 : dbls[i] = m2[i] / (cnts[i] - issample); \
4604 : } else { \
4605 : dbls[i] = sqrt(m2[i] / (cnts[i] - issample)); \
4606 : } \
4607 : } \
4608 : } while (0)
4609 :
4610 : /* Calculate group standard deviation (population (i.e. biased) or
4611 : * sample (i.e. non-biased)) with optional candidates list.
4612 : *
4613 : * Note that this helper function is prepared to return two BATs: one
4614 : * (as return value) with the standard deviation per group, and one
4615 : * (as return argument) with the average per group. This isn't
4616 : * currently used since it doesn't fit into the mold of grouped
4617 : * aggregates. */
4618 : static BAT *
4619 17 : dogroupstdev(BAT **avgb, BAT *b, BAT *g, BAT *e, BAT *s, int tp,
4620 : bool skip_nils, bool issample, bool variance, const char *func)
4621 : {
4622 17 : const oid *restrict gids;
4623 17 : oid gid;
4624 17 : oid min, max;
4625 17 : BUN i, ngrp;
4626 17 : BUN nils = 0, nils2 = 0;
4627 17 : BUN *restrict cnts = NULL;
4628 17 : dbl *restrict dbls, *restrict mean, *restrict delta, *restrict m2;
4629 17 : BAT *bn = NULL, *an = NULL;
4630 17 : struct canditer ci;
4631 17 : const char *err;
4632 17 : lng t0 = 0;
4633 17 : BATiter bi = {0};
4634 :
4635 17 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
4636 :
4637 17 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4638 :
4639 17 : assert(tp == TYPE_dbl);
4640 17 : (void) tp; /* compatibility (with other BATgroup*
4641 : * functions) argument */
4642 :
4643 17 : if ((err = BATgroupaggrinit(b, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
4644 0 : GDKerror("%s: %s\n", func, err);
4645 0 : return NULL;
4646 : }
4647 17 : if (g == NULL) {
4648 0 : GDKerror("%s: b and g must be aligned\n", func);
4649 0 : return NULL;
4650 : }
4651 :
4652 17 : if (BATcount(b) == 0 || ngrp == 0) {
4653 : /* trivial: no products, so return bat aligned with g
4654 : * with nil in the tail */
4655 2 : bn = BATconstant(ngrp == 0 ? 0 : min, TYPE_dbl, &dbl_nil, ngrp, TRANSIENT);
4656 2 : goto doreturn;
4657 : }
4658 :
4659 15 : if ((e == NULL ||
4660 15 : (BATcount(e) == ci.ncand && e->hseqbase == ci.hseq)) &&
4661 7 : (BATtdense(g) || (g->tkey && g->tnonil)) &&
4662 4 : (issample || b->tnonil)) {
4663 : /* trivial: singleton groups, so all results are equal
4664 : * to zero (population) or nil (sample) */
4665 3 : dbl v = issample ? dbl_nil : 0;
4666 6 : bn = BATconstant(ngrp == 0 ? 0 : min, TYPE_dbl, &v, ngrp, TRANSIENT);
4667 6 : goto doreturn;
4668 : }
4669 :
4670 9 : delta = GDKmalloc(ngrp * sizeof(dbl));
4671 9 : m2 = GDKmalloc(ngrp * sizeof(dbl));
4672 9 : cnts = GDKzalloc(ngrp * sizeof(BUN));
4673 9 : if (avgb) {
4674 0 : an = COLnew(0, TYPE_dbl, ngrp, TRANSIENT);
4675 0 : *avgb = an;
4676 0 : if (an == NULL) {
4677 0 : mean = NULL;
4678 0 : goto alloc_fail;
4679 : }
4680 0 : mean = (dbl *) Tloc(an, 0);
4681 : } else {
4682 9 : mean = GDKmalloc(ngrp * sizeof(dbl));
4683 : }
4684 9 : if (mean == NULL || delta == NULL || m2 == NULL || cnts == NULL)
4685 0 : goto alloc_fail;
4686 :
4687 9 : bn = COLnew(min, TYPE_dbl, ngrp, TRANSIENT);
4688 9 : if (bn == NULL)
4689 0 : goto alloc_fail;
4690 9 : dbls = (dbl *) Tloc(bn, 0);
4691 :
4692 1080116 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
4693 1080034 : mean[i] = 0;
4694 1080034 : delta[i] = 0;
4695 1080034 : m2[i] = 0;
4696 : }
4697 :
4698 9 : bi = bat_iterator(b);
4699 9 : if (BATtdense(g))
4700 : gids = NULL;
4701 : else
4702 8 : gids = (const oid *) Tloc(g, 0);
4703 :
4704 9 : switch (b->ttype) {
4705 0 : case TYPE_bte:
4706 0 : AGGR_STDEV(bte);
4707 : break;
4708 0 : case TYPE_sht:
4709 0 : AGGR_STDEV(sht);
4710 : break;
4711 4 : case TYPE_int:
4712 5760376 : AGGR_STDEV(int);
4713 : break;
4714 0 : case TYPE_lng:
4715 0 : AGGR_STDEV(lng);
4716 : break;
4717 : #ifdef HAVE_HGE
4718 0 : case TYPE_hge:
4719 0 : AGGR_STDEV(hge);
4720 : break;
4721 : #endif
4722 0 : case TYPE_flt:
4723 0 : AGGR_STDEV(flt);
4724 : break;
4725 5 : case TYPE_dbl:
4726 88 : AGGR_STDEV(dbl);
4727 : break;
4728 0 : default:
4729 0 : GDKerror("%s: type (%s) not supported.\n",
4730 : func, ATOMname(b->ttype));
4731 0 : goto bailout;
4732 : }
4733 7 : bat_iterator_end(&bi);
4734 7 : if (an) {
4735 0 : BATsetcount(an, ngrp);
4736 0 : an->tkey = ngrp <= 1;
4737 0 : an->tsorted = ngrp <= 1;
4738 0 : an->trevsorted = ngrp <= 1;
4739 0 : an->tnil = nils != 0;
4740 0 : an->tnonil = nils == 0;
4741 : } else {
4742 7 : GDKfree(mean);
4743 : }
4744 7 : if (issample)
4745 3 : nils += nils2;
4746 7 : GDKfree(delta);
4747 7 : GDKfree(m2);
4748 7 : GDKfree(cnts);
4749 7 : BATsetcount(bn, ngrp);
4750 7 : bn->tkey = ngrp <= 1;
4751 7 : bn->tsorted = ngrp <= 1;
4752 7 : bn->trevsorted = ngrp <= 1;
4753 7 : bn->tnil = nils != 0;
4754 7 : bn->tnonil = nils == 0;
4755 15 : doreturn:
4756 15 : TRC_DEBUG(ALGO, "b=" ALGOBATFMT ",g=" ALGOBATFMT ",e=" ALGOOPTBATFMT
4757 : ",s=" ALGOOPTBATFMT
4758 : ",skip_nils=%s,issample=%s,variance=%s -> " ALGOOPTBATFMT
4759 : ",avgb=" ALGOOPTBATFMT " (%s -- " LLFMT " usec)\n",
4760 : ALGOBATPAR(b), ALGOBATPAR(g), ALGOOPTBATPAR(e),
4761 : ALGOOPTBATPAR(s),
4762 : skip_nils ? "true" : "false",
4763 : issample ? "true" : "false",
4764 : variance ? "true" : "false",
4765 : ALGOOPTBATPAR(bn), ALGOOPTBATPAR(an),
4766 : func, GDKusec() - t0);
4767 : return bn;
4768 2 : overflow:
4769 2 : GDKerror("22003!overflow in calculation.\n");
4770 2 : bailout:
4771 2 : bat_iterator_end(&bi);
4772 2 : alloc_fail:
4773 2 : if (an)
4774 0 : BBPreclaim(an);
4775 : else
4776 2 : GDKfree(mean);
4777 2 : BBPreclaim(bn);
4778 2 : GDKfree(delta);
4779 2 : GDKfree(m2);
4780 2 : GDKfree(cnts);
4781 2 : return NULL;
4782 : }
4783 :
4784 : BAT *
4785 7 : BATgroupstdev_sample(BAT *b, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
4786 : {
4787 7 : return dogroupstdev(NULL, b, g, e, s, tp, skip_nils, true, false,
4788 : __func__);
4789 : }
4790 :
4791 : BAT *
4792 5 : BATgroupstdev_population(BAT *b, BAT *g, BAT *e, BAT *s, int tp,
4793 : bool skip_nils)
4794 : {
4795 5 : return dogroupstdev(NULL, b, g, e, s, tp, skip_nils, false, false,
4796 : __func__);
4797 : }
4798 :
4799 : BAT *
4800 1 : BATgroupvariance_sample(BAT *b, BAT *g, BAT *e, BAT *s, int tp,
4801 : bool skip_nils)
4802 : {
4803 1 : return dogroupstdev(NULL, b, g, e, s, tp, skip_nils, true, true,
4804 : __func__);
4805 : }
4806 :
4807 : BAT *
4808 4 : BATgroupvariance_population(BAT *b, BAT *g, BAT *e, BAT *s, int tp,
4809 : bool skip_nils)
4810 : {
4811 4 : return dogroupstdev(NULL, b, g, e, s, tp, skip_nils, false, true,
4812 : __func__);
4813 : }
4814 :
4815 : #define AGGR_COVARIANCE(TYPE) \
4816 : do { \
4817 : const TYPE *vals1 = (const TYPE *) b1i.base; \
4818 : const TYPE *vals2 = (const TYPE *) b2i.base; \
4819 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
4820 : i = canditer_next(&ci) - b1->hseqbase; \
4821 : if (gids == NULL || \
4822 : (gids[i] >= min && gids[i] <= max)) { \
4823 : if (gids) \
4824 : gid = gids[i] - min; \
4825 : else \
4826 : gid = (oid) i; \
4827 : if (is_##TYPE##_nil(vals1[i]) || is_##TYPE##_nil(vals2[i])) { \
4828 : if (!skip_nils) \
4829 : cnts[gid] = BUN_NONE; \
4830 : } else if (cnts[gid] != BUN_NONE) { \
4831 : cnts[gid]++; \
4832 : delta1[gid] = (dbl) vals1[i] - mean1[gid]; \
4833 : mean1[gid] += delta1[gid] / cnts[gid]; \
4834 : delta2[gid] = (dbl) vals2[i] - mean2[gid]; \
4835 : mean2[gid] += delta2[gid] / cnts[gid]; \
4836 : m2[gid] += delta1[gid] * ((dbl) vals2[i] - mean2[gid]); \
4837 : } \
4838 : } \
4839 : } \
4840 : TIMEOUT_CHECK(qry_ctx, \
4841 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
4842 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) { \
4843 : if (cnts[i] == 0 || cnts[i] == BUN_NONE) { \
4844 : dbls[i] = dbl_nil; \
4845 : nils++; \
4846 : } else if (cnts[i] == 1) { \
4847 : dbls[i] = issample ? dbl_nil : 0; \
4848 : nils2++; \
4849 : } else if (isinf(m2[i])) { \
4850 : goto overflow; \
4851 : } else { \
4852 : dbls[i] = m2[i] / (cnts[i] - issample); \
4853 : } \
4854 : } \
4855 : } while (0)
4856 :
4857 : static BAT *
4858 59 : dogroupcovariance(BAT *b1, BAT *b2, BAT *g, BAT *e, BAT *s, int tp,
4859 : bool skip_nils, bool issample, const char *func)
4860 : {
4861 59 : const oid *restrict gids;
4862 59 : oid gid, min, max;
4863 59 : BUN i, ngrp, nils = 0, nils2 = 0;
4864 59 : BUN *restrict cnts = NULL;
4865 59 : dbl *restrict dbls, *restrict mean1, *restrict mean2, *restrict delta1, *restrict delta2, *restrict m2;
4866 59 : BAT *bn = NULL;
4867 59 : struct canditer ci;
4868 59 : const char *err;
4869 59 : lng t0 = 0;
4870 59 : BATiter b1i = {0}, b2i = {0};
4871 :
4872 59 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
4873 :
4874 :
4875 59 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
4876 :
4877 59 : assert(tp == TYPE_dbl && BATcount(b1) == BATcount(b2) && b1->ttype == b2->ttype && BATtdense(b1) == BATtdense(b2));
4878 59 : (void) tp;
4879 :
4880 59 : if ((err = BATgroupaggrinit(b1, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
4881 0 : GDKerror("%s: %s\n", func, err);
4882 0 : return NULL;
4883 : }
4884 59 : if (g == NULL) {
4885 0 : GDKerror("%s: b1, b2 and g must be aligned\n", func);
4886 0 : return NULL;
4887 : }
4888 :
4889 59 : if (BATcount(b1) == 0 || ngrp == 0) {
4890 0 : bn = BATconstant(ngrp == 0 ? 0 : min, TYPE_dbl, &dbl_nil, ngrp, TRANSIENT);
4891 0 : goto doreturn;
4892 : }
4893 :
4894 59 : if ((e == NULL ||
4895 60 : (BATcount(e) == BATcount(b1) && (e->hseqbase == b1->hseqbase || e->hseqbase == b2->hseqbase))) &&
4896 19 : (BATtdense(g) || (g->tkey && g->tnonil)) &&
4897 9 : (issample || (b1->tnonil && b2->tnonil))) {
4898 : /* trivial: singleton groups, so all results are equal
4899 : * to zero (population) or nil (sample) */
4900 10 : dbl v = issample ? dbl_nil : 0;
4901 13 : bn = BATconstant(ngrp == 0 ? 0 : min, TYPE_dbl, &v, ngrp, TRANSIENT);
4902 13 : goto doreturn;
4903 : }
4904 :
4905 46 : delta1 = GDKmalloc(ngrp * sizeof(dbl));
4906 46 : delta2 = GDKmalloc(ngrp * sizeof(dbl));
4907 47 : m2 = GDKmalloc(ngrp * sizeof(dbl));
4908 47 : cnts = GDKzalloc(ngrp * sizeof(BUN));
4909 46 : mean1 = GDKmalloc(ngrp * sizeof(dbl));
4910 47 : mean2 = GDKmalloc(ngrp * sizeof(dbl));
4911 :
4912 47 : if (mean1 == NULL || mean2 == NULL || delta1 == NULL || delta2 == NULL || m2 == NULL || cnts == NULL)
4913 0 : goto alloc_fail;
4914 :
4915 395 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
4916 302 : m2[i] = 0;
4917 302 : mean1[i] = 0;
4918 302 : mean2[i] = 0;
4919 : }
4920 :
4921 47 : bn = COLnew(min, TYPE_dbl, ngrp, TRANSIENT);
4922 47 : if (bn == NULL)
4923 0 : goto alloc_fail;
4924 47 : dbls = (dbl *) Tloc(bn, 0);
4925 :
4926 47 : if (!g || BATtdense(g))
4927 : gids = NULL;
4928 : else
4929 47 : gids = (const oid *) Tloc(g, 0);
4930 :
4931 47 : b1i = bat_iterator(b1);
4932 47 : b2i = bat_iterator(b2);
4933 46 : switch (b1->ttype) {
4934 9 : case TYPE_bte:
4935 184 : AGGR_COVARIANCE(bte);
4936 : break;
4937 0 : case TYPE_sht:
4938 0 : AGGR_COVARIANCE(sht);
4939 : break;
4940 37 : case TYPE_int:
4941 758 : AGGR_COVARIANCE(int);
4942 : break;
4943 0 : case TYPE_lng:
4944 0 : AGGR_COVARIANCE(lng);
4945 : break;
4946 : #ifdef HAVE_HGE
4947 0 : case TYPE_hge:
4948 0 : AGGR_COVARIANCE(hge);
4949 : break;
4950 : #endif
4951 0 : case TYPE_flt:
4952 0 : AGGR_COVARIANCE(flt);
4953 : break;
4954 0 : case TYPE_dbl:
4955 0 : AGGR_COVARIANCE(dbl);
4956 : break;
4957 0 : default:
4958 0 : GDKerror("%s: type (%s) not supported.\n", func, ATOMname(b1->ttype));
4959 0 : goto bailout;
4960 : }
4961 47 : bat_iterator_end(&b1i);
4962 45 : bat_iterator_end(&b2i);
4963 47 : GDKfree(mean1);
4964 47 : GDKfree(mean2);
4965 :
4966 46 : if (issample)
4967 20 : nils += nils2;
4968 46 : GDKfree(delta1);
4969 47 : GDKfree(delta2);
4970 47 : GDKfree(m2);
4971 47 : GDKfree(cnts);
4972 47 : BATsetcount(bn, ngrp);
4973 47 : bn->tkey = ngrp <= 1;
4974 47 : bn->tsorted = ngrp <= 1;
4975 47 : bn->trevsorted = ngrp <= 1;
4976 47 : bn->tnil = nils != 0;
4977 47 : bn->tnonil = nils == 0;
4978 60 : doreturn:
4979 60 : TRC_DEBUG(ALGO, "b1=" ALGOBATFMT ",b2=" ALGOBATFMT ",g=" ALGOBATFMT
4980 : ",e=" ALGOOPTBATFMT ",s=" ALGOOPTBATFMT
4981 : ",skip_nils=%s,issample=%s -> " ALGOOPTBATFMT
4982 : " (%s -- " LLFMT " usec)\n",
4983 : ALGOBATPAR(b1), ALGOBATPAR(b2), ALGOBATPAR(g),
4984 : ALGOOPTBATPAR(e), ALGOOPTBATPAR(s),
4985 : skip_nils ? "true" : "false",
4986 : issample ? "true" : "false",
4987 : ALGOOPTBATPAR(bn),
4988 : func, GDKusec() - t0);
4989 : return bn;
4990 0 : overflow:
4991 0 : GDKerror("22003!overflow in calculation.\n");
4992 0 : bailout:
4993 0 : bat_iterator_end(&b1i);
4994 0 : bat_iterator_end(&b2i);
4995 0 : alloc_fail:
4996 0 : BBPreclaim(bn);
4997 0 : GDKfree(mean1);
4998 0 : GDKfree(mean2);
4999 0 : GDKfree(delta1);
5000 0 : GDKfree(delta2);
5001 0 : GDKfree(m2);
5002 0 : GDKfree(cnts);
5003 0 : return NULL;
5004 : }
5005 :
5006 : BAT *
5007 30 : BATgroupcovariance_sample(BAT *b1, BAT *b2, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
5008 : {
5009 30 : return dogroupcovariance(b1, b2, g, e, s, tp, skip_nils, true,
5010 : __func__);
5011 : }
5012 :
5013 : BAT *
5014 30 : BATgroupcovariance_population(BAT *b1, BAT *b2, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
5015 : {
5016 30 : return dogroupcovariance(b1, b2, g, e, s, tp, skip_nils, false,
5017 : __func__);
5018 : }
5019 :
5020 : #define AGGR_CORRELATION(TYPE) \
5021 : do { \
5022 : const TYPE *vals1 = (const TYPE *) b1i.base; \
5023 : const TYPE *vals2 = (const TYPE *) b2i.base; \
5024 : TIMEOUT_LOOP(ci.ncand, qry_ctx) { \
5025 : i = canditer_next(&ci) - b1->hseqbase; \
5026 : if (gids == NULL || \
5027 : (gids[i] >= min && gids[i] <= max)) { \
5028 : if (gids) \
5029 : gid = gids[i] - min; \
5030 : else \
5031 : gid = (oid) i; \
5032 : if (is_##TYPE##_nil(vals1[i]) || is_##TYPE##_nil(vals2[i])) { \
5033 : if (!skip_nils) \
5034 : cnts[gid] = BUN_NONE; \
5035 : } else if (cnts[gid] != BUN_NONE) { \
5036 : cnts[gid]++; \
5037 : delta1[gid] = (dbl) vals1[i] - mean1[gid]; \
5038 : mean1[gid] += delta1[gid] / cnts[gid]; \
5039 : delta2[gid] = (dbl) vals2[i] - mean2[gid]; \
5040 : mean2[gid] += delta2[gid] / cnts[gid]; \
5041 : aux = (dbl) vals2[i] - mean2[gid]; \
5042 : up[gid] += delta1[gid] * aux; \
5043 : down1[gid] += delta1[gid] * ((dbl) vals1[i] - mean1[gid]); \
5044 : down2[gid] += delta2[gid] * aux; \
5045 : } \
5046 : } \
5047 : } \
5048 : TIMEOUT_CHECK(qry_ctx, \
5049 : GOTO_LABEL_TIMEOUT_HANDLER(bailout, qry_ctx)); \
5050 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) { \
5051 : if (cnts[i] <= 1 || cnts[i] == BUN_NONE || down1[i] == 0 || down2[i] == 0) { \
5052 : dbls[i] = dbl_nil; \
5053 : nils++; \
5054 : } else if (isinf(up[i]) || isinf(down1[i]) || isinf(down2[i])) { \
5055 : goto overflow; \
5056 : } else { \
5057 : dbls[i] = (up[i] / cnts[i]) / (sqrt(down1[i] / cnts[i]) * sqrt(down2[i] / cnts[i])); \
5058 : assert(!is_dbl_nil(dbls[i])); \
5059 : } \
5060 : } \
5061 : } while (0)
5062 :
5063 : BAT *
5064 49 : BATgroupcorrelation(BAT *b1, BAT *b2, BAT *g, BAT *e, BAT *s, int tp, bool skip_nils)
5065 : {
5066 49 : const oid *restrict gids;
5067 49 : oid gid, min, max;
5068 49 : BUN i, ngrp, nils = 0;
5069 49 : BUN *restrict cnts = NULL;
5070 49 : dbl *restrict dbls, *restrict mean1, *restrict mean2, *restrict delta1, *restrict delta2, *restrict up, *restrict down1, *restrict down2, aux;
5071 49 : BAT *bn = NULL;
5072 49 : struct canditer ci;
5073 49 : const char *err;
5074 49 : lng t0 = 0;
5075 49 : BATiter b1i = {0}, b2i = {0};
5076 :
5077 49 : QryCtx *qry_ctx = MT_thread_get_qry_ctx();
5078 :
5079 48 : TRC_DEBUG_IF(ALGO) t0 = GDKusec();
5080 :
5081 48 : assert(tp == TYPE_dbl && BATcount(b1) == BATcount(b2) && b1->ttype == b2->ttype && BATtdense(b1) == BATtdense(b2));
5082 48 : (void) tp;
5083 :
5084 48 : if ((err = BATgroupaggrinit(b1, g, e, s, &min, &max, &ngrp, &ci)) != NULL) {
5085 0 : GDKerror("%s\n", err);
5086 0 : return NULL;
5087 : }
5088 47 : if (g == NULL) {
5089 0 : GDKerror("b1, b2 and g must be aligned\n");
5090 0 : return NULL;
5091 : }
5092 :
5093 47 : if (BATcount(b1) == 0 || ngrp == 0) {
5094 1 : bn = BATconstant(ngrp == 0 ? 0 : min, TYPE_dbl, &dbl_nil, ngrp, TRANSIENT);
5095 1 : goto doreturn;
5096 : }
5097 :
5098 46 : if ((e == NULL ||
5099 46 : (BATcount(e) == BATcount(b1) && (e->hseqbase == b1->hseqbase || e->hseqbase == b2->hseqbase))) &&
5100 14 : (BATtdense(g) || (g->tkey && g->tnonil))) {
5101 14 : dbl v = dbl_nil;
5102 14 : bn = BATconstant(min, TYPE_dbl, &v, ngrp, TRANSIENT);
5103 13 : goto doreturn;
5104 : }
5105 :
5106 32 : delta1 = GDKmalloc(ngrp * sizeof(dbl));
5107 32 : delta2 = GDKmalloc(ngrp * sizeof(dbl));
5108 34 : up = GDKmalloc(ngrp * sizeof(dbl));
5109 34 : down1 = GDKmalloc(ngrp * sizeof(dbl));
5110 34 : down2 = GDKmalloc(ngrp * sizeof(dbl));
5111 34 : cnts = GDKzalloc(ngrp * sizeof(BUN));
5112 34 : mean1 = GDKmalloc(ngrp * sizeof(dbl));
5113 34 : mean2 = GDKmalloc(ngrp * sizeof(dbl));
5114 :
5115 33 : if (mean1 == NULL || mean2 == NULL || delta1 == NULL || delta2 == NULL || up == NULL || down1 == NULL || down2 == NULL || cnts == NULL)
5116 0 : goto alloc_fail;
5117 :
5118 253 : TIMEOUT_LOOP_IDX(i, ngrp, qry_ctx) {
5119 189 : up[i] = 0;
5120 189 : down1[i] = 0;
5121 189 : down2[i] = 0;
5122 189 : mean1[i] = 0;
5123 189 : mean2[i] = 0;
5124 : }
5125 :
5126 34 : bn = COLnew(min, TYPE_dbl, ngrp, TRANSIENT);
5127 33 : if (bn == NULL)
5128 0 : goto alloc_fail;
5129 33 : dbls = (dbl *) Tloc(bn, 0);
5130 :
5131 33 : if (!g || BATtdense(g))
5132 : gids = NULL;
5133 : else
5134 33 : gids = (const oid *) Tloc(g, 0);
5135 :
5136 33 : b1i = bat_iterator(b1);
5137 32 : b2i = bat_iterator(b2);
5138 32 : switch (b1->ttype) {
5139 4 : case TYPE_bte:
5140 80 : AGGR_CORRELATION(bte);
5141 : break;
5142 0 : case TYPE_sht:
5143 0 : AGGR_CORRELATION(sht);
5144 : break;
5145 27 : case TYPE_int:
5146 1219 : AGGR_CORRELATION(int);
5147 : break;
5148 0 : case TYPE_lng:
5149 0 : AGGR_CORRELATION(lng);
5150 : break;
5151 : #ifdef HAVE_HGE
5152 0 : case TYPE_hge:
5153 0 : AGGR_CORRELATION(hge);
5154 : break;
5155 : #endif
5156 0 : case TYPE_flt:
5157 0 : AGGR_CORRELATION(flt);
5158 : break;
5159 1 : case TYPE_dbl:
5160 4 : AGGR_CORRELATION(dbl);
5161 : break;
5162 0 : default:
5163 0 : GDKerror("type (%s) not supported.\n", ATOMname(b1->ttype));
5164 0 : goto bailout;
5165 : }
5166 33 : bat_iterator_end(&b1i);
5167 33 : bat_iterator_end(&b2i);
5168 33 : GDKfree(mean1);
5169 31 : GDKfree(mean2);
5170 33 : GDKfree(delta1);
5171 33 : GDKfree(delta2);
5172 33 : GDKfree(up);
5173 33 : GDKfree(down1);
5174 33 : GDKfree(down2);
5175 33 : GDKfree(cnts);
5176 33 : BATsetcount(bn, ngrp);
5177 33 : bn->tkey = ngrp <= 1;
5178 33 : bn->tsorted = ngrp <= 1;
5179 33 : bn->trevsorted = ngrp <= 1;
5180 33 : bn->tnil = nils != 0;
5181 33 : bn->tnonil = nils == 0;
5182 47 : doreturn:
5183 47 : TRC_DEBUG(ALGO, "b1=" ALGOBATFMT ",b2=" ALGOBATFMT ",g=" ALGOBATFMT
5184 : ",e=" ALGOOPTBATFMT ",s=" ALGOOPTBATFMT
5185 : ",skip_nils=%s -> " ALGOOPTBATFMT
5186 : " (" LLFMT " usec)\n",
5187 : ALGOBATPAR(b1), ALGOBATPAR(b2), ALGOBATPAR(g),
5188 : ALGOOPTBATPAR(e), ALGOOPTBATPAR(s),
5189 : skip_nils ? "true" : "false",
5190 : ALGOOPTBATPAR(bn),
5191 : GDKusec() - t0);
5192 : return bn;
5193 1 : overflow:
5194 1 : GDKerror("22003!overflow in calculation.\n");
5195 1 : bailout:
5196 1 : bat_iterator_end(&b1i);
5197 1 : bat_iterator_end(&b2i);
5198 1 : alloc_fail:
5199 1 : BBPreclaim(bn);
5200 1 : GDKfree(mean1);
5201 1 : GDKfree(mean2);
5202 1 : GDKfree(delta1);
5203 1 : GDKfree(delta2);
5204 1 : GDKfree(up);
5205 1 : GDKfree(down1);
5206 1 : GDKfree(down2);
5207 1 : GDKfree(cnts);
5208 1 : return NULL;
5209 : }
|