Fix build on 64bits.
[apps/pfixtools.git] / common / tst-trie.c
1 /******************************************************************************/
2 /*          pfixtools: a collection of postfix related tools                  */
3 /*          ~~~~~~~~~                                                         */
4 /*  ________________________________________________________________________  */
5 /*                                                                            */
6 /*  Redistribution and use in source and binary forms, with or without        */
7 /*  modification, are permitted provided that the following conditions        */
8 /*  are met:                                                                  */
9 /*                                                                            */
10 /*  1. Redistributions of source code must retain the above copyright         */
11 /*     notice, this list of conditions and the following disclaimer.          */
12 /*  2. Redistributions in binary form must reproduce the above copyright      */
13 /*     notice, this list of conditions and the following disclaimer in the    */
14 /*     documentation and/or other materials provided with the distribution.   */
15 /*  3. The names of its contributors may not be used to endorse or promote    */
16 /*     products derived from this software without specific prior written     */
17 /*     permission.                                                            */
18 /*                                                                            */
19 /*  THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND   */
20 /*  ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE     */
21 /*  IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR        */
22 /*  PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS    */
23 /*  BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR    */
24 /*  CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF      */
25 /*  SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS  */
26 /*  INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN   */
27 /*  CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)   */
28 /*  ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF    */
29 /*  THE POSSIBILITY OF SUCH DAMAGE.                                           */
30 /******************************************************************************/
31
32 /*
33  * Copyright © 2008 Florent Bruneau
34  */
35
36 #include <time.h>
37 #include <sys/time.h>
38 #include "common.h"
39 #include "str.h"
40 #include "trie.h"
41 #include "file.h"
42
43 static trie_t *create_trie_from_file(const char *file)
44 {
45     trie_t *db;
46     file_map_t map;
47     const char *p, *end;
48     char line[BUFSIZ];
49
50     if (!file_map_open(&map, file, false)) {
51         return NULL;
52     }
53     p   = map.map;
54     end = map.end;
55     while (end > p && end[-1] != '\n') {
56         --end;
57     }
58     if (end != map.end) {
59         warn("file %s miss a final \\n, ignoring last line", file);
60     }
61
62     db = trie_new();
63     while (p < end && p != NULL) {
64         const char *eol = (char *)memchr(p, '\n', end - p);
65         if (eol == NULL) {
66             eol = end;
67         }
68         if (eol - p > BUFSIZ) {
69             p = eol - BUFSIZ;
70         }
71         int i = 0;
72 #if 1
73         for (const char *s = eol - 1 ; s >= p ; --s) {
74             line[i++] = ascii_tolower(*s);
75         }
76 #else
77         memcpy(line, p, eol - p);
78         i = eol - p;
79 #endif
80         line[i] = '\0';
81         trie_insert(db, line);
82         p = eol + 1;
83     }
84     file_map_close(&map);
85     trie_compile(db, false);
86     return db;
87 }
88
89
90 __attribute__((used))
91 static void check_trie_with_file(const trie_t *db, const char *file)
92 {
93     file_map_t map;
94     const char *p, *end;
95     char line[BUFSIZ];
96
97     if (!file_map_open(&map, file, false)) {
98         return;
99     }
100     p   = map.map;
101     end = map.end;
102     while (end > p && end[-1] != '\n') {
103         --end;
104     }
105     if (end != map.end) {
106         warn("file %s miss a final \\n, ignoring last line", file);
107     }
108
109     while (p < end && p != NULL) {
110         const char *eol = (char *)memchr(p, '\n', end - p);
111         if (eol == NULL) {
112             eol = end;
113         }
114         if (eol - p > BUFSIZ) {
115             p = eol - BUFSIZ;
116         }
117         int i = 0;
118 #if 1
119         for (const char *s = eol - 1 ; s >= p ; --s) {
120             line[i++] = ascii_tolower(*s);
121         }
122 #else
123         memcpy(line, p, eol - p);
124         i = eol - p;
125 #endif
126         line[i] = '\0';
127         if (!trie_lookup(db, line)) {
128           warn("'%s' not found in the trie", line);
129         }
130         p = eol + 1;
131     }
132     file_map_close(&map);
133 }
134
135
136 static bool test_linear(const uint8_t *start, uint32_t len, uint8_t data) {
137     const uint8_t *end = start + len;
138     while (start < end) {
139         const uint8_t val = *start;
140         if (val == data) {
141             return true;
142         } else if (val > data) {
143             return false;
144         }
145         ++start;
146     }
147     return false;
148 }
149
150 static bool test_dicho(const uint8_t *start, uint32_t len, uint8_t data) {
151     const uint8_t *end = start + len;
152
153     while (start < end) {
154         const uint8_t *mid = start + ((end - start) >> 1);
155         const uint8_t val = *mid;
156
157         if (val == data) {
158             return true;
159         } else if (data < val) {
160             end = mid;
161         } else {
162             start = mid + 1;
163         }
164     }
165     return false;
166 }
167
168 static void test_lookup(void) {
169     bool set[64];
170     uint8_t data[64];
171
172     printf("size,dicho,linear\n");
173     for (int i = 1 ; i < 64 ; ++i) {
174         if (i > 32) {
175             int selected = 64;
176             memset(set, 1, 64 * sizeof(bool));
177             while (selected > i) {
178                 int val = rand() % 64;
179                 if (set[val]) {
180                     set[val] = false;
181                     --selected;
182                 }
183             }
184         } else {
185             int selected = 0;
186             memset(set, 0, 64 * sizeof(bool));
187             while (selected < i) {
188                 int val = rand() % 64;
189                 if (!set[val]) {
190                     set[val] = true;
191                     ++selected;
192                 }
193             }
194         }
195         int pos = 0;
196         for (int j = 0 ; j < 64 ; ++j) {
197             if (set[j]) {
198                 data[pos] = j;
199                 ++pos;
200             }
201         }
202
203         struct timeval start, end;
204         double diff_dicho, diff_linear;
205         const int iterations = 50000000;
206
207         gettimeofday(&start, NULL);
208         for (int k = 0 ; k < iterations ; ++k) {
209             for (int j = 0 ; j < 64 ; ++j) {
210                 test_dicho(data, i, j);
211             }
212         }
213         gettimeofday(&end, NULL);
214         diff_dicho = ((end.tv_sec - start.tv_sec) * 10.0)
215              + (double)(end.tv_usec - start.tv_usec) / 10e5;
216
217         gettimeofday(&start, NULL);
218         for (int k = 0 ; k < iterations ; ++k) {
219             for (int j = 0 ; j < 64 ; ++j) {
220                 test_linear(data, i, j);
221             }
222         }
223         gettimeofday(&end, NULL);
224         diff_linear = ((end.tv_sec - start.tv_sec) * 10.0)
225              + (double)(end.tv_usec - start.tv_usec) / 10e5;
226         printf("%d,%d,%d\n", i, (int)diff_dicho, (int)diff_linear);
227     }
228 }
229
230
231 int main(int argc, char *argv[])
232 {
233     test_lookup();
234
235     /* Trivial tests
236      */
237     trie_t *trie = trie_new();
238     trie_insert(trie, "abcde123456789");
239     trie_insert(trie, "abcde123654789");
240     trie_insert(trie, "abcdefghi");
241     trie_insert(trie, "coucou");
242     trie_insert(trie, "coucou chez vous");
243     trie_insert(trie, "debout !");
244     trie_compile(trie, false);
245     trie_inspect(trie, true);
246
247 #define ASSERT_TRUE(str)                            \
248     if (!trie_lookup(trie, str)) {                  \
249         printf("\"%s\" not found in trie\n", str);  \
250         return 1;                                   \
251     }
252 #define ASSERT_FALSE(str)                           \
253     if (trie_lookup(trie, str)) {                   \
254         printf("\"%s\" found in trie\n", str);      \
255         return 1;                                   \
256     }
257     ASSERT_FALSE("");
258     ASSERT_FALSE("coucou ");
259     ASSERT_FALSE("abcde123");
260     ASSERT_FALSE("abcde");
261     ASSERT_FALSE("coucou chez vous tous");
262     ASSERT_TRUE("abcde123456789");
263     ASSERT_TRUE("abcde123456789");
264     ASSERT_TRUE("abcde123654789");
265     ASSERT_TRUE("abcdefghi");
266     ASSERT_TRUE("coucou");
267     ASSERT_TRUE("coucou chez vous");
268     ASSERT_TRUE("debout !");
269
270     trie_delete(&trie);
271
272     /* Perf test
273      */
274     if (argc > 1) {
275         trie = create_trie_from_file(argv[1]);
276         trie_inspect(trie, false);
277         check_trie_with_file(trie, argv[1]);
278         if (argc > 2) {
279             const uint32_t how_many = 8 * 1000 * 1000;
280             struct timeval start, end;
281             double diff;
282
283             gettimeofday(&start, NULL);
284             for (uint32_t i = 0 ; i < how_many ; ++i) {
285                 trie_lookup(trie, argv[2]);
286             }
287             gettimeofday(&end, NULL);
288             diff = (end.tv_sec - start.tv_sec) + (double)(end.tv_usec - start.tv_usec) / 10e6;
289             printf("%u lookups per second\n", (int)(how_many / diff));
290         }
291         trie_delete(&trie);
292     }
293     return 0;
294 }