Compare query_format and snprintf performances.
[apps/pfixtools.git] / common / tst-trie.c
1 /******************************************************************************/
2 /*          pfixtools: a collection of postfix related tools                  */
3 /*          ~~~~~~~~~                                                         */
4 /*  ________________________________________________________________________  */
5 /*                                                                            */
6 /*  Redistribution and use in source and binary forms, with or without        */
7 /*  modification, are permitted provided that the following conditions        */
8 /*  are met:                                                                  */
9 /*                                                                            */
10 /*  1. Redistributions of source code must retain the above copyright         */
11 /*     notice, this list of conditions and the following disclaimer.          */
12 /*  2. Redistributions in binary form must reproduce the above copyright      */
13 /*     notice, this list of conditions and the following disclaimer in the    */
14 /*     documentation and/or other materials provided with the distribution.   */
15 /*  3. The names of its contributors may not be used to endorse or promote    */
16 /*     products derived from this software without specific prior written     */
17 /*     permission.                                                            */
18 /*                                                                            */
19 /*  THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND   */
20 /*  ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE     */
21 /*  IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR        */
22 /*  PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS    */
23 /*  BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR    */
24 /*  CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF      */
25 /*  SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS  */
26 /*  INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN   */
27 /*  CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)   */
28 /*  ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF    */
29 /*  THE POSSIBILITY OF SUCH DAMAGE.                                           */
30 /******************************************************************************/
31
32 /*
33  * Copyright © 2008 Florent Bruneau
34  */
35
36 #include <time.h>
37 #include <sys/time.h>
38 #include "common.h"
39 #include "str.h"
40 #include "trie.h"
41 #include "file.h"
42
43 static trie_t *create_trie_from_file(const char *file)
44 {
45     trie_t *db;
46     file_map_t map;
47     const char *p, *end;
48     char line[BUFSIZ];
49
50     if (!file_map_open(&map, file, false)) {
51         return NULL;
52     }
53     p   = map.map;
54     end = map.end;
55     while (end > p && end[-1] != '\n') {
56         --end;
57     }
58     if (end != map.end) {
59         warn("file %s miss a final \\n, ignoring last line", file);
60     }
61
62     db = trie_new();
63     while (p < end && p != NULL) {
64         const char *eol = (char *)memchr(p, '\n', end - p);
65         if (eol == NULL) {
66             eol = end;
67         }
68         if (eol - p > BUFSIZ) {
69             p = eol - BUFSIZ;
70         }
71         int i = 0;
72 #if 1
73         for (const char *s = eol - 1 ; s >= p ; --s) {
74             line[i++] = ascii_tolower(*s);
75         }
76 #else
77         memcpy(line, p, eol - p);
78         i = eol - p;
79 #endif
80         line[i] = '\0';
81         trie_insert(db, line);
82         p = eol + 1;
83     }
84     file_map_close(&map);
85     trie_compile(db, false);
86     return db;
87 }
88
89 __attribute__((used))
90 static void check_trie_with_file(const trie_t *db, const char *file)
91 {
92     file_map_t map;
93     const char *p, *end;
94     char line[BUFSIZ];
95
96     if (!file_map_open(&map, file, false)) {
97         return;
98     }
99     p   = map.map;
100     end = map.end;
101     while (end > p && end[-1] != '\n') {
102         --end;
103     }
104     if (end != map.end) {
105         warn("file %s miss a final \\n, ignoring last line", file);
106     }
107
108     while (p < end && p != NULL) {
109         const char *eol = (char *)memchr(p, '\n', end - p);
110         if (eol == NULL) {
111             eol = end;
112         }
113         if (eol - p > BUFSIZ) {
114             p = eol - BUFSIZ;
115         }
116         int i = 0;
117 #if 1
118         for (const char *s = eol - 1 ; s >= p ; --s) {
119             line[i++] = ascii_tolower(*s);
120         }
121 #else
122         memcpy(line, p, eol - p);
123         i = eol - p;
124 #endif
125         line[i] = '\0';
126         if (!trie_lookup(db, line)) {
127           warn("'%s' not found in the trie", line);
128         }
129         p = eol + 1;
130     }
131     file_map_close(&map);
132 }
133
134
135 int main(int argc, char *argv[])
136 {
137     /* Trivial tests
138      */
139     trie_t *trie = trie_new();
140     trie_insert(trie, "abcde123456789");
141     trie_insert(trie, "abcde123654789");
142     trie_insert(trie, "abcdefghi");
143     trie_insert(trie, "coucou");
144     trie_insert(trie, "coucou chez vous");
145     trie_insert(trie, "debout !");
146     trie_compile(trie, false);
147     trie_inspect(trie, true);
148
149 #define ASSERT_TRUE(str)                            \
150     if (!trie_lookup(trie, str)) {                  \
151         printf("\"%s\" not found in trie\n", str);  \
152         return 1;                                   \
153     }
154 #define ASSERT_FALSE(str)                           \
155     if (trie_lookup(trie, str)) {                   \
156         printf("\"%s\" found in trie\n", str);      \
157         return 1;                                   \
158     }
159     ASSERT_FALSE("");
160     ASSERT_FALSE("coucou ");
161     ASSERT_FALSE("abcde123");
162     ASSERT_FALSE("abcde");
163     ASSERT_FALSE("coucou chez vous tous");
164     ASSERT_TRUE("abcde123456789");
165     ASSERT_TRUE("abcde123456789");
166     ASSERT_TRUE("abcde123654789");
167     ASSERT_TRUE("abcdefghi");
168     ASSERT_TRUE("coucou");
169     ASSERT_TRUE("coucou chez vous");
170     ASSERT_TRUE("debout !");
171
172     trie_delete(&trie);
173
174     /* Perf test
175      */
176     if (argc > 1) {
177         trie = create_trie_from_file(argv[1]);
178         trie_inspect(trie, false);
179         check_trie_with_file(trie, argv[1]);
180         if (argc > 2) {
181             const uint32_t how_many = 8 * 1000 * 1000;
182             struct timeval start, end;
183             double diff;
184
185             gettimeofday(&start, NULL);
186             for (uint32_t i = 0 ; i < how_many ; ++i) {
187                 trie_lookup(trie, argv[2]);
188             }
189             gettimeofday(&end, NULL);
190             diff = (end.tv_sec - start.tv_sec) + (double)(end.tv_usec - start.tv_usec) / 10e6;
191             printf("%u lookups per second\n", (int)(how_many / diff));
192         }
193         trie_delete(&trie);
194     }
195     return 0;
196 }