Use str[pf]time.
[apps/madmutt.git] / lib-mime / rfc822parse.c
1 /*
2  *  This program is free software; you can redistribute it and/or modify
3  *  it under the terms of the GNU General Public License as published by
4  *  the Free Software Foundation; either version 2 of the License, or (at
5  *  your option) any later version.
6  *
7  *  This program is distributed in the hope that it will be useful, but
8  *  WITHOUT ANY WARRANTY; without even the implied warranty of
9  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
10  *  General Public License for more details.
11  *
12  *  You should have received a copy of the GNU General Public License
13  *  along with this program; if not, write to the Free Software
14  *  Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston,
15  *  MA 02110-1301, USA.
16  *
17  *  Copyright © 2006 Pierre Habouzit
18  */
19
20 /*
21  * Copyright notice from original mutt:
22  * Copyright (C) 1996-2000 Michael R. Elkins <me@mutt.org>
23  *
24  * This file is part of mutt-ng, see http://www.muttng.org/.
25  * It's licensed under the GNU General Public License,
26  * please see the file GPL in the top level source directory.
27  */
28
29 #include <lib-lib/lib-lib.h>
30
31 #include "recvattach.h"
32 #include "charset.h"
33 #include "mime.h"
34
35 /* Reads an arbitrarily long header field, and looks ahead for continuation
36  * lines.  ``line'' must point to a dynamically allocated string; it is
37  * increased if more space is required to fit the whole line.
38  */
39 ssize_t mutt_read_rfc822_line(FILE *f, char **line, ssize_t *n)
40 {
41     ssize_t pos = 0;
42
43     for (;;) {
44         char *p = *line;
45
46         /* end of file or end of headers */
47         if (!fgets(p + pos, *n - pos, f) || (ISSPACE(*p) && pos == 0)) {
48             *p = '\0';
49             return 0;
50         }
51
52         pos += m_strlen(p + pos);
53         if (p[pos - 1] == '\n') {
54             int c;
55
56             /* remove trailing spaces. safe: p[0] is not a space */
57             do {
58                 p[--pos] = '\0';
59             } while (ISSPACE(p[pos]));
60
61             /* check to see if the next line is a continuation line */
62             c = fgetc(f);
63             if (c != ' ' && c != '\t') {
64                 /* next line is a separate header field or EOH */
65                 ungetc(c, f);
66                 return pos;
67             }
68
69             /* eat tabs and spaces from the beginning of the continuation line */
70             do {
71                 c = fgetc(f);
72             } while (c == ' ' || c == '\t');
73             ungetc(c, f);
74
75             /* string is still terminated because we removed at least one
76                whitespace char above */
77             p[pos++] = ' ';
78         }
79
80         if (*n < pos + STRING) {
81             /* grow the buffer */
82             *n += STRING;
83             p_realloc(line, *n);
84         }
85     }
86 }
87
88 /* TODO: Make that a string list somehow */
89 string_list_t *mutt_parse_references(char *s, int in_reply_to)
90 {
91     string_list_t *lst = NULL;
92     int n = 0;
93     char *o = NULL;
94
95     /* some mail clients add other garbage besides message-ids, so do a quick
96      * check to make sure this looks like a valid message-id
97      * some idiotic clients also break their message-ids between lines, deal
98      * with that too (give up if it's more than two lines, though)
99      */
100
101     for (s = strtok(s, " \t;"); s; s = strtok(NULL, " \t;")) {
102         char *new = NULL;
103
104         if (*s == '<') {
105             n = m_strlen(s);
106             if (s[n - 1] != '>') {
107                 o = s;
108                 continue;
109             }
110
111             new = m_strdup(s);
112         } else if (o) {
113             ssize_t m = m_strlen(s);
114
115             if (s[m - 1] != '>') {
116                 o = NULL;
117             } else {
118                 new = p_new(char, n + m + 1);
119                 m_strcpy(new, n + m + 1, o);
120                 m_strcpy(new + n, m + 1, s);
121             }
122         }
123
124         /* make sure that this really does look like a message-id.
125          * it should have exactly one @, and if we're looking at
126          * an in-reply-to header, make sure that the part before
127          * the @ has more than eight characters or it's probably
128          * an email address
129          */
130         if (new) {
131             char *at = strchr(new, '@');
132             string_list_t *tmp;
133
134             if (!at || strchr(at + 1, '@') || (in_reply_to && at - new <= 8)) {
135                 p_delete(&new);
136                 continue;
137             }
138
139             tmp = p_new(string_list_t, 1);
140             tmp->data = new;
141             tmp->next = lst;
142             lst = tmp;
143         }
144     }
145
146     return lst;
147 }
148
149 int mutt_check_encoding(const char *s)
150 {
151     int tok = mime_which_token(s, -1);
152     switch (tok) {
153       case MIME_7BIT:
154         return ENC7BIT;
155       case MIME_8BIT:
156         return ENC8BIT;
157       case MIME_BINARY:
158         return ENCBINARY;
159       case MIME_QUOTED_PRINTABLE:
160         return ENCQUOTEDPRINTABLE;
161       case MIME_BASE64:
162         return ENCBASE64;
163       case MIME_X_UUENCODE:
164         return ENCUUENCODED;
165       default:
166         return ENCOTHER;
167     }
168 }
169
170 int mutt_check_mime_type(const char *s)
171 {
172     int tok;
173
174     if (!m_strcmp(s, "*") || !m_strcmp(s, ".*"))
175         return TYPEANY;
176
177     tok = mime_which_token(s, -1);
178     switch (tok) {
179       case MIME_TEXT:        return TYPETEXT;
180       case MIME_MULTIPART:   return TYPEMULTIPART;
181       case MIME_APPLICATION: return TYPEAPPLICATION;
182       case MIME_MESSAGE:     return TYPEMESSAGE;
183       case MIME_IMAGE:       return TYPEIMAGE;
184       case MIME_AUDIO:       return TYPEAUDIO;
185       case MIME_VIDEO:       return TYPEVIDEO;
186       case MIME_MODEL:       return TYPEMODEL;
187       default:               return TYPEOTHER;
188     }
189 }
190
191 static parameter_t *parse_parameters(const char *s)
192 {
193     parameter_t *res = NULL;
194     parameter_t **list = &res;
195
196     while (*s) {
197         const char *p;
198         parameter_t *new;
199         int i;
200
201         s = skipspaces(s);
202         if (*s == '=')             /* parameters are fucked up, go away */
203             break;
204
205         p = strpbrk(s, "=;");
206         if (!p)
207             break;
208
209         if (*p == ';') {
210             /* if we hit a ; now the parameter has no value, just skip it */
211             s = p + 1;
212             continue;
213         }
214
215         i = p - s;
216         new = parameter_new();
217         new->attribute = p_dupstr(s, i);
218
219         while (--i >= 0 && ISSPACE(new->attribute[i])) {
220             new->attribute[i] = '\0';
221         }
222         s = skipspaces(p + 1);                      /* skip over the = */
223
224         if (*s == '"') {
225             char buffer[LONG_STRING];
226             int state_ascii = 1;
227
228             s++;
229             for (i = 0; *s && i < ssizeof(buffer) - 1; i++, s++) {
230                 /* As iso-2022-* has a characer of '"' with non-ascii state,
231                  * ignore it. */
232                 if (*s == 0x1b && i < ssizeof(buffer) - 2) {
233                     state_ascii = s[1] == '(' && (s[2] == 'B' || s[2] == 'J');
234                 }
235                 if (state_ascii && *s == '"')
236                     break;
237
238                 if (*s == '\\') {
239                     buffer[i] = *++s;
240                 } else {
241                     buffer[i] = *s;
242                 }
243             }
244
245             new->value = p_dupstr(buffer, i);
246         } else {
247             for (p = s; *p && *p != ' ' && *p != ';'; p++);
248             new->value = p_dupstr(s, p - s);
249         }
250
251         *list = new;
252         list = &new->next;
253
254         s = strchr(s, ';');           /* Find the next parameter */
255         if (!s)
256             break;                    /* no more parameters */
257     }
258
259     rfc2231_decode_parameters(&res);
260     return res;
261 }
262
263 void mutt_parse_content_type(char *s, BODY *ct)
264 {
265     char *pc;
266     char *subtype;
267
268     p_delete(&ct->subtype);
269     parameter_list_wipe(&ct->parameter);
270
271     /* First extract any existing parameters */
272     if ((pc = strchr(s, ';')) != NULL) {
273         *pc++ = '\0';
274         ct->parameter = parse_parameters(vskipspaces(pc));
275
276         /* Some pre-RFC1521 gateways still use the "name=filename" convention,
277          * but if a filename has already been set in the content-disposition,
278          * let that take precedence, and don't set it here */
279         pc = parameter_getval(ct->parameter, "name");
280         if (pc && !ct->filename)
281             ct->filename = m_strdup(pc);
282     }
283
284     /* Now get the subtype */
285     if ((subtype = strchr (s, '/'))) {
286         *subtype++ = '\0';
287         for (pc = subtype; *pc && !ISSPACE(*pc) && *pc != ';'; pc++);
288         ct->subtype = p_dupstr(subtype, pc - subtype);
289     }
290
291     /* Finally, get the major type */
292     ct->type = mutt_check_mime_type(s);
293
294     if (ct->type == TYPEOTHER) {
295         ct->xtype = m_strdup(s);
296     }
297
298     if (!ct->subtype) {
299         /* Some older non-MIME mailers (i.e., mailtool, elm) have a content-type
300          * field, so we can attempt to convert the type to BODY here.
301          */
302         switch (ct->type) {
303             char buffer[STRING];
304
305           case TYPETEXT:
306             ct->subtype = m_strdup("plain");
307             break;
308
309           case TYPEAUDIO:
310             ct->subtype = m_strdup("basic");
311             break;
312
313           case TYPEMESSAGE:
314             ct->subtype = m_strdup("rfc822");
315             break;
316
317           case TYPEOTHER:
318             ct->type = TYPEAPPLICATION;
319             snprintf(buffer, sizeof(buffer), "x-%s", s);
320             ct->subtype = m_strdup(buffer);
321             break;
322
323           default:
324             ct->subtype = m_strdup("x-unknown");
325             break;
326         }
327     }
328
329     /* Default character set for text types. */
330     if (ct->type == TYPETEXT) {
331         pc = parameter_getval(ct->parameter, "charset");
332         if (!pc) {
333             parameter_setval(&ct->parameter, "charset",
334                              charset_getfirst(mod_cset.assumed_charset));
335         }
336     }
337 }
338
339 static void parse_content_disposition(const char *s, BODY *ct)
340 {
341     if (!ascii_strncasecmp(s, "inline", 6)) {
342         ct->disposition = DISPINLINE;
343     } else if (!ascii_strncasecmp(s, "form-data", 9)) {
344         ct->disposition = DISPFORMDATA;
345     } else {
346         ct->disposition = DISPATTACH;
347     }
348
349     /* Check to see if a default filename was given */
350     if ((s = strchr (s, ';'))) {
351         parameter_t *parms = parse_parameters(vskipspaces(s));
352
353         if ((s = parameter_getval(parms, "filename")))
354             m_strreplace(&ct->filename, s);
355         if ((s = parameter_getval(parms, "name")))
356             ct->form_name = m_strdup(s);
357
358         parameter_list_wipe(&parms);
359     }
360 }
361
362 /* args:
363  *      fp      stream to read from
364  *
365  *      digest  1 if reading subparts of a multipart/digest, 0
366  *              otherwise
367  */
368 BODY *mutt_read_mime_header(FILE *fp, int digest)
369 {
370     BODY *body = body_new();
371     char *line = p_new(char, LONG_STRING);
372     ssize_t linelen = LONG_STRING;
373     char *p;
374
375     body->hdr_offset  = ftello(fp);
376     body->encoding    = ENC7BIT;    /* default from RFC1521 */
377     body->disposition = DISPINLINE;
378     body->type        = digest ? TYPEMESSAGE : TYPETEXT;
379
380     while (mutt_read_rfc822_line(fp, &line, &linelen)) {
381         /* Find the value of the current header */
382         if ((p = strchr(line, ':'))) {
383             *p++ = '\0';
384             p = vskipspaces(p);
385             if (!*p)
386                 continue;
387         } else {
388             break;
389         }
390
391         switch (mime_which_token(line, -1)) {
392           case MIME_CONTENT_TYPE:
393             mutt_parse_content_type (p, body);
394             break;
395
396           case MIME_CONTENT_TRANSFER_ENCODING:
397             body->encoding = mutt_check_encoding (p);
398             break;
399
400           case MIME_CONTENT_DISPOSITION:
401             parse_content_disposition(p, body);
402             break;
403
404           case MIME_CONTENT_DESCRIPTION:
405             m_strreplace(&body->description, p);
406             rfc2047_decode(&body->description);
407             break;
408
409           default: break;
410         }
411     }
412
413     body->offset = ftello(fp);       /* Mark the start of the real data */
414     if (!body->subtype) {
415         if (body->type == TYPETEXT)
416             body->subtype = m_strdup("plain");
417         if (body->type == TYPEMESSAGE)
418             body->subtype = m_strdup("rfc822");
419     }
420
421     p_delete(&line);
422     return (body);
423 }
424
425 void mutt_parse_part(FILE *fp, BODY *b)
426 {
427     char *bound = 0;
428
429     switch (b->type) {
430       case TYPEMULTIPART:
431         bound = parameter_getval(b->parameter, "boundary");
432         fseeko(fp, b->offset, SEEK_SET);
433         b->parts = mutt_parse_multipart(fp, bound, b->offset + b->length,
434                                         mime_which_token(b->subtype, -1) == MIME_DIGEST);
435         break;
436
437       case TYPEMESSAGE:
438         if (b->subtype) {
439             fseeko(fp, b->offset, SEEK_SET);
440
441             if (mutt_is_message_type(b)) {
442                 b->parts = mutt_parse_messageRFC822(fp, b);
443             } else
444             if (mime_which_token(b->subtype, -1) == MIME_EXTERNAL_BODY) {
445                 b->parts = mutt_read_mime_header(fp, 0);
446             } else {
447                 return;
448             }
449         }
450         break;
451
452       default:
453         return;
454     }
455
456     /* try to recover from parsing error */
457     if (!b->parts) {
458         b->type = TYPETEXT;
459         m_strreplace(&b->subtype, "plain");
460     }
461 }
462
463 /* parse a MESSAGE/RFC822 body
464  *
465  * args:
466  *      fp              stream to read from
467  *
468  *      parent          structure which contains info about the message/rfc822
469  *                      body part
470  *
471  * NOTE: this assumes that `parent->length' has been set!
472  */
473 BODY *mutt_parse_messageRFC822(FILE * fp, BODY * parent)
474 {
475     BODY *msg;
476
477     parent->hdr = header_new();
478     parent->hdr->offset = ftello(fp);
479     parent->hdr->env    = mutt_read_rfc822_header(fp, parent->hdr, 0, 0);
480
481     msg = parent->hdr->content;
482
483     /* ignore the length given in the content-length since it could be wrong
484        and we already have the info to calculate the correct length */
485     /* if (msg->length == -1) */
486     /* if body of this message is empty, we can end up with a negative length */
487     msg->length = MAX(0, parent->length - (msg->offset - parent->offset));
488
489     mutt_parse_part(fp, msg);
490
491     return msg;
492 }
493
494 /* parse a multipart structure
495  *
496  * args:
497  *      fp              stream to read from
498  *
499  *      bound           body separator
500  *
501  *      end_off         length of the multipart body (used when the final
502  *                      boundary is missing to avoid reading too far)
503  *
504  *      digest          1 if reading a multipart/digest, 0 otherwise
505  */
506
507 BODY *
508 mutt_parse_multipart(FILE *fp, const char *bound, off_t end_off, int digest)
509 {
510     char buffer[LONG_STRING];
511     BODY *head = NULL;
512     BODY **last = &head;
513     int blen = m_strlen(bound);
514     int final = 0;                /* did we see the ending boundary? */
515
516     if (!blen) {
517         mutt_error _("multipart message has no boundary parameter!");
518         return NULL;
519     }
520
521     while (ftello(fp) < end_off && fgets(buffer, sizeof(buffer), fp)) {
522         int len, crlf, i;
523
524         len  = m_strlen(buffer);
525         crlf = len > 1 && buffer[len - 2] == '\r';
526
527         if (buffer[0] == '-' && buffer[1] == '-'
528         && !m_strncmp(buffer + 2, bound, blen))
529         {
530             if (*last) {
531                 BODY *b = *last;
532
533                 /* if the body is empty, we can end up with a -1 length */
534                 b->length = MAX(0, ftello(fp) - b->offset - len - 1 - crlf);
535                 if (b->parts && b->parts->length == 0) {
536                     b->parts->length = ftello(fp) - b->parts->offset
537                                      - len - 1 - crlf;
538                 }
539             }
540
541             /* Remove any trailing whitespace, up to the length of the boundary */
542             for (i = len - 1; ISSPACE(buffer[i]) && i >= blen + 2; i--)
543                 buffer[i] = '\0';
544
545             /* Check for the end boundary */
546             final = buffer[blen + 3] == '-' && buffer[blen + 4] == '-';
547             if (final)
548                 break;
549
550             if (buffer[2 + blen] == '\0') {
551                 BODY *new = mutt_read_mime_header(fp, digest);
552
553                 /*
554                  * Consistency checking - catch
555                  * bad attachment end boundaries
556                  */
557
558                 if (new->offset > end_off) {
559                     body_list_wipe(&new);
560                     break;
561                 }
562
563                 if (*last)
564                     last = &(*last)->next;
565                 *last = new;
566             }
567         }
568     }
569
570     /* in case of missing end boundary, set the length to something reasonable */
571     if (*last && (*last)->length == 0 && !final)
572         (*last)->length = end_off - (*last)->offset;
573
574     /* parse recursive MIME parts */
575     {
576         BODY *b;
577         for (b = head; b; b = b->next)
578             mutt_parse_part(fp, b);
579     }
580
581     return (head);
582 }
583
584 /* parses a date string in RFC822 format:
585  *
586  * Date: [ weekday , ] day-of-month month year hour:minute:second timezone
587  *
588  * This routine assumes that `h' has been initialized to 0.  the `timezone'
589  * field is optional, defaulting to +0000 if missing.
590  */
591 time_t mutt_parse_date(const char *s, HEADER *h)
592 {
593     struct tm tm;
594     const char *loc;
595     p_clear(&tm, 1);
596     loc = setlocale(LC_TIME, "C");
597     s = strptime(s, "%a, %d %b %Y %T %z", &tm);
598     setlocale(LC_TIME, loc);
599     return mutt_mktime(&tm, 1);
600 }
601
602 string_list_t **mutt_parse_rfc822_line(ENVELOPE *e, HEADER *hdr, char *line, char *p,
603                               short weed, short do_2047, string_list_t **user_hdrs)
604 {
605     switch (mime_which_token(line, -1)) {
606       case MIME_APPARENTLY_FROM:
607         e->from = rfc822_parse_adrlist (e->from, p);
608         break;
609
610       case MIME_APPARENTLY_TO:
611         e->to = rfc822_parse_adrlist (e->to, p);
612         break;
613
614       case MIME_BCC:
615         e->bcc = rfc822_parse_adrlist (e->bcc, p);
616         break;
617
618       case MIME_CC:
619         e->cc = rfc822_parse_adrlist (e->cc, p);
620         break;
621
622       case MIME_CONTENT_DESCRIPTION:
623         if (hdr) {
624             m_strreplace(&hdr->content->description, p);
625             rfc2047_decode(&hdr->content->description);
626         }
627         break;
628
629       case MIME_CONTENT_DISPOSITION:
630         if (hdr)
631             parse_content_disposition(p, hdr->content);
632         break;
633
634       case MIME_CONTENT_LENGTH:
635         if (hdr) {
636             if ((hdr->content->length = atoi(p)) < 0)
637                 hdr->content->length = -1;
638         }
639         break;
640
641       case MIME_CONTENT_TRANSFER_ENCODING:
642         if (hdr)
643             hdr->content->encoding = mutt_check_encoding(p);
644         break;
645
646       case MIME_CONTENT_TYPE:
647         if (hdr)
648             mutt_parse_content_type (p, hdr->content);
649         break;
650
651       case MIME_DATE:
652         m_strreplace(&e->date, p);
653         if (hdr)
654             hdr->date_sent = mutt_parse_date (p, hdr);
655         break;
656
657       case MIME_EXPIRES:
658         if (hdr && mutt_parse_date (p, NULL) < time (NULL))
659             hdr->expired = 1;
660         break;
661
662 #ifdef USE_NNTP
663       case MIME_FOLLOWUP_TO:
664         if (!e->followup_to) {
665             m_strrtrim(p);
666             e->followup_to = m_strdup(skipspaces(p));
667         }
668         break;
669 #endif
670
671       case MIME_FROM:
672         e->from = rfc822_parse_adrlist(e->from, p);
673         /* don't leave from info NULL if there's an invalid address (or
674          * whatever) in From: field; mutt would just display it as empty
675          * and mark mail/(esp.) news article as your own. aaargh! this
676          * bothered me for _years_ */
677         if (!e->from) {
678             e->from = address_new();
679             e->from->personal = m_strdup(p);
680         }
681         break;
682
683       case MIME_IN_REPLY_TO:
684         string_list_wipe(&e->in_reply_to);
685         e->in_reply_to = mutt_parse_references(p, 1);
686         break;
687
688       case MIME_LINES:
689         if (hdr) {
690             /* HACK - mutt has, for a very short time, produced negative
691                Lines header values.  Ignore them. */
692             hdr->lines = MAX(0, atoi(p));
693         }
694         break;
695
696       case MIME_LIST_POST:
697         /* RFC 2369.  FIXME: We should ignore whitespace, but don't. */
698         if (m_strncmp(p, "NO", 2)) {
699             char *beg, *end;
700
701             for (beg = strchr (p, '<'); beg; beg = strchr (end, ',')) {
702                 ++beg;
703                 if (!(end = strchr (beg, '>')))
704                     break;
705
706                 /* Take the first mailto URL */
707                 if (url_check_scheme (beg) == U_MAILTO) {
708                     p_delete(&e->list_post);
709                     e->list_post = p_dupstr(beg, end - beg);
710                     break;
711                 }
712             }
713         }
714         break;
715
716       case MIME_MAIL_FOLLOWUP_TO:
717         e->mail_followup_to = rfc822_parse_adrlist(e->mail_followup_to, p);
718         break;
719
720       case MIME_MAIL_REPLY_TO:
721         address_list_wipe(&e->reply_to);
722         e->reply_to = rfc822_parse_adrlist(e->reply_to, p);
723         break;
724
725       case MIME_MESSAGE_ID:
726         {
727             const char *beg, *end;
728
729             /* We add a new "Message-ID:" when building a message */
730             p_delete(&e->message_id);
731
732             if ((beg = strchr(p, '<')) && (end = strchr(beg, '>')))
733                 e->message_id = p_dupstr(beg, (end - beg) + 1);
734         }
735         break;
736
737       case MIME_MIME_VERSION:
738         if (hdr)
739             hdr->mime = 1;
740         break;
741
742 #ifdef USE_NNTP
743       case MIME_NEWSGROUPS:
744         p_delete(&e->newsgroups);
745         m_strrtrim(p);
746         e->newsgroups = m_strdup(skipspaces(p));
747         break;
748 #endif
749
750       case MIME_ORGANIZATION:
751         if (!e->organization && mime_which_token(p, -1) == MIME_UNKNOWN)
752             e->organization = m_strdup(p);
753         break;
754
755       case MIME_RECEIVED:
756         if (hdr && !hdr->received) {
757             char *d = strchr(p, ';');
758             if (d)
759                 hdr->received = mutt_parse_date(d + 1, NULL);
760         }
761         break;
762
763       case MIME_REFERENCES:
764         string_list_wipe(&e->references);
765         e->references = mutt_parse_references(p, 0);
766         break;
767
768       case MIME_REPLY_TO:
769         e->reply_to = rfc822_parse_adrlist(e->reply_to, p);
770         break;
771
772       case MIME_RETURN_PATH:
773         e->return_path = rfc822_parse_adrlist(e->return_path, p);
774         break;
775
776       case MIME_SENDER:
777         e->sender = rfc822_parse_adrlist (e->sender, p);
778         break;
779
780       case MIME_STATUS:
781         if (hdr) {
782             while (*p) {
783                 switch (*p) {
784                   case 'r':
785                     hdr->replied = 1;
786                     break;
787                   case 'O':
788                     hdr->old = 1;
789                     break;
790                   case 'R':
791                     hdr->read = 1;
792                     break;
793                 }
794                 p++;
795             }
796         }
797         break;
798
799       case MIME_SUBJECT:
800         if (!e->subject)
801             e->subject = m_strdup(p);
802         break;
803
804       case MIME_SUPERCEDES:
805       case MIME_SUPERSEDES:
806         if (hdr)
807             e->supersedes = m_strdup(p);
808         break;
809
810       case MIME_TO:
811         e->to = rfc822_parse_adrlist(e->to, p);
812         break;
813
814       case MIME_X_LABEL:
815         e->x_label = m_strdup(p);
816         break;
817
818 #ifdef USE_NNTP
819       case MIME_XREF:
820         if (!e->xref)
821             e->xref = m_strdup(p);
822         break;
823 #endif
824
825       case MIME_X_STATUS:
826         if (hdr) {
827             while (*p) {
828                 switch (*p) {
829                   case 'A':
830                     hdr->replied = 1;
831                     break;
832                   case 'D':
833                     hdr->deleted = 1;
834                     break;
835                   case 'F':
836                     hdr->flagged = 1;
837                     break;
838                   default:
839                     break;
840                 }
841                 p++;
842             }
843         }
844         break;
845
846       default:
847         if (!user_hdrs)
848             break;
849
850         /* restore the original line */
851         line[m_strlen(line)] = ':';
852
853         if (weed && string_list_contains(Ignore, line, "*")
854         && !string_list_contains(UnIgnore, line, "*")) {
855             break;
856         }
857
858         *user_hdrs = string_item_new();
859         (*user_hdrs)->data = m_strdup(line);
860         if (do_2047)
861             rfc2047_decode(&(*user_hdrs)->data);
862         return &(*user_hdrs)->next;
863     }
864
865     return user_hdrs;
866 }
867
868 /* mutt_read_rfc822_header() -- parses a RFC822 header
869  *
870  * Args:
871  *
872  * f            stream to read from
873  *
874  * hdr          header structure of current message (optional).
875  *
876  * user_hdrs    If set, store user headers.  Used for recall-message and
877  *              postpone modes.
878  *
879  * weed         If this parameter is set and the user has activated the
880  *              $weed option, honor the header weed list for user headers.
881  *              Used for recall-message.
882  *
883  * Returns:     newly allocated envelope structure.  You should free it by
884  *              envelope_delete() when envelope stay unneeded.
885  */
886 ENVELOPE *
887 mutt_read_rfc822_header(FILE *f, HEADER *hdr, short user_hdrs, short weed)
888 {
889     ENVELOPE *e = envelope_new();
890     string_list_t **last = user_hdrs ? &e->userhdrs : NULL;
891
892     char *line = p_new(char, LONG_STRING);
893     ssize_t linelen = LONG_STRING;
894     off_t loc;
895
896     if (hdr && !hdr->content) {
897         hdr->content = body_new();
898
899         /* set the defaults from RFC1521 */
900         hdr->content->type     = TYPETEXT;
901         hdr->content->subtype  = m_strdup("plain");
902         hdr->content->encoding = ENC7BIT;
903         hdr->content->length   = -1;
904
905         /* RFC 2183 says this is arbitrary */
906         hdr->content->disposition = DISPINLINE;
907     }
908
909     while ((loc = ftello(f)),
910            mutt_read_rfc822_line(f, &line, &linelen))
911     {
912         char buf[LONG_STRING + 1] = "";
913         char *p;
914
915         p = strpbrk(line, ": \t");
916         if (!p || *p != ':') {
917             /* some bogus MTAs will quote the original "From " line */
918             if (!m_strncmp(">From ", line, 6) || !m_strncmp("From ", line, 5))
919                 continue;               /* just ignore */
920
921             fseeko(f, loc, 0);
922             break;                    /* end of header */
923         }
924
925         if (rx_list_match2(SpamList, line, buf, sizeof(buf))
926         && !rx_list_match(NoSpamList, line))
927         {
928             /* if spam tag already exists, figure out how to amend it */
929             if (e->spam && *buf) {
930                 if (mod_mime.spam_separator) {
931                     mutt_buffer_addstr(e->spam, mod_mime.spam_separator);
932                 } else {
933                     mutt_buffer_reset(e->spam);
934                 }
935                 mutt_buffer_addstr(e->spam, buf);
936             }
937
938             if (!e->spam) {
939                 e->spam = mutt_buffer_from(NULL, buf);
940             }
941         }
942
943         *p++ = '\0';
944         p = vskipspaces(p);
945         if (!*p)
946             continue;                 /* skip empty header fields */
947
948         last = mutt_parse_rfc822_line(e, hdr, line, p, weed, 1, last);
949     }
950
951     p_delete(&line);
952
953     if (hdr) {
954         hdr->content->hdr_offset = hdr->offset;
955         hdr->content->offset     = ftello(f);
956         rfc2047_decode_envelope(e);
957         /* check for missing or invalid date */
958         if (hdr->date_sent <= 0) {
959             hdr->date_sent = hdr->received;
960         }
961     }
962
963     return e;
964 }
965
966 /* Compares mime types to the ok and except lists */
967 static int count_body_parts_check(string_list_t **checklist, BODY *b)
968 {
969     string_list_t *type;
970
971     for (type = *checklist; type; type = type->next) {
972         ATTACH_MATCH *a = (ATTACH_MATCH *)type->data;
973
974         if ((a->major_int == TYPEANY || a->major_int == b->type)
975         &&  !regexec(&a->minor_rx, b->subtype, 0, NULL, 0)) {
976             return 1;
977         }
978     }
979
980     return 0;
981 }
982
983 static int count_body_parts (BODY *body, int flags)
984 {
985     int count = 0;
986     BODY *bp;
987
988     if (!body)
989         return 0;
990
991     for (bp = body; bp != NULL; bp = bp->next) {
992         /* Initial disposition is to count and not to recurse this part. */
993         int shallcount, shallrecurse, iscontainer;
994         int tok = mime_which_token(bp->subtype, -1);
995
996         iscontainer  = bp->type == TYPEMESSAGE || bp->type == TYPEMULTIPART;
997
998         /* don't recurse in external bodies or multipart/alternatives */
999         shallrecurse = (bp->type == TYPEMESSAGE && tok != MIME_EXTERNAL_BODY)
1000                     || (bp->type == TYPEMULTIPART && tok != MIME_ALTERNATIVE);
1001
1002         /* Don't count top level containers and fundamental inlines */
1003         shallcount   = !(iscontainer && (flags & M_PARTS_TOPLEVEL))
1004                     && !(!iscontainer && bp->disposition == DISPINLINE && bp == body);
1005
1006         if (shallcount) {
1007             /* Turn off shallcount if message type is not in ok list,
1008              * or if it is in except list. Check is done separately for
1009              * inlines vs. attachments.
1010              */
1011
1012             if (bp->disposition == DISPATTACH) {
1013                 if (!count_body_parts_check(&AttachAllow, bp))
1014                     shallcount = 0;
1015                 if (count_body_parts_check(&AttachExclude, bp))
1016                     shallcount = 0;
1017             } else {
1018                 if (!count_body_parts_check(&InlineAllow, bp))
1019                     shallcount = 0;
1020                 if (count_body_parts_check(&InlineExclude, bp))
1021                     shallcount = 0;
1022             }
1023         }
1024
1025         bp->attach_qualifies = shallcount;
1026         count += shallcount;
1027
1028         if (shallrecurse) {
1029             bp->attach_count = count_body_parts(bp->parts,
1030                                                 flags & ~M_PARTS_TOPLEVEL);
1031             count += bp->attach_count;
1032         }
1033     }
1034
1035     return count;
1036 }
1037
1038 int mutt_count_body_parts(HEADER *hdr, int flags)
1039 {
1040     if (hdr->attach_valid && !(flags & M_PARTS_RECOUNT))
1041         return hdr->attach_total;
1042
1043     if (AttachAllow || AttachExclude || InlineAllow || InlineExclude)
1044         hdr->attach_total = count_body_parts(hdr->content,
1045                                              flags | M_PARTS_TOPLEVEL);
1046     else
1047         hdr->attach_total = 0;
1048
1049     hdr->attach_valid = 1;
1050     return hdr->attach_total;
1051 }