teisipäev, 13. oktoober 2015

Bugi OSX Mail App rakenduses

Tundub, et OSX Mail App lendab õhku kui IMAP server saadab EXPUNGE teate juhul kui postkastis pole mailirakenduse arvates ühtegi kirja. Ilmselgelt on tegu sünkroniseerimisveaga, aga kas see just tähendab, et peaks exceptionit visates õhku lendama, pole päris selge. Pigem peaks käituma nagu alati juhul kui tekib sünkroniseerimisprobleem, nimelt avatud mailbox sulgeda, see seejärel uuesti avada ja vaadata, et mis seal siis nüüd on.

teisipäev, 6. oktoober 2015

Probleemid QQ webmailiga

QQMail on üks suurimaid Hiina e-maili pakkujaid. Ei julge täpset kasutajanumbrit pakkuda, aga mõnisada miljonit kasutajat võiks sellel ikka olla (kokku on QQ kasutajaid miljardi ringis, aga kõik ei ole neist e-maili kasutajad, QQ toodete portfell on päris suur). Igatahes on see üks maailma suurtest Gmaili, Hotmaili ja Yahoo kõrval ja seega tuleb e-maili tarkvara luues ka QQ'ga arvestada.

Huvitaval kombel ongi QQ webmailil üks spetsiifiline probleem ja seda nimelt manuste unikood failinimedega. Aarvestades et Hiinas on unikood au sees ja ASCII mitte, siis on see tõesti imelik.

Kui standardi järgi asub failinimi Content-Disposition päisekirje filename argumendina, siis paljud e-posti rakendused (etteruttavalt, ka QQ webmail) kasutavad mittestandardset name argumenti Content-Type päises. Mitte-ASCII sümbolite kasutamiseks failinimes tuleb see kodeerida ja korrektseks kodeeringuks on RFC2231 Parameter Value Continuation, mis võimaldab jaotada pikemaid failinimesid väiksemateks osadeks (et mitte rikkuda rea pikkuse piirangut) ning nendes olevad mitte-ASCII sümbolid kodeerida urlencoding-laadses kodeeringus.

Failinime "����.jpg" kodeerimine käiks sellisel juhul nii:
Content-Disposition: attachment;
    filename*0*=utf-8''%F0%9F%98%81%F0%9F%98%82.jpg

RFC2047 kirjeldab veidi vanema kodeeringu mehhanismi, encoded-word kodeeringu mis võimaldab koderida päiseridade väärtusi.

Kirja pealkiri "Spämm ����" võiks välja näha nii:
Subject: =?UTF-8?Q?Sp=C3=A4mm_=F0=9F=98=80?=

Encoded-word nagu ka continuation on atom tüüpi väärtused, mis tähendab, et neid ei saa, vähemalt standardi järgi, kasutada päisekirjete argumentide puhul jutumärkide vahel. Mittestandardselt saab muidugi küll ja seda QQ teebki.

Ühesõnaga, selle asemel et kasutada korrektset continuation kodeeringut, kasutab QQ failinimede puhul encoded-word väärtusi jutumärkide vahel. Veel huvitavam, lisaks sellele, et QQ ei genereeri väljuvaid kirju standardi järgi, ei oska QQ ka sissetulevaid kirju õigesi käsitleda.

Näiteks kui manuse päises on failinimi defineeritud vastavalt standardile:
Content-Disposition: attachment;
    filename*0*=utf-8''%F0%9F%98%81%F0%9F%98%82.jpg

Siis QQ webmailis seda kirja vaadates, kuvatakse manuse linki nii:


Seega tuleb kirjadele lisada failinimi kaks korda. Ühe korra standardi järgi filename argumendina ja ühe korra mittestandardse name argumendina:
Content-Disposition: attachment;
    filename*0*=utf-8''%F0%9F%98%81%F0%9F%98%82.jpg
Content-Type: image/jpeg;
    name="=?UTF-8?Q?=F0=9F=98=81=F0=9F=98=82=2Ejpg?="

Ja nüüd saab ka QQ kõigest aru:

reede, 2. oktoober 2015

Mis on see salapärane moodulus?

Septembris kerkis üles viga ID kaardi sertifikaade genereerimisel, kus väidetavalt olevat mingisugune moodulus negatiivne, aga teadjamad räägivad, et see ei saa seda kuidagi olla ja seega on viga kõigest formaalne. Hea ülevaate probleemist leiab näiteks RIA blogist. Ei hakkakski siin probleemi olemust üle kirjeldama, keskenduks pigem tollele müstilisele moodulusele, et mis asi see üldse on ja miks see negatiivne olla ei saa. Järgnev jutt ei ole krütpograafiline ega matemaatiline teadustekst, vaid for dummies from a dummie, nii et kannatage ära ja jätke parandused kommentaaridesse.

Kõige lihtsamalt võttes on moodulus, nagu nimigi viitab, jäägiga jagamistehte jagaja. Modernse krüptograafia aluseks on hiigelpikad algaarvud, näiteks 2048 bitiga esitatud täisarvul on veidi üle 600 nulli ning selline moodulus ehk jagaja määrab sisuliselt ära numbriskaala, millel toimetame. Võrdluseks autode puhul võiks mooduluseks olla see number, mis on spidomeetril kõige suurem, näiteks 160 km/h. Auto mootor saab tekitada liikumiskiirust vahemikus 0 kuni 160, aga mitte vähem ega rohkem. Jah, osad detailid protsessi käigus võivad liikuda küll kiiremini – näiteks punkt auto ratta välisküljel võib vastavalt asukohale liikuda autost kiiremini, aeglasemalt või olla üldse paigal, aga auto liikumiskiirus jääb siiski sinna määratud vahemikku. Sama on ka krüptoarvutustega.

Et juttu veidi ilmestada, siis koostame siinkohal lihtsa jagatud võtmega ROT põhise krüptolahenduse, kuid fikseeritud saladuse (tavaliselt 13) asemel arvutame jagatud saladuse osapoolte salajasest ja avalikust võtmest Diffie-Hellman võtmevahetuse abil. Sellisel juhul saavad kasutatud võtit teada ainult mõlemad osapooled, aga mitte seda sõnumit pealt kuulavad kolmandad isikud.

Meil on kaks osapoolt, vanad tuttavad Alice ja Bob, kes lepivad kokku, et nende kasutatud võtmevahetuse avalikeks konstantideks on eelpool mainitud moodulus, milleks valitakse 23 (seega prime p=23) ja generaatoriks valitakse 5 (ehk g=5), mis määravadki kasutatava numbriskaala. Järgmiseks valib Alice endale meelepärase salajase võtme, milleks saab algarv 7 (ehk a=7, pange tähele, et see jääb g ja p vahele) ning Bob valib endale salajaseks võtmeks algarvu 11 (ehk b=11).

Salajast võtit loomulikult kellelegi edastada ei tohi ja seetõttu peavad Alice ja Bob tuletama oma salajasest võtmest ka avaliku võtme. Selle leiame tehtega

A←ga mod p

Kus A on Alice avalik võti, g on generaator 5, a on salajane võti 7 ning p on 23.

Alice avalik võti = 57 % 23 = 78125 % 23 = 17

Sama teeme ka Bobi võtmega:

Bobi avalik võti = 511 % 23 =  48828125 % 23 = 22

Seega on Alice salajaseks võtmeks 7 ning avalikuks võtmeks 17, viimase väärtuse edastab ta ka Bobile. Bobi salajaseks võtmeks on omakorda 11 ning avalikuks 22, mille ta edastab Alicele.

Järgmiseks tuleks tuletada nendest väärtusest ühisosa ehk jagatud võti. Selle leiame oma salajasest võtmest ja vastaspoole avalikust võtmest tehtega

S←Ba mod p

Kus B on Bobi avalik võti 22, a on Alice salajane võti 7 ning p on 23.

Jagatud võti Alice jaoks = 227 % 23 = 2494357888 % 23 = 22

Ning sama tehe Bobi jaoks

Jagatud võti Bobi jaoks = 1711 % 23 = 34271896307633 % 23 = 22

Nüüd teavad nii Bob kui Alice, et salajase info omavahel vahetamiseks tuleb kasutada ROT22 algoritmi. Kuna me ei ela enam Rooma impeeriumis, vaid vahepeal on paar tuhat aastat edasi läinud, siis kasutame 26 kohalise tähetabeli asemel tervelt 256 kohalist (ehk siis toimetame 1 baidi raames).

Alice tahab saata Bobile sõnumit "saladus" (baitidena 73:61:6c:61:64:75:73). Sõnumi krüpteerimiseks kodeerib ta selle jagatud saladusega, liigutades kõiki baite 22 võrra suuremaks ja saab väärtuse 89:77:82:77:7a:8b:89. Bob omakorda saanud sellise sõnumi, kerib jagatud võtme võrra baidid madalamaks ja saabki sõnumi sisu lugeda. Profit!

Kokkuvõtteks

Kui vastata esialgsele küsimusele, siis moodulus ei saa tõesti olla negatiivne ja seda seetõttu, et skaala millel toimetame (ning moodulus määrabki skaala ülemise otsa) on alati positiivne. Täiendavalt võis tähele panna, et juba niivõrd lihtsa lahenduskäigu korral läksid tehetes kasutatud väärtused juba päris suureks (näiteks jagatud saladuse leidmisel korraks läbi käinud väärtus 34 271 896 307 633), mis siis veel "päris" krüptost rääkida.Täiendus

Kuna Facebookis küsiti, et mis bitt see ikkagi täpselt siis mooduluse negatiivseks muudab, siis kopipeistin siia arhiveerimise mõttes ka oma vastuse:
Küsimus on ASN.1 INTEGER väärtuse korrektses koostamises, see on siis see numbritüüp mida kasutatakse avaliku võtme mooduluse salvestamiseks sertifikaadis. Konkreetselt on sellel numbrivormingul selline tingimus, et esimene bitt näitab märki: kui see on 0, siis on tegu positiivse arvuga, kui aga 1, siis negatiivne. Kui number on piisavalt väike, siis jääb selle biti jaoks kenasti ruumi, aga suurte numbrite korral lähevad kõik bitid kasutusse ja seega tuleks tekitada juurde veel üks täidisbait, mis koosneb ainult nullidest (ei muuda numbri väärtust, küll aga tekitab vajaliku esimese nullbiti). Mis on nende sertifikaatide juures valesti, ongi see, et too täidisena mõeldud nullbait on numbriväärtuse eest puudu, aga numbriväärtus ise on niivõrd suur, et kasutab esimese biti ise ära. OpenSSL aga seda märki üldse ei vaata, sest kuna see ei saa olla muud kui positiivne, siis nullbaiti (kui see on olemas) lihtsalt ignoreeritakse.

Näide minu enda sertidega. Vana serdi puhul on mooduluse esimene väärtusbait 0xB9, mis bittidena väljendub 10111001. Nagu näha, on vasakpoolne bitt täidetud ja selleks, et seda numbrit mitte negatiivseks pöörata, on moodulus esitatud mitte B9:…, vaid 00:B9:… seega kõik klapib. Uue serdi puhul on esimene numbribait 0x97 ehk 10010111 (samuti on esimene bitt täidetud), kuid moodulus ei ole mitte 00:97:…, vaid 97:…. OpenSSL teisendab selle oma kõhuks ikkagi õigeks numbriks, õigemini ta lihtsalt ei arvesta esimese biti kui eriterminiga, aga vähem andestavad implementatsioonid, mis käsitlevad numbri kodeeringut korrektselt, loevad selle asemel välja ühe vigase negatiivse numbri (kuna esimene bitt läheb märgina kasutusse, siis muutub lisaks märgile ka terve number valeks)

Ja jätkuvalt – minu arvamus ei ole mitte kuidagi teaduslik ning selles võib esineda vigu kuna kõik vastavad teadmised olen saanud guugeldades ja oma loogikaga tuletades. Võrdluseks, täpselt samade uurimismeetoditega on teised inimesed jõudnud torusiili lastele sisse jootmiseni, nii et beware. Kui tead paremini või leiad jutus vea, siis anna sellest teada.

neljapäev, 1. oktoober 2015

Koodi deployment veebiserverisse

Vanadel headel aegadel oli koodi saatmine serverisse väga lihtne ning selleks võlusõnaks oli FTP. Näiteks töötasin umbes 10 aastat tagasi ühes veebiagentuuris, kus tegime PHP põhiseid veebilehti. Deployment nägi seal välja ülilihtne, nimelt kasutasime koodi kirjutamiseks Zend Editori, millel oli sisse ehitatud FTP tugi. Kui tahtsime midagi (live's) muuta, siis avasimegi editori, klikkisime ikoonil Open ja valisime FTP serveris asuva faili. Peale muudatuse tegemist klikkisime ikoonil Save, editor salvestas faili otse üle FTP serverisse ja oligi muudatus deploy'tud. Seejärel tuli brauseriaknas vajutada klahvile F5 ning muudatus saigi nähtavaks, mis saaks olla veel mugavam?

Paraku olid sellisel lähenemisel omad probleemid. Esiteks muidugi ei olnud ju selline uuendus kuidagi versioonitud. Kuna tegu oli lihtsalt faili üle kirjutamisega, siis muudatus kuskile kirja ei läinud ja seega ei olnud võimalik ka kergelt muudatust tagasi keerata. Kodukootud varunduslahenduseks oli lihtsalt aegajalt kõik serveris olevad failid FTP kaudu korraga alla laadida ja zip faili salvestada. Kui nüüd oli vaja mingeid muudatusi tagasi võtta, siis tuli vastav zip fail üles leida (eeldusel, et olid viitsinud/taibanud selle varukoopia üldse teha), lahti pakkida ja õige fail üles leida. Halval juhul tuli pöörduda hostingupakkuja poole ja neilt viimast backup'i lunida.

Aegajalt tuli ette ka race condition'it, juhul kui mitu arendajat sama faili kallal toimetasid ja siis üksteise muudatusi oma muudatustega üle salvestasid. Seda juhtus samas väga harva, kuna reeglina oli üks arendaja projekti kohta.

Minu totaalne lemmik oli salvestamine võrguprobleemide korral. Mida see üldse tähendab, et editor salvestab mingi faili FTP'sse? See tähendab, et kõigepealt avatakse FTP kaudu serveris fail kirjutamiseks ja seda nii, et faili pikkus lühendatakse 0 baidini ja seejärel siis kirjutatakse sellesse avatud faili selle faili uuenenud sisu. Mingist transaktsioonilisest faili kirjutamisest võis sellisel puhul vaid unistada. Praktikas juhtus tihti nii, et editor avas faili (ehk lühendas selle 0 baidini) kuid siis tekkis võrguprobleem ja Zend Editor viskas selle peale pikema jututa pildi taskusse. Tulemus? Serveris oli nüüd vana faili asemel 0 baidine fail ning lokaalses masinas polnud ka enam faili sisu saadaval, kuna editor oli kokku jooksnud.

Sarnane probleem tekkis tihti ka mahu ületamise tõttu. Veebihostingu paketid olid suhteliselt väikesed ja ikka juhtus, et klient oli laadinud sinna mingeid hiigelsuuri pilte ja pdf faile jne. nii et kettamaht oli täis saanud ja isegi üle läinud, sest FTP lubab viimase faili kettale kirjutada, isegi kui sellega läheb quota lõhki. Kui nüüd üritada nüüd sellises keskkonnas mingit faili muuta, siis faili avamine õnnestub (ehk siis lühendamine 0 baidiseks), aga sinna faili midagi kirjutada enam ei õnnestu, kuna quota on juba varasemalt lõhki. Kui selleks muudetavaks failiks juhtus olema index.php või siis rakenduse konfiguratsioonifail, siis oli tulemus teada – veebileht oli jälle "maas".

Tänapäeval on asjad tunduvalt muutunud, ainult poolearuline kasutab rakenduse üleslaadimiseks serverisse FTP'd ja seda kasvõi juba turvalisuse tõttu (ka FTPS ei pruugi olla turvaline, kuna vaikimisi on krüpteeeritud ainult command channel ehk see, kustkaudu liiguvad paroolid, aga mitte data channel, kustkaudu liiguvad failid). Võimalusi on nüüd igasuguseid, tutvustaksin lähemalt poor-man herokut ehk git'i kaudu deploy'mist.

Eeldused:
  • Meie rakendus (selles näites tavaline PHP baasil toimiv veebileht) kasutab versioonihalduseks git'i
  • Olemas on ssh ligipääs serverisse (sama kasutajana, kelle õigustes peavad olema rakenduse failid)

Samm 1. Seadista remote repository

Loo serveris repo kaust (sõltuvalt asukohast võib olla vajalik teha seda root kasutaja õigustes), suvaline asukoht kõlbab, aga näites teeme selle asukohta /var/opt

cd /var/opt
mkdir webapp.git
cd webapp.git
git init --bare

Selle tagajärjena on meil olemas täiesti tühi git repo asukohas /var/opt/webapp.git.

Samm 2. Update hook

Selle jaoks, et taolisesse tühja reposse millegi saatmine ka midagi reaalselt muudaks, seadistame update sündmuse tegevuse, milleks on bash skript asukohas hooks/update.

cd /var/opt/webapp.git/hooks
nano update

Avanenud tekstitoimetisse võib kopeerida järgmise failisisu (eeldusel, et /var/www/webapp/htdocs on kaust, kus hakkavad asuma rakenduse failid)

#!/bin/bash
GIT_WORK_TREE=/var/www/webapp/htdocs git checkout "$3" -f

Järgmiseks tuleks anda sellele failile käivitusõigused

chmod +x update

Nüüd tuleks jälgida, et rakenduse failide kaust eksisteerib ja et kõik failiõigused on paigas

mkdir -p /var/www/webapp/htdocs
chown www-data:www-data /var/www/webapp
chown -R www-data:www-data /var/www/webapp/
chown www-data:www-data /var/opt/webapp.git
chown -R www-data:www-data /var/opt/webapp.git/

Ja sellega ongi server seadistatud.

Samm 3. Lokaalne seadistus

Kohalikus git koodirepos, kus asuvad siis rakenduse failid, tuleks lisada uus git remote asukoht, tavaliselt on selle nimeks origin, kuid deploy jaoks kasutame hoopis nimetust production.

git remote add production www-data@example.com:/var/opt/webapp.git

www-data on siis see kasutaja kelle õiguses serveris toimetame ning example.com on ssh serveri hostname.

NB! Tavaline "origin" remote asukoht jääb endiselt alles kuna git hajuslahendus, nii jääb origin suunama koodihoidlasse ja production veebiserverisse. Lisaks võib teha veel staging vmt.

Samm 4. Deploy!

Nüüd ongi kõik seadistused tehtud ja edasi ei ole muud, kui muudatusi deploy'ma hakata. Iga kord kui oled uuendanud koodi ja selle ära commit'inud, võid jooksutada käsu

git push production master

kus master on siis aktiivne branch. Git laeb muudatused remote reposse, seal käivitub update hook, mis omakorda (eeldusel et commit õnnestub), kopeerib kõik vajalikud failid veebifailide kausta.

Profit!


Tagasi Bloggeris

Tüdinesin ära ise oma blogi majutamisest tuleneva tüliga ja kolisin Bloggerisse tagasi. Vahepealsed postitused läksid kahjuks kaduma, osa on õnneks loetav veel siit. Konkreetselt oli probleemiks siis Ghost blogisüsteemi majutamine. Iga kord kui uuendasin serveris Node.js versiooni (hetkel on stable versiooniks v4.1.1) lõpetas Ghost töö. Heal juhul tuli lihtsalt sqlite dependency uuesti installida, halval juhul, peamiselt kui tegu oli Node põhiversiooni muudatusega (nagu näiteks nüüd 0.12 pealt uuendamine 4.1 versioonile), siis viskas Ghost üldse käpad püsti, et sqlite installimine pole võimalik ja tuleb oodata uuendust. Üsna frustreeriv. Igatahes, nüüd olen siis juurte juures tagasi. Blogger on kohati üsna totakas, aga see on kõige stabiilsem lahendus, mida ma tean. WordPress.com on mugavam, aga kõvasti aeglasem, Tumblr'is ei tööta jälle kommenteerimine, ise hostida midagi ma enam ei taha ja nii ma siia sattusingi.

kolmapäev, 29. september 2010

Progressist JavaScript põhise e-posti serveri kirjutamisel

Mõnda aega tagasi kirjutasin kuidas sain valmis POP3 protokolli implementatsiooni Javascriptis. Sain sellest katsetusest pisiku külge ja otsustasin proovida luua samas stiilis täiemahulist e-posti serveri tarkvara. Väga kaugele pole jõudnud, alustalade seadmine on palju aega ja mõtlemist nõudnud, aga tundub, et kõik on ületatav. Hetke progressi saab näha siit.

Kuna eri serverid (SMTP, POP3, IMAP) on üles ehitatud käsklus-vastus stiilis tekstipõhiste serveritena, lõin sarnaste situatsioonide jaoks serveri baasobjekti, mis sisaldab kõike toimimiseks vajalikku ning mida tuleb lihtsalt konkreetse serveri vajadustest lähtuvalt uute käsklustega täiendada. Näiteks POP3 server saab defineerida käskluse "STLS", aga SMTP hoopis "STARTTLS". Nimetasin selle serveri baasobjekti Request-Answer-Interface'ks ja selle source on nähtaval siin (faili lõpus on kommentaarina ka minimaalne implementatsioon). Täpsemat näiterakendust saab uurida failidest pop3.js ja smtp.js.

Hetke staatuseks on, et SMTP server suudab kirju vastu võtta ning töödelda täielikult läbi kirja päised. Järgmise sammuna on kavas siis kirja sisu töötlemine. Kuna kirja sisu võib olla väga suur (sõltuvalt manuste olemasolust ja suurusest) tuleb seda teha jupikaupa, mitte korraga ja see lisab ühe keerukusastme juurde. Kõige suurem probleem, Base64 dekodeerimine jupi kaupa on praeguseks lahendatud.

Süsteemist siis niipalju, et põhiosa on kirjutatud JavaScriptis (Node.JS), vähemalt üks moodul C's (node-iconv), kasutajate autoriseerimise andmed ja sessioonide andmed asuvad Redis andmebaasis, kirjade sisu ja meta-info läheb MongoDB andmebaasi ning manused MongoDB GridFS failihoidlasse. GridFS annab mugava võimaluse jagada faile suure hulga serverite vahel - selleks tuleb luua MongoDB klaster ning selles saab failide jupitamise ja kokkukogumisega GridFS juba kergelt hakkama. Samuti saab faili juurde salvestada suure hulga suvalist meta-infot. See on midagi, mida tavaline failisüsteem ei võimalda.

Kogu idee asjal on selles, et reeglina hoitakse e-posti originaalkujul (mime formaat) tekstifailides. Kas siis kogu postkast on ühes suures failis või siis on eri kirjad eraldi failides samas kataloogis. Selge on see, et taoline struktuur ei skaleeru ja on üldse ebaefektiivne (näiteks manused salvestatakse kettal Base64 kodeeringus, mis on kolmandiku võrra suurem, kui originaalmaht jne). Minu lahendus hoiaks süsteemselt siis kõiki andmeid neile sobivaimas hoidlas (Redis, MongoDB, GridFS) ning nende andmete põhjal pandaks alles vajadusel (klient üritab kirja alla laadida või tuleb see serverist välja saata) kokku standardne mime formaadis e-kirja dokument.

Selline struktuur annab ka meeletu eelise näiteks veebipõhise e-posti kliendi loomiseks - pole vaja keskenduda millelegi muule kui kasutajaliidesele, kogu info on programmi jaoks loetaval kujul andmebaasis juba olemas, midagi teisendada pole vaja.

laupäev, 11. september 2010

Base64 striimi parsimine

Kuna POP3 protokolli implementeerimine node.js platvormil õnnestus ootamatult hästi, proovisin katsetada ka maailmast kirjade vastuvõtmist SMTP protokolli abil. Ka see õnnestus üsnagi valutult (vähemalt see osa, mis protokolli puutub) - lisasin nimeserverisse MX kirje; kirjutasin lihtsa skripti mis kuulab porti 25 liiklust; skript tunnistas lihtsamaid vajaminevaid käske nagu HELO, DATA jne. Panin seejärel skripti tööle ja üritasin sellele Gmaili'ist kirja saata. Suureks üllatuseks töötas kõik väga kenasti.

Seega tuligi mõte teha valmis juba täismahuline e-maili server. Koos e-posti kontodega, kirjade saatmise ja vastuvõtmisega ning POP3 ja IMAP liidesega kliendi jaoks. Eks paista, kas sellest projektist ka midagi reaalselt välja tuleb, aga hetkel tundub et kõik vajalik on säärase lihtsama projekti jaoks olemas (st. et ei arvesta väga standardiväliste quirkide'ga jne).

Üheks esimeseks probleemiks tekkis kirja vastuvõtul manuste töötlemine. Manused on MIME formaadis kirjades lihtsustatult esitatud nii:

-----suvaline-unikaalne-ääre-tähis-ascii-tähdega+\r\n
Content-Type: text/plain; name="manus.zip"
Content-Disposition: attachment; filename="manus.zip"
Content-Transfer-Encoding: base64

pOb3RlczoNCg0KTmV2ZXIgaW1wbGVtZW50IGEgSlVNUCB0YWcgd2l0aG91dCBhIGNvcnJlc3Bv
bmRpbmcgQUQgdGFnLCBhcyB0aGlzIHdpbGwgcmVzdWx0IGluIG5vIGltcHJlc3Npb25zIG9yIGNs
aWNrcyBiZWluZyBjb3VudGVkIGZvciB0aGUgYXNzb2NpYXRlZCB0YW
[....]
-----suvaline-unikaalne-ääre-tähis-ascii-tähdega+\r\n

Kuna reeglina on manuseks mitte tekstifailid, vaid binaarsed failid, on kõikide baitide probleemivabaks transpordiks kasutusel base64 kodeering. Base64 kasutab vaid 64 võimalikku sümbolit, mis kõik on "prinditavad", mis tähendab et ühe "päris" baidi asemel (kaheksa bitti) saab ühe sümboliga edasi anda vaid 6 bitti (64 = 26).

Probleem tekib suurte manustega - juhul kui manus pole näiteks mitte 2 kB või 100 MB siis kogu selle faili korraga mällu lugemine ja seejärel base64->baitideks teisendamine kõlab üsna kahtlase väärtusega ideena. Seega tuleks teisendus teha juba faili sisselugemisel. Node.JS näiteks ei annagi kogu infot korraga edasi, vaid lõikab sissetuleva info umbkaudu 10 kB suurusteks juppideks.
socket.on("data", function(data){
    console.log(data); // data suurus ei ole suurem kui 10kB
});

Sellise umbmäärase pikkusega lõikude korral aga ei ole base64 dekodeerimine alati võimalik. Oluline on õigest sümbolist alustada ja õigest lõpetada, vastasel korral läheb bitijada nihkesse ja seetõttu tekivad ka baidid väga valed.

Kuidas seda olukorda siis lahendada, nii et saaks dekodeerida base64 andmestriimi?

Väga lihtsalt, kui algus on teada, saab sellest andmeid teisendada 4 baidiste lõikudena ning ülejääk jätta järgmise korrani.
var current = "";
socket.on("data", function(data){
    // NB! tegelikult on andmetüüp mitte string vaid Buffer!
    current += data;
    base64_decode(current.substr(0, current.length-current.length % 4));
    current = current.substr(-current + data.length % 4); // jääk
});

Juhul kui tegu oleks tavalise striimiga, siis piisaks ka määrangust, et striimi kodeeringuks on base64. MIME tüüpi kirja puhul aga on tegu ühe pika stringiga, kus kodeeringud vahelduvad vastavalt kontekstile. Seega tuleb ise jälgida mis andmetega parasjagu tegemist on.