Jos neke nedoumice
1. Da li treba obrađivati i Macintosh newline karakter (\r)? Pošto
ugrađene podrške za njega u JLex-u nema.
2. Da li je dovoljno ograničiti se samo na osnovni ASCII karakter
set (0-127) ili je potrebno uzeti u obzir prošireni, ili čak
unicode?. Ovo pitam pošto podrška u JLex-u za dotične izgleda da ne
radi baš najbolje (mada se nisam ni nešto preterano trudio da je
nateram da proradi - uključio sam odgovarajuću direktivu, podmetnuo
mu unicode fajl, ali je analizator pukao)
3. Slučaj 55qwert bi po pravilu uparivanja najdužeg izraza trebalo
da vrati sym.NUMBER sym.IDENT. Međutim, pošto sintaksno takva
konstrukcija nema smisla da li je bolje detektovati to u leksičkom
analizatoru kao grešku (što ne predstavlja nikakav problem) ili to
ipak treba ostaviti za sintaksni?
4. Vezano za testove koji ne prolaze... kako treba raspodeliti test
primere po tih 5 testova? Odnosno, u okviru jednog testa koliko
treba imati primera? Ja sam definisao četiri tipa grešaka, pošto
nema mnogo stvari koje ne prolaze analizator (ako se koristi ASCII
karakter set) ~ @ # ! $ & " : \ | _ ? se vraćaju kao neprepoznati
tokeni, ' kao otvoren navodnik '' kao prazan karakter, a '<tab>' kao
neprintabilni karakter (ima li još koji neprintabilni karakter koji
se može otkucati sa tastature?). Da li ja treba da ovih 15 slučajeva
samo rasporedim na tih 5 testova (3 po testu).
--
Pozdrav,
Andrija
- Follow-Ups:
- Re: Jos neke nedoumice
- From: "Nikola Mihajlovic" <alamothe@ptt.yu>
- unicode
- From: "Nikola Mihajlovic" <alamothe@ptt.yu>
- Re: Jos neke nedoumice
Previous by date: Symbol
Next by date: unicode
Previous by thread: Re: spojeni keywordi i takve kombinacije Next by thread: unicode
Previous by thread: Re: spojeni keywordi i takve kombinacije Next by thread: unicode