Ignore characters U+200c, U+200d (zero width non-joiner, zero width joiner). git-svn-id: https://espeak.svn.sourceforge.net/svnroot/espeak/trunk@224 d46cf337-b52f-0410-862d-fd96e6ae7743master
| @@ -43,7 +43,7 @@ _2M3 ke:tmillia:R2d | |||
| _0M4 billio: | |||
| _1M4 billio: | |||
| _2M4 ke:tbillio: | |||
| _dpt ||_!'Ege:s | |||
| _dpt ||Ege:s //Not need the pause before this word | |||
| _0Z1 tizEd // tenths | |||
| _0Z2 sa:zAd // hundredths | |||
| @@ -415,11 +415,11 @@ ny En^ | |||
| / pER2 $max3 | |||
| = EJEnlY: $max3 | |||
| # kEt:Y:SkER2Est $max3 | |||
| @ kukAts | |||
| & e:S | |||
| @ kukAts $max3 | |||
| & e:S $max3 | |||
| € EuR2o | |||
| ¶ bEkEzde:S | |||
| § pAR2AgR2AfuS | |||
| § s'AkAs | |||
| ~ tildE | |||
| ° fokjEl | |||
| Ft foR2int | |||
| @@ -429,21 +429,21 @@ Ft foR2int | |||
| _, vEss2Y: | |||
| _; pontoSvEss2Y: | |||
| _: kEt:Y:Spont | |||
| _! fElkia:lto: | |||
| _? ke:R2dY: | |||
| _- kYtY:jEl $max3 | |||
| __ Ala:hu:za:S | |||
| _! fElkia:lto:jEl | |||
| _? ke:R2dY:jEl | |||
| _- m'inus $max3 | |||
| __ Ala:hu:za:S $max3 | |||
| _' ApostR2o:f | |||
| _– nAJkYtY: | |||
| _— kviR2tmi:nus | |||
| _" ide:zY: | |||
| _( za:R2o: | |||
| _) za:R2o: | |||
| _[ s'YglEtES||z'a:R2o: | |||
| _] s'YglEtES||z'a:R2o: | |||
| _{ k'AptSoS||z'a:R2o: | |||
| _} k'AptSoS||z'a:R2o: | |||
| _… ha:R2_mASpont | |||
| _" ide:zY:jEl $max3 | |||
| _( b'Alza:R2o:jEl $max3 | |||
| _) j'obbza:R2o:jEl $max3 | |||
| _[ n^'ito:sYglEtES $max3 | |||
| _] z'a:R2o:sYglEtES $max3 | |||
| _{ k'EzdY:kAptSoS $max3 | |||
| _} v'e:gkAptSoS $max3 | |||
| _… pontpontpont $max3 | |||
| _• di:spont | |||
| @@ -165,7 +165,10 @@ _) javítsd jAvi:tSd | |||
| k k | |||
| kk k: | |||
| kk (C kk | |||
| _) köz kYz | |||
| _) köztársaság k'Ysta:R2SASa:g | |||
| _) központ k'Yspont | |||
| _) köz kYz | |||
| _) község kYSSe:g | |||
| _) készség ke:SSe:g | |||
| _) kétség ke:tS:e:g | |||
| @@ -340,7 +343,9 @@ szöve) ts (ég tS: | |||
| romlo) tts tS: | |||
| á) t (sor t | |||
| á) t (sé t | |||
| ne) t (c t | |||
| ne) t (se t | |||
| ne) t (szo t | |||
| lehe) ts (ég tS: | |||
| tehe) ts (ég tS: | |||
| @@ -395,9 +400,11 @@ bi) z (tons s | |||
| bi) z (tos s | |||
| bron) z (sz z | |||
| e) z (t s | |||
| ho) z (ta s | |||
| ho) z (tá s | |||
| inté) z (ked s | |||
| költö) z (köd s | |||
| kö) z (pont s | |||
| kö) z (társaság s | |||
| lefeje) z (te s | |||
| lefeje) z (ték s | |||
| pén) z (tár s | |||
| @@ -70,6 +70,12 @@ static const char *punct_close = ")]}>;'\""; // always pitch fall unless follow | |||
| static const char *tone_punct_on = "\0016T"; // add reverberation, lower pitch | |||
| static const char *tone_punct_off = "\001T"; | |||
| // ignore these characters | |||
| static const unsigned short chars_ignore[] = { | |||
| 0x200c, // zero width non-joiner | |||
| 0x200d, // zero width joiner | |||
| 0 }; | |||
| // punctuations symbols that can end a clause | |||
| static const unsigned short punct_chars[] = {',','.','?','!',':',';', | |||
| 0x2013, // en-dash | |||
| @@ -2190,6 +2196,12 @@ f_input = f_in; // for GetC etc | |||
| c2 = ' '; | |||
| } | |||
| if(lookupwchar(chars_ignore,c1)) | |||
| { | |||
| // ignore this character (eg. zero-width-non-joiner U+200C) | |||
| continue; | |||
| } | |||
| if(iswspace(c1)) | |||
| { | |||
| char *p_word; | |||