Ignore characters U+200c, U+200d (zero width non-joiner, zero width joiner). git-svn-id: https://espeak.svn.sourceforge.net/svnroot/espeak/trunk@224 d46cf337-b52f-0410-862d-fd96e6ae7743master
@@ -43,7 +43,7 @@ _2M3 ke:tmillia:R2d | |||
_0M4 billio: | |||
_1M4 billio: | |||
_2M4 ke:tbillio: | |||
_dpt ||_!'Ege:s | |||
_dpt ||Ege:s //Not need the pause before this word | |||
_0Z1 tizEd // tenths | |||
_0Z2 sa:zAd // hundredths | |||
@@ -415,11 +415,11 @@ ny En^ | |||
/ pER2 $max3 | |||
= EJEnlY: $max3 | |||
# kEt:Y:SkER2Est $max3 | |||
@ kukAts | |||
& e:S | |||
@ kukAts $max3 | |||
& e:S $max3 | |||
€ EuR2o | |||
¶ bEkEzde:S | |||
§ pAR2AgR2AfuS | |||
§ s'AkAs | |||
~ tildE | |||
° fokjEl | |||
Ft foR2int | |||
@@ -429,21 +429,21 @@ Ft foR2int | |||
_, vEss2Y: | |||
_; pontoSvEss2Y: | |||
_: kEt:Y:Spont | |||
_! fElkia:lto: | |||
_? ke:R2dY: | |||
_- kYtY:jEl $max3 | |||
__ Ala:hu:za:S | |||
_! fElkia:lto:jEl | |||
_? ke:R2dY:jEl | |||
_- m'inus $max3 | |||
__ Ala:hu:za:S $max3 | |||
_' ApostR2o:f | |||
_– nAJkYtY: | |||
_— kviR2tmi:nus | |||
_" ide:zY: | |||
_( za:R2o: | |||
_) za:R2o: | |||
_[ s'YglEtES||z'a:R2o: | |||
_] s'YglEtES||z'a:R2o: | |||
_{ k'AptSoS||z'a:R2o: | |||
_} k'AptSoS||z'a:R2o: | |||
_… ha:R2_mASpont | |||
_" ide:zY:jEl $max3 | |||
_( b'Alza:R2o:jEl $max3 | |||
_) j'obbza:R2o:jEl $max3 | |||
_[ n^'ito:sYglEtES $max3 | |||
_] z'a:R2o:sYglEtES $max3 | |||
_{ k'EzdY:kAptSoS $max3 | |||
_} v'e:gkAptSoS $max3 | |||
_… pontpontpont $max3 | |||
_• di:spont | |||
@@ -165,7 +165,10 @@ _) javítsd jAvi:tSd | |||
k k | |||
kk k: | |||
kk (C kk | |||
_) köz kYz | |||
_) köztársaság k'Ysta:R2SASa:g | |||
_) központ k'Yspont | |||
_) köz kYz | |||
_) község kYSSe:g | |||
_) készség ke:SSe:g | |||
_) kétség ke:tS:e:g | |||
@@ -340,7 +343,9 @@ szöve) ts (ég tS: | |||
romlo) tts tS: | |||
á) t (sor t | |||
á) t (sé t | |||
ne) t (c t | |||
ne) t (se t | |||
ne) t (szo t | |||
lehe) ts (ég tS: | |||
tehe) ts (ég tS: | |||
@@ -395,9 +400,11 @@ bi) z (tons s | |||
bi) z (tos s | |||
bron) z (sz z | |||
e) z (t s | |||
ho) z (ta s | |||
ho) z (tá s | |||
inté) z (ked s | |||
költö) z (köd s | |||
kö) z (pont s | |||
kö) z (társaság s | |||
lefeje) z (te s | |||
lefeje) z (ték s | |||
pén) z (tár s |
@@ -70,6 +70,12 @@ static const char *punct_close = ")]}>;'\""; // always pitch fall unless follow | |||
static const char *tone_punct_on = "\0016T"; // add reverberation, lower pitch | |||
static const char *tone_punct_off = "\001T"; | |||
// ignore these characters | |||
static const unsigned short chars_ignore[] = { | |||
0x200c, // zero width non-joiner | |||
0x200d, // zero width joiner | |||
0 }; | |||
// punctuations symbols that can end a clause | |||
static const unsigned short punct_chars[] = {',','.','?','!',':',';', | |||
0x2013, // en-dash | |||
@@ -2190,6 +2196,12 @@ f_input = f_in; // for GetC etc | |||
c2 = ' '; | |||
} | |||
if(lookupwchar(chars_ignore,c1)) | |||
{ | |||
// ignore this character (eg. zero-width-non-joiner U+200C) | |||
continue; | |||
} | |||
if(iswspace(c1)) | |||
{ | |||
char *p_word; |