Browse Source

[1.46.01]

Improve error detection in *_list files.

Lang=hu, remove feature to unstress the second of two capitalized words at end of clause.


git-svn-id: https://espeak.svn.sourceforge.net/svnroot/espeak/trunk@277 d46cf337-b52f-0410-862d-fd96e6ae7743
master
jonsd 13 years ago
parent
commit
0617cc4750

+ 35
- 5
dictsource/af_list View File

@@ -12,6 +12,7 @@
// abbreviations
(http ://) hA:te@te@p'e@_
adv atfuk'A:t
anc $abbrev
atkv $abbrev
bpk b@p&rk
bv beIf'o@rbe@lt $dot
@@ -259,6 +260,7 @@ denemarke de@n@mark@
djakarta dZak'arta
doebaai $2
duitswes dYytsv'Es
eastgate _^_EN
efese e@f@s@
ermelo &rm@lo@
florida flOrida
@@ -291,6 +293,7 @@ kanaän kA:nA:an
kaïro ka_'iru
kameroen kam@r'un
kenia ki:nia
kentucky _^_EN
kimberley kimb@rli
kinshasa kinS'A:sa
kongo kONgu
@@ -311,6 +314,7 @@ majuba maj'uba
malmesbury mA:msb@ri
maputo map'u:tu
mauritius mOr'iSjWs
melbourne _^_EN
milaan $2
mesopotamië mEsuput'A:mi@
miami _^_EN
@@ -340,6 +344,7 @@ rhône _^_FR
richardsbaai ritS@dsb'AI
riviersonderend r@fi:rsOn@r_'Ent
robertson _^_EN
saldanha sald'ana
salvador salvadO:r
santiago santi;'A:gu
secunda s@kunda
@@ -408,6 +413,7 @@ athene at'e@n@
barbara bA:b@ra
basson $2
bea bi:ja
beatrix bi;'A:tr@ks
belcher _^_EN
benade b@nA:di
benjamin bEndZ@m@n
@@ -431,8 +437,9 @@ brian _^_EN
bredenkamp bre@d@nkamp
bruwer bruw'&:r
brünhilde _^_DE
burton _^_EN
caesar siz@r
cameron _^_EN
cameron _^_EN
carl kA:r@L
carlyle _^_EN
carol _^_EN
@@ -442,6 +449,7 @@ cecil sEs@l
cecile s@si:l
cecilia s@si:lia
charl SA:l
charlene SA:l'i:n
charles _^_EN
charlie tSA:li
charmaine SA:m'eI:n
@@ -449,8 +457,10 @@ chaucer _^_EN
chopin S%OpA~
claire _^_EN
clark _^_EN
cohen _^_EN
conradie $2
chris krIs
chrisjan krIsjan
christo krIstu
christof krIstOf
christoffel kr@stOf@l
@@ -465,6 +475,7 @@ collins _^_EN
cronjé krOnj'e@
cussons kas@ns
cynthia _^_EN
cyril _^_EN
dalene dal'e@n
danielle dani;'&l
darwin _^_EN
@@ -533,8 +544,10 @@ gerhard x2&rart
gerhardus $2
gertie gI:ti
gertruida $2
geyer x2eI@r
gilbert _^_EN
gloria glO:ria
goebbels _^_DE
gordon _^_EN
grange x2rA:nsi
gregory _^_EN
@@ -557,6 +570,7 @@ herklaas $1
herkules $1
hewitt _^_EN
hilde hild@
howard _^_EN
ibsen ibs@n
ilse 'ilz@
ingrid iNgr@d
@@ -676,6 +690,7 @@ nelson _^_EN
nicholas _^_EN
niklaas niklA:s
oedipus o@dipWs
ogden _^_EN
olga Olga
ontong OntON
patrick _^_EN
@@ -687,6 +702,7 @@ petrus pe@trWs
phoebe fi:bi
picasso pik'asu
pinokkio pin'Oki;u
presley prEsli
pretorius pr@to@riWs
prometheus prum'e@ti;Ws
pythagoras pit'A:x2o@ras
@@ -697,6 +713,7 @@ rademeyer rA:d@meI@r
rall rA:l
raymond _^_EN
rebekka r@bEka
reinet r@nEt
reinette r@nEt
renette r@nEt
renée r@neI
@@ -768,6 +785,8 @@ violet _^_EN $capital
visagie fis'A:x2i
volschenk fOlskENk
watson _^_EN
wayne _^_EN
wendy _^_EN
william _^_EN
wilson _^_EN
yolande jul'and@
@@ -797,6 +816,7 @@ zuma zu:ma
absa absa
alibama $3
antares $2
beatles _^_EN
boeing _^_EN
checkers tSEk@rs
chevrolet _^_FR
@@ -997,6 +1017,7 @@ animus animus
apoteose apOti;'o@s@
arrogansie arux2'ansi
as't as@t $u
asafstand as_afstant
asof asOf
asook %as_o@k
aspris $2
@@ -1030,7 +1051,8 @@ bourgeois _^_FR
bourgeoisie _^_FR
breyani brij'A:ni
briewemes briv@mEs
bêretyd b&:r@teIt
buiteperd bYyt@p&:rt
bêretyd b&:r@teIt

cabernet kab@rn'eI
camembert kam@mb'&:r
@@ -1073,6 +1095,7 @@ disleksie $2
divan div'an
doktore $2
doyen dO:j'En
drinkebroer drInk@bru:r
droomster dro@mst&r
dubbelken dWb@lkEn
dunnes dWn@s
@@ -1121,12 +1144,13 @@ geen x2e@n
geldelike x2&ld@l@k@
gelerendheid x2@le@r@ntheIt
genade $2
gener x2e@n@r
generlei x2e@n@rleI
gener x2e@n@r
generlei x2e@n@rleI
genesis x2e@n@s@s
//gesamentlik x2@sA:m@ntl@k
gentleman _^_EN
germolene dZI:m@l'i:n
gevallene x2@fal@n@
gewellys x2e@v@lleIs
gladiator x2ladi'A:tOr
globale x2lo@b'A:l@
@@ -1142,6 +1166,7 @@ handtertjie hant&:rci
hanou hA:n@U
hardop hart?Op
hartster hartst&r
heelbo he@lbo@
heeltemal he@lt@mal
heimat haImat
hek h&k
@@ -1349,6 +1374,7 @@ plaasjaap plA:sjA:p
plasenta plas'Enta
poinsettia pOIns'Etia
pond po~nt
poniepers po@nip&rs
potpourri pOtpur'i
primate $2
profetes prOf@t'Es
@@ -1378,7 +1404,6 @@ salute sal'yt@
samelewing sA:m@l,e@v@N
sanhedrin sanh'e@dr@n
sangemeenskap sanx2@me@nskap
sedeer s@de@r
sedertdien $3
sektore $2
sinagoge s@n@x2o@x2@
@@ -1391,6 +1416,7 @@ skollienes skOlin,Es
skuldelas skWld@las
s'n s@n $u
slaparm slap_ar@-m
sluitewenaar slYyt_e@v@nA:r
sneeubaleffek sniubal_if,Ek
sopas $2
spaghetti sp%agEt%i
@@ -1434,6 +1460,7 @@ totale tut'A:l@
totsiens $2
tragiek trax2'ik
trapesium trap'e@si:Wm
trapsuutjies $2
tsoenami tsun'A:mi

uitdaging YydA:x2@N
@@ -1471,6 +1498,7 @@ verste f&rst@
verte f&rt@
verweg f&:rv&x2
via via
viva viva
voelentheid ful@ntheIt
volheid $1
volpunte $1
@@ -1491,10 +1519,12 @@ vorige fo@r@x2@
voëlent fo@@l_Ent
vraprys frA:preIs
vrek fr&k
vroeërig fru:@r@x2
vu _^_FR

waarskynlik $2
waarskynlike $2
wakis $1
watwo vatvo@
watwou vatv@U
weergalm $2

+ 37
- 12
dictsource/af_rules View File

@@ -1,4 +1,4 @@
//maintainer: Willem van der Walt
//maintainer: Willem van der Walt
// email: [email protected]
// tel: +27 12 8413996
// Meraka Institute, CSIR
@@ -171,7 +171,7 @@
_) a (pC %a // april/apteek/apteker and compounds
_) app (A ap // restore default stress: appel and compounds
_) appel (ko@ %ap@l // move default stress: appelkoos/-konfyt/appelkose
appe (llief %ap@ // move default stress: appelliefie/-konfyt, etc.
appe (llA %ap@ // move default stress: appelliefie/-konfyt, etc./appellant/appelleer
arabe (sk %ar%abE // fix stress and vowel sounds: arabesk/-e
area A:ria // are0+a/kiesareas
arena (K+ %are@n%a // fix stress and vowel sounds: arena/-s and any compounds
@@ -188,6 +188,7 @@
assu (ran %as%W // move stress: assuransie and compounds
au aU // ??
atten (d at@n // compounds ending in bevattend etc.
attest (A %at%Est // fix stress: attesterend/-e
at (le %at // atleet and compounds
atle (tiek %atl@ // atletiek and compounds
_p) ad (A at //words starting with pad
@@ -394,7 +395,9 @@
g) an (_ _^_EN //if it ends in gan it is English
C) anette (_ %anEt // Janette/Sanette
ano (rak an%u // fix stress and vowel sounds: anorak/-ke
ano (reksi %an%u // fix stress and o sound: anoreksie(leier...)
ano (rekC %an%u // fix stress and o sound: anoreksie(leier...)/anorekties/-e
anoma (lie %an%um%a // fix stress and vowel sounds: anomalie/-ë
anomalies %an%umA:lis // fix stress and vowel sounds: anomalies/-e
ansjovi anS''o@f@ // fix stress and o sound: ansjovis/-se/-smeer
an (tjie aIN
_) ana (C ,ana // words starting with ana starts destressed
@@ -628,6 +631,7 @@
bekk (+ b&k // exception to be (C%+ bE
bek (_ b&k // exception to be (C%+ bE
bek (h b&k // e sound: compounds of bek fld. by h: haasbekhond/skewebekhuisies
bek (s b&k // fix e sound in compounds like vuilbekspeurder/-s
beken b@kEn // 2nd e sound: oorbekend/welbekende
@) beker (_ be@k@r // compounds ending with -beker
@) beker (tjie be@k@r // compounds ending in -bekertjie
@@ -1243,6 +1247,7 @@
help) ers (_ @rs // but: mede-/nood-/portuur-/tuis-/uithelpers
np) ers (_ &rs // fix e sound: inpers/lemoenpers/lusernpers/wynpers
rp) ers (_ &rs // fix e sound: inmekaarpers/kopieerpers/silinderpers/Voortrekkerpers
dorp) ers (_ @rs // but dorpers
werp) ers (_ @rs // but bomwerpers/ontwerpers, etc.
gk) ers &:rs // fix e sound: nagkers/gedenkdagkers
tk) ers &:rs // fix e sound: dinamietkers/opsitkers/vetkerse
@@ -1309,6 +1314,7 @@
ewighei (d e@v@x2,eI // ewigheid/hewigheid/stewigheid/ewigheidjie
C) e (winkel @ // fix e sound: juwelewinkel and similar
evolus EvOl'ys // evolusie/devolusie/revolusie
ewo (lusi %Ev%O // alternative form: ewolusie
C) ewy (C @veI // alewyn/compounds of brandewyn/sekondewyser
_op) e (n @
@C) er (tyd @r // tegelykertyd/kindertyd/indertyd, but spertyd
@@ -1345,7 +1351,7 @@
_mens) e @ //mense at start of compounds
_mens) e (k @ //force correct behaviour before k
@kom) e (ns_ @ //fix words ending in komens
@C) e (wa_ @ // goederewa/kolewa/ossewa/troepewa
@C) e (wa_ @ // goederewa/kolewa/troepewa
Ab) e (wa @ //bewaking/bewaring in compounds polisiebewaking
@C) e (waen @ // plurals and diminutives of some of the above
@C) ewerk @v&rk // fix e sounds: aardewerk/dradewerk/klerkewerk/naaldewerk/soldatewerk
@@ -1570,6 +1576,7 @@
fla (grant fl%a // shorten 1st a and move default stress: flagrant/-e
flambo (jant fl%amb%u // move default stress: flambojant/-e/-heid
fleb (otomie fl%Eb // fix stress and e sound: flebotomie
_) flikt (erA fl@kt // fix stress and e sound: konflikterend/-e
flo (re fl%u // move default stress, correct o sound: florerend
flori (ssA fl%o@r@ // move default stress: florissant/-e
flu (we fl%y // move default stress: fluweel/fluwele and compounds
@@ -1606,7 +1613,7 @@
@) ful (_ _^_EN // words ending in -ful are English
fung (e f%WNx2 // fungeer/fungerende/fungering
fungus fWNgWs_ // fix g sound: fungus and 2nd us sound in compounds: fungusinfeksie
fusi (llade f%ys@ // move default stress: fusillade/-s
fusi (llA f%ys@ // move default stress: fusillade/-s/(ge)fusilleer
_) fu (ti f%y // move default stress: futiel/futiele
fynge (C feInx2@ // fyngebreekte/-kou/-kap/-maalde
fynge (voeli f%eInx2@ // move default stress: fyngevoelig/-e/-heid
@@ -1721,6 +1728,7 @@
genit (ieC x2e@n@t // fix stress and vowel sounds: genetief/-tiewe
genre Z'A~nr@ //genre and compounds
_) gens (C x2E:ns // fix stress and e sound: gensbok and compounds
genus x2e@nWs // fix stress and e sound: genus/genusnaam/plantgenus and similar
_) geo (s x2%i%u // fix stress and -eo- sound: geosentries/geosfeer/geoskoop/geostaties
_) ge (ossP2 x2@ // but ge- prefix: geossilleer/geossifiseer, etc.
ni) ge (ri x2'e@ //nigeriese etc.
@@ -2417,6 +2425,7 @@
_) ka (ste@ k%a // move default stress: kasteel/kastele and compounds
ka (sty k%a // move default stress: kasty/-der/-ding
kasse (t k%asE // fix stress and e sound: kasset/-te and compounds
kaster (olie kast@r_ // fix stress, insert pause: kasterolie(bottel...)
ka (strol k%a // move default stress: kastrol/-le and compounds
_) kata ,kata
ka (tarsi k%a // fix stress: katarsis/-se and compounds
@@ -2558,9 +2567,10 @@
lande (ry l%and@ // move default stress: landerye/compounds of landery-
_) land (_rover _^_EN
_) lang (d@@ l%aN // langdradig/langdurig and their derivitivs
 _) lange (CA laN@ // e sound: langelaas/Langeberge
_) lange (CA laN@ // e sound: langelaas/Langeberge
lang (werp l%aN // move default stress: langwerpig/-e/-heid
lank (moe l%aNk // move default stress: lankmoedig/-e/-heid
lano (lien l%an%u // fix stress and vowel sounds: lanolien(olie ...)
_) lan (sA l%an // move default stress: lanset/-te/lanseer/-ering/lansier
_) lapa (K lA:pa // fix words like lapakombuis
lapar (otomi l%ap%ar // fix stress and a sounds: laparotomie
@@ -2667,6 +2677,7 @@
// mc _^_EN // The mac names does not work
CA) mme (C m@
CA) mme (tjie mi // lemmetjie/stemmetjie and similar
@) mn (_ _^_EN // words ending in -mn are English: damn/autumn/column...
@) mpel (A mp@l // bewimpeling/dompelaar/strompeling
murmel mWrm@l // fix e sound in compounds like murmelgeluid
museum m%ysY@m // move default stress
@@ -2704,11 +2715,12 @@
ma (kriel m%a // move default stress: makriel/-e
maksi (ma@ m%aks%i // move default stress: maksimaal/-male
&) mal (_S3 mal
mala (giet m%al%a // fix stress and a sounds: malagiet and compounds
mala (giet m%al%a // fix stress and a sounds: malagiet and compounds
malaria mal'A:ria
mal (gas m%al // move default stress: Malgas/-se/-sies
malles (_ mal@s // fix e sound: (mags)malles and similar
_) malte (sA m%alte@ // move default stress and fix e sound: maltese/maltesies
malva (K malf%a // shorten a sound: malva(poeding)/stoepmalva
mam (poer m%am // move default stress: mampoer and compounds
man (da m%an //mandaat and compounds
mando (lien m%and%u // fix stress and o sound: mandolien and compounds
@@ -3061,6 +3073,7 @@
no (stalgie n%O // stress on 2nd slb.: nostalgies
notari (A n%o@t%ar%i; // fix stress: notarieel/notariële
note (b no@t@ // fix e sound: notebalk/-e/-bank/-beurs
not (ering n%ut // fix stress and o sound: notering(sbeampte...)
notule (K n%utyl@ // fix stress and vowel sounds: notule and compounds
novelle n%uf&l@ // move default stress and fix o sound: novelle/-s and compounds
november n%o@fEmb@r // fix 1st e sound and stress: November and compounds
@@ -3248,6 +3261,7 @@
ort (osko %Ort // fix 2nd o sound and stress: ortoskopies/-e
ose (a %o@S%i // fix stress and s and e sounds: oseaan/oseane and compounds
o (soon %O // fix stress and 1st o sound: osoon(laag) and similar
ossewa (C Os@vA: // fix a sound in compounds: ossewabrandwag/-drywer/-trek
ossill (e %Os@l // move default stress: (ge)ossilleer and compounds
ossille (CA %Os@le@ // fix stress and vowel sounds: ossillerend/-e/ossillering
@) oties 'o@tis // antibioties/eksoties/eroties/neuroties
@@ -3559,6 +3573,7 @@
por (stok pOr // restore default stress: porstok/-ke
portu (ge p%Ort%y // fix stress: Portugees/Portugese
_) pos (a pOs //posadres/posadministrasie
pos (advert p''Os_ // force stress on pos, insert pause: posadvertensie/-s
posisie p%uzis%i
_) post (K p'@Ust- //post where it means after
_) post (u p%Ost // move default stress: postuur/posture/postuum and compounds of postuur
@@ -3580,13 +3595,13 @@
puntener p%Wnt@ne@r // stress and 2nd e sound: puntenerig and derivatives
pu (pil p%y // move default stress: pupil/-le and compounds
puri (tein p%yr@ // fix stress and i sound: puritein/-e/-se
pêrel p&:r@l // fix e sound: pêrelig/-e
pêre (C p&:r@ // fix e sound: pêrelig/-e, pêredokter/-siekte

.group pa
_) paarl p&:r@L // Paarl/Paarlberg/Paarlvallei
_) padda (CA p''ada // fix stress and 2nd a sound: paddavis/paddaman, etc.
pa (godA p%a // fix stress and a sound: pagoda/pagode/-s
pajama p@dZ'A:ma //pajama and compounds
pajama p@dZA:m%a //pajama and compounds: (wol)pajama(broek)
pak (A pak? // pakesel/pakos/verpakafdeling
pakistan p%ak%istan //first a and stress
_) pa (kka p%a // move default stress: pakkaas/pakkase
@@ -3676,6 +3691,7 @@
ras) perde (_ p@rd@ //gerasperde and compounds
snip) perde (_ p@rd@ //words ending in snipperde
tem) perde (_ p@rd@ //words ending in temperde
perde (kar p&:rd@ // fix 2nd e sound: twee-/vierperdekar/tweewielperdekar, etc.
_) perd (r p&:rt // fix e and d sounds: perdry/-kringe/-kuns/-sport, etc.
@) pere (_ pe@r@ // compounds ending in pere indicating the fruit
p) pere (_ p@r@ // fix penultimate e sound: dappere
@@ -3695,7 +3711,7 @@
pe (rron p@ // move default stress and fix e sound: perron and derivatives
perske p&rsk@ // fix e sounds: perskeblatjang/-bloeisel/-brandewyn/-konfyt/gladdeperskes/geelpersketyd
r) peling (_ p@l@N //verwerpeling etc.
peloton pEl@t'On
peloton p%El@tOn // fix stress in compounds like vuurpeloton
permanen p&rman'En // permanent/e/permanensie
permit p@rm'It
per (seel p%&r // move default stress: perseel and compounds
@@ -3900,7 +3916,7 @@
regi (sseuC r@x2@ // fix stress and e sound: (film-/kuns-/mede-/musiek-/oorklankings-)regisseur/-sseuse
reg (ist r@x2 // registrasie/-nommer/register/bevolkingsregister
regle (ment r@x2l@ // fix stress and e sounds: reglement/-e and compounds
re (gulA r%E // fix e sound: regulasie/reguleer/regulering
regu (lA r%Ex2%y // fix e sound: regulasie/reguleer/regulering(sinstelling/-proses)
regverdig r&x2f'&rd@x2 // regverdig/onregverdige/regverdigheid - verwyder uit af_list
rekla (mA r@kla // fix e sound: reklamatories/-e/reklamasie
reklame r@klA:m@ // fix stress and e sounds: reklame and many compounds
@@ -4020,6 +4036,7 @@
sinteties s@nte@tis // sinteties/e/fotosinteties/-e
si (viel s@ // move default stress and fix i sound: siviel/-e
s (iën S
sis (tyn s@s // fix stress: systyns/-e
sitrus s'itr%Ws_ //i sound and stress in compounds

_) saam (P4 s'A:m // saamgepers/-de/saamgetel/saamgeêet/saampers
@@ -4241,6 +4258,7 @@
_) sebra se@bra // fix vowel sounds: sebra/-strepe; variant of zebra
_) se (dent s@ // fix stress and e sounds: sedent/-e
sede (ring s@de@ // fix stress and e sounds: sedering and compounds
sedeer s@de@r // fix stress and e sounds: (ge)sedeer(de)
_) se (doos s@ // fix stress and e sound: sedoos(wind)
se (ggA s& // fix e sound: niksseggend/-e
@) seko (no@ s_%Ek%u // fix e sound; default stress; insert short pause: bedryfs-landsekonomie/-s/-ekonoom
@@ -4300,6 +4318,7 @@
_) sen (tra@ s%En // exception to default stress rule: sentraal/sentrale
_) ser (e@ s@r // fix stress and 1st e sound: sereen/serene
sere (moni s%Er@ // seremonie/-meester/huwelikseremonie/seremonieel
sere (nade s%Er@ // fix stress and e sounds: serenade(sanger...)
_) se (ring s@ // fix stress and e sound: sering/-boom/-bloeisels, etc.
ser (sant s@r // move default stress: sersant and compounds
ser (vet s@r // servet and compounds, e.g. servetring
@@ -4356,6 +4375,7 @@
wor) stel st@l //worstel e sound in compounds
ste (laan st@ // fix e sound: eerste-/ag(t)stelaan
ste (land st@ // fix e sound: vasteland and several compounds
steler ste@l@r // fix e sound: (skaap)steler and similar
@) stel (iC st@l // eersteling/gunsteling/wellusteling/worsteling/eerstelig and compounds
&) stele (fo st&l@ // fix e sound in compounds: huis-/werkstelefoon/-fone
@) ste (llen st'& // belangstellendes/gerusstellend/regstellende/teleurstellend
@@ -4411,6 +4431,7 @@
@) straat (_S6t strA:t // Vermeulen/Maréstraat and similar
strab (otomi str%ab // fix stress and 1st o sound: strabotomie
straf (regte str%af // move default stress: strafregtelik/-e
_) strand (erC strant_ // fix d sound, insert pause: stranderf/stranderwe
strand (o strant_ // fix d sound and insert pause: strandoord/-e
strategie str%at@x2i // fix stress and vowel sounds: strategie and compounds
strategies str%ate@x2is // fix stress and vowel sounds: strategies/-e
@@ -4441,6 +4462,7 @@
@) talig t'A:l@x2 // Anderstalig/tweetalig
@) ta (lis t%a // shorten a sound: hospitalisasie/kapitalisme/katalisator and similar
tama (tie t%amA: // tamatie and compounds/kersietamaties, etc.
tamarisk t%am%arIsk // fix stress and a sounds: tamarisk/-e/tamariskboom/-bome
_) ta (mb t%a // tamboer and compounds/tambotie and compounds
tamboe (ryn t%amb%u // move default stress: tamboeryn/-e and compounds
tamele (tj t%am@lEi // fix stress and vowel sounds: tameletjie/-s
@@ -4536,6 +4558,7 @@
tug (A tWx2_ // fix u sound: (on)tugondersoek/-oortreding/-ordonnansie
tuiglik t'Yyx2l@k // stress: werktuiglik/sintuiglik/-e/-heid
tuin (ier t%Yyn // move default stress: tuinier and compounds
_) turbo (K t''Wrbo@_ // fix stress and o sound: turbo/turboaangedrewe/-generator/-krag...
turlington tW:l%iNt@n // Turlington/-reuk/-smaak
tussen tWs@n // tussenin/tussenbeide/tussenganger
tuur t'yr
@@ -4559,6 +4582,7 @@
teen (argu t''e@n // forse stress on 1st slb.: teenargument/-e/-asie
te (dom t@ // fix e sound: idiotedom and similar
teen (oorges t%e@n_ // move default stress: teenoorgestel/-d/-e
@) te (fie_ te@ // fix e sound: bulhond-/poedeltefie, etc.
@A) te (geC t@ // fix e sound: Hugenotegemeente/stategebou and similar compounds
@C) te (gn t& //tegniek/iese and friends
teiken teIk@n // fix e sound, split ng: teikengroep/-skiet and similar compounds
@@ -4656,7 +4680,7 @@
teltjie t@lki
@) tel (o t@l // hartelose/besluiteloos/gedagtelose
tendens t%Ende~ns // fix stress and e sounds: tendens/-e and compounds
&) tert (A@ t@rt // fix e sound: agtertoe/foltertuig/gietertuit/kilometertoelae/lastertaal/letterteken
&) ter (tA@ t@r // fix e sound: agtertoe/foltertuig/gietertuit/kilometertoelae/lastertaal/letterteken
&) tert (r t@rt // fix e sound: pleistertroffel/venstertralie/ystertralies/ystertrap
&s) tert (aan t&:rt // fix e sound: swa(w)elstertaandpak/-ke
&s) tert (e_ t&:rt // fix e sound: swa(w)elsterte/vissterte
@@ -4793,6 +4817,7 @@
uitspatlik %Yytspatl@k // move default stress: uitspatlik/-e/-heid
uitspreekl %Yytspre@kl // fix stress and avoid -lik suffix: onuitspreeklik/-e
uitstaan (C %YytstA:n // move default stress: uitstaande/onuitstaanbaar/-bare
uitstaan (r YytstA:n // restore default stress: uitstaanrots/-e/-rif/-riwwe
uit (steken %Yyt // move default stress
uit (spatt %Yyt // move default stress
uit (voerba %Yyt // move default stress: (on)uitvoerbaar/-bare/-baarheid

+ 6
- 1
dictsource/am_list View File

@@ -11,7 +11,7 @@ _3 s'ost
_4 '?arat
_5 '?ammyst
_6 s'yd:yst
_7 s'abat
_7 s'@bat
_8 s'ymynt
_9 z'@t`@n^
_10 '?assyr
@@ -33,3 +33,8 @@ _0M3 b'ilyon
_dpt _n'@t`yb

% p@rs'@nt
። ?'aratyn@t`yb
፣ n'@t`@las@r@z
፤ d'yryBys@r@z
፧ t`'yjak`emylykyt


+ 41
- 29
dictsource/dict_phonemes View File

@@ -1,7 +1,7 @@
Phonemes which are used in the *_rules and *_list files


Dictionary af_dict 2011-05-04
Dictionary af_dict 2011-11-22

& &: 3: @ @- @L @U a
A: aI AI aU A~ E e: e@
@@ -66,10 +66,10 @@ R3 s S t T tS v w
x Z


Dictionary hu_dict 2011-10-24
Dictionary hu_dict 2011-11-22

a A a: E e: i i: o
o: u u: Y y y: Y:
a A a: e E e: i i:
o o: u u: Y y y: Y:

- : b c C d dZ dz
f g h j J k l l^
@@ -102,7 +102,7 @@ p Q r R s s; t T
ts v x z


Dictionary en_dict 2011-10-24
Dictionary en_dict 2011-11-22

0 3 3: @ @- @2 @5 @L
a a# A: A@ aa aI aI3 aI@
@@ -129,15 +129,15 @@ s S t T tS ts v w
x z Z


Dictionary es_dict 2011-05-15
Dictionary es_dict 2011-11-22

a aI aU e E eI eU i
o O oI u

* ** : b B d D f
g j J J^ k l m n
N n^ p Q R R2 s S
t T tS v v# w x z
: b B d D f g j
J J^ k l m n N n^
p Q r R R2 s S t
T tS w x z


Dictionary fi_dict 2011-10-14
@@ -152,11 +152,11 @@ l m n N p r R s
S s2 t v w Z


Dictionary fr_dict 2011-08-14
Dictionary fr_dict 2011-11-15

@ @- a A~ e E E: E~
i I o O O~ u u: w
W W~ y Y
@ @- a a- A~ e E e-
E: E~ i I o O O~ u
u: w W W~ y Y y-

: b d dZ f g h j
k l m n N n2 n^ p
@@ -202,7 +202,7 @@ q r r. s S s. t T
t. th th. v w x z


Dictionary ta_dict 2011-09-13
Dictionary ta_dict 2011-11-19

a a: aI aU e E e: i
I i: o o: u U u2 u:
@@ -327,7 +327,7 @@ k l m n p R s S
t tS v w x


Dictionary nl_dict 2011-10-14
Dictionary nl_dict 2011-11-22

8 @ @- a A a: A~ e
E e# E2 e: EI eU i I
@@ -525,14 +525,14 @@ l m n N p r s t
tS v w z


Dictionary am_dict 2011-08-26
Dictionary am_dict 2011-11-22

@ a e i o u y

: ? b d dZ f g h
j k k` l m n N n^
p p` r s S t t` tS
tS` v w x z Z
: ? b B d dZ f g
h j k k` l m n N
n^ p p` r s S t t`
tS tS` v w x z Z


Dictionary ml_dict 2011-04-25
@@ -751,17 +751,17 @@ N# n. n.# n^ n^# p r s
S t t. th tS v w z


Dictionary et_dict 2011-07-01
Dictionary et_dict 2011-11-16

& &: &i 8 8: 8u a A1
a: e E1 e: i I I1 i1
i: o O1 o: u U1 u: Y
y Y: y: Yi yi
& &: &i 8 8: a A1 a:
e E1 e: i I1 i1 i: o
O1 o: u U1 u: Y y Y:
y: Yi yi

: b d d^ dZ f g h
j k l l^ m n N n^
: b d d^ f g h j
k l l. l^ m n N n^
p r R s S s2 s^ t
t^ v w z Z
t^ tS v w z Z


Dictionary mt_dict 2011-07-29
@@ -774,3 +774,15 @@ y yi yY
g h j k l m n p
q r s S t tS v w
x z Z


Dictionary bo_dict 2011-11-17

a a: e e: i i: l- o
o: r- u u:

: ? b bh c ch d d.
dh dh. dz dzh g gh H j
J k kh l m n N n.
n^ p ph r s S s. t
t. th th. ts tsh w z Z

+ 2022
- 2019
dictsource/en_list
File diff suppressed because it is too large
View File


+ 2
- 1
dictsource/en_rules View File

@@ -1354,6 +1354,7 @@
ch (atea S
chau (f SoU
chau (v SoU
i) che (_N S
ch (é+ S
ch (ef S
ch (em k
@@ -2614,6 +2615,7 @@
gue (_ g
_) gue gE
_) guer (n g3:
_) g (yn g
o) g (y_ g
g (ynous_ =dZ

@@ -4719,7 +4721,6 @@
_) re (i@P2 r,i:
_) rei (c raI
_) rei (l raI
rei (s raI
_) rele (g rElI2
rele (nt rI2lE
rele (v rElI

+ 59
- 57
dictsource/es_list View File

@@ -9,21 +9,21 @@ _#32 Esp'aTjo


// accent names
_lig liQaD'u**a
_lig liQaD'ura
_acu aQ'uDo
_ac2 d'Oble||aQ'uDo
_brv b**'eBe
_brv br'eBe
_ced TeD'iJ^a
_cir TiRkumfl'exo
_dia dj'E**esis
_cir Tirkumfl'exo
_dia dj'Eresis
_dac d'Oble||aQ'uDo
_dot p'unto // ??
_grv g**'aBe
_hac ka**'On
_mcn mak**'On
_grv gr'aBe
_hac kar'On
_mcn makr'On
_ogo kol'ita
_rng an'iJ^o
_stk b'a*Ra // ??
_stk b'aRR2a // ??
_tld t'ilde


@@ -34,53 +34,53 @@ _. punto
_, koma
_; p,untoik'oma
_: d,Osp'untOs
_! TE*R'aRaDmi**aTj'On
_? TE*R'aRintE*R,oQaTj'On
_¡ aB**'iRaDmi**aTj'On
_¿ aB**'iRintE*R,oQaTj'On
_< men'ORke
_> maJ^'ORke
_' apOst**'ofo
_! TERR2'araDmiraTj'On
_? TERR2'arintERR2,oQaTj'On
_¡ aBr'iraDmiraTj'On
_¿ aBr'irintERR2,oQaTj'On
_< men'Orke
_> maJ^'Orke
_' apOstr'ofo
_" kom'iJ^as
_+ s'iQnOdesum'aR
_+ s'iQnOdesum'ar
_- gJ^On
__ suB**aJ^'aDo
_/ ba*Ra
_\ b'a*RaimbERt'iDa
_` aT'EntOg**'aBe
_( ,aB**epa**'Entesis
_) Tj,E*Rapa**'Entesis
_[ ,aB**ekORtS'ete
_] Tj,E*RakORtS'ete
_{ ,aB**eJ^'aBe
_} Tj,E*RaJ^'aBe
_« kom'iJ^as||iTkJ^'ERDas
_» kom'iJ^as||dE**'EtSas
__ suBraJ^'aDo
_/ baRR2a
_\ b'aRR2aimbErt'iDa
_` aT'EntOgr'aBe
_( ,aBrepar'Entesis
_) Tj,ERR2apar'Entesis
_[ ,aBrekOrtS'ete
_] Tj,ERR2akOrtS'ete
_{ ,aBreJ^'aBe
_} Tj,ERR2aJ^'aBe
_« kom'iJ^as||iTkJ^'ErDas
_» kom'iJ^as||dEr'EtSas

= iQw'al $max3
+ m'as $max3
# almOaD'iJ^a $max3
* astE*'isko $max3
* astEr'isko $max3
. punto $max3

^ TiRkumfl'exo
€ eU**o
% pO**Tj'Ento $max3
& ampERs'ant
@ a*R'oBa
/ ba*Ra
© kopi*R'aIt
£ liB**as
¶ p'a*Rafo
^ Tirkumfl'exo
€ eUro
% pOrTj'Ento $max3
& ampErs'ant
@ aRR2'oBa
/ baRR2a
© kopiRR2'aIt
£ liBras
¶ p'aRR2afo
§ sEkTj'On


// numbers
_0 Te*o
_0 Tero
_1 'uno
_2 d'Os
_3 t**'es
_4 kw'at**o
_3 tr'es
_4 kw'atro
_5 T'inko
_6 s'eIs
_7 sj'ete
@@ -89,13 +89,13 @@ _9 nw'eBe
_1X dj'ET
_11 'OnTe
_12 d'oTe
_13 t**'eTe
_14 kat'ORTe
_13 tr'eTe
_14 kat'OrTe
_15 k'inTe
_20 b'eInte
_2X b'eInt
_3X t**'eInta
_4X kwa*'Enta
_3X tr'eInta
_4X kwar'Enta
_5X Tinkw'Enta
_6X sEs'Enta
_7X sEt'Enta
@@ -125,10 +125,10 @@ _#º o
_#ª a
_ord o

_1o p**im'E**
_1o prim'Er
_2o seQ'und
_3o tERT'E**
_4o kw'a**t
_3o tErT'Er
_4o kw'art
_5o kint
_6o s'Ekst
_7o s'Etim
@@ -137,16 +137,16 @@ _9o noB'en
_10o D'ETim
_11o und'ETim
_12o DwoD'ETim
_13o DeTimotERT'E**
_14o DeTimokw'a**t
_13o DeTimotErT'Er
_14o DeTimokw'art
_15o DeTimok'int
_16o DeTimos'Ekst
_17o DeTimos'Eptim
_18o DeTimOkt'aB
_19o DeTimonoB'en
_2Xo Bix'Esim
_3Xo t**ix'Esim
_4Xo kwaD**ax'Esim
_3Xo trix'Esim
_4Xo kwaDrax'Esim
_5Xo kinkwax'Esim
_6Xo seQsax'Esim
_7Xo sEptwax'Esim
@@ -407,7 +407,7 @@ n _|Ene
ñ _|En^e
p pe
q ku
r _|E**e
r _|Ere
s _|Ese
t te
v _|uBe
@@ -419,8 +419,8 @@ _a a
a a $atend
_o o
o o $atend
_y ,ig**'iEQa
y ,ig**'iEQa $atend
_y ,igr'iEQa
y ,igr'iEQa $atend
ch tSe
ll EJ^e
?2 ll Ej:e
@@ -430,7 +430,7 @@ ll EJ^e
_ó 'o||aTEntw'aDa
ó 'o||aTEntw'aDa $atend
ú 'u||aTEntw'aDa
ü ,uDjE**'Esis
ü ,uDjEr'Esis



@@ -458,7 +458,7 @@ Sres señores $text $capital $dot
Srta señorita $text $capital $dot
Ud usted $text $capital $dot
Uds ustedes $text $capital $dot
// (/ h) pO*||'O**a
// (/ h) pOr||'Ora


// pronunciation exceptions
@@ -466,4 +466,6 @@ Uds ustedes $text $capital $dot
linux $1
méxico mExiko
mexicano mExikano
spanish _^_EN



+ 33
- 25
dictsource/es_rules View File

@@ -4,6 +4,7 @@
// Conditional rules
// ?1 Castilian
// ?2 Latin America
// ?3 mbrola VZ1

.L01 l r y
.L02 b d g n m // change [s] to [z] before these
@@ -25,6 +26,7 @@
b b
_) b ($unpr b // phoneme definition may change it to [B]
_) b (L01A b // Only bl, br are allowed at start of word
_) b (A b
b (A B
b (cY B
b (L03 B
@@ -46,6 +48,7 @@
d d
_) d ($unpr d // phoneme definition may change it to [D]
_) d (rA d
_) d (A d
d (A D
d (cY D
d (L03 D
@@ -57,7 +60,8 @@

.group e
e e
e (CK E
// e (CK E
e (nK E
e (r E
e (Ch e
Ar) e E
@@ -79,6 +83,7 @@
_) g (L01A g
_) gh (A g // allow _gh in foreign words
_) gn (A n
_) g (A g
g (A Q
g (cY Q
g (L03 Q
@@ -89,14 +94,16 @@

.group h
h // silent
_) hi (A J^


.group i
i i
i (A J^
C) i (A j
l) i (A %i
r) i (A %i
gu) i (A j
?!3 l) i (A %i
?!3 r) i (A %i


.group j
@@ -166,11 +173,12 @@


.group r
r R
r (_ *
r (t **
A) r (A **
C) r (A **
r r
r (_ r
r (t r
A) r (A r
C) r (A r
_) r (A R
l) r (A R
m) r (A R
n) r (A R
@@ -182,6 +190,7 @@
s s
&) s (_S1 s
_) s (C@ %Es
ss (K s
_) sh (A S
_) sh (L01A S
sh (K S
@@ -198,26 +207,25 @@
u u
u (A w
u (y_ w
l) u (A %u
r) u (A %u
!?3 l) u (A %u
!?3 r) u (A %u

g) u (Y // gue gui
g) u (e
g) u (i


.group v
v B
_) v (L01A b // allow vl vr at start of word
?1 m) v b
?1 n) v b
?1 v (L06 b
?1 v (iA b
?1 v (uA b
?2 v v#
?2 _) v v
?2 v (L06 v
?2 v (j v
?2 v (iA v
?2 v (uA v
v b
_) v ($unpr b // phoneme definition may change it to [B]
_) v (L01A b // Only bl, br are allowed at start of word
_) v (A b
v (A B
v (cY B
v (L03 B
m) v b
n) v b
v (iA b
v (uA b


.group w
@@ -256,7 +264,7 @@
ú ''u
ü u
ñ n^
$ d'Ola*
$ d'Olar

_) - (_D m'EnOs
A_) - (_D _

+ 185
- 88
dictsource/et_list View File

@@ -16,23 +16,23 @@ b bee:
c tsee:
d dee:
e ee:
f eff:
f eff
g gee:
h haa:
i ii:
j jot:
k kaa:
l ell:
m em:
n enn:
l ell
m emm
n enn
o oo:
ö YY:
õ 88:
ü yy:
p pee:
q kuu:
r eR:R
s ess:
r eRR
s ess
t tee:
u u:
v vee:
@@ -51,19 +51,19 @@ _! hyi:jum,&rk:
_? kys^I1m,&rk:
_" jutU1m,&rk:
_# trel^l^id
_$ dol:lar
_$ tol:lar
_% prots'ent:
_& jaa:,m&rk:
_' ylA1koma
_& j'aa:||m,&rk:
_' ylA1||koma
_: ko:lon
€ euro
% protsent: $2
_€ euro
_% protsent: $2
_( alU1stav||sul:g
_) l8petav||sul:g
_[ alU1stav||kandiline||sul:g
_] l8petav||kandiline||sul:g
_{ alU1stav||lo:geline||sul:g
_} l8petav||loogeline||sul:g
_[ 'alU1stav||k'andil.ine||s'ul:g
_] l'8petav||k'andil,ine||s'ul:g
_{ alU1stav||l'o:gel,ine||s'ul:g
_} l8petav||l'o:gel,ine||s'ul:g
_< v&ik:sem
_> su:rem
_- kri:ps
@@ -71,12 +71,13 @@ __ al:lkri:ps

+ plus:s $max3
* t&R:n $max3
= v8R:dusm&rk: $max3
% prots'ent: $max3
/ kal:dkri:ps
\ l&Ngkri:ps
€ euro
£ nae:l
= v8R:dus||m&rk: $max3
% prots'ent:i $max3
/ kal:d||kri:ps
\ l&Ng||kri:ps
$ tol:larit
€ eurot
£ nae:la
¤ val'u:ta
& _et
@ _&t
@@ -87,39 +88,39 @@ _brv ka:r
_ced sedi:
_cir katus
_dia t&pid
_grv gra:vIs
_grv gra:vis
_tld tilde

// numbers
_0 nul:l
_1 yk:s
_2 kak:s
_3 kol:m
_4 nelI1
_5 vi:s
_6 ku:s
_7 seitse
_8 kaheksa
_9 yheksa
_10 kymme
_0 n'ul:l
_1 'yk:s
_2 k'ak:s
_3 k'ol:m
_4 n'elI1
_5 v'ii:s
_6 k'uu:s
_7 s'eitse
_8 k'aheksa
_9 'yheksa
_10 k'ymme
_11 yksteist
_12 kaksteist
_13 kolmteist
_14 neliteist
_15 vi:steist
_16 ku:steist
_17 seitseteist
_18 kaheksateist
_19 yheksateist
_2X kakskymmend
_3X kolmkymmend
_4X nelI1kymmend
_5X vi:skymmend
_6X ku:skymmend
_7X seitsekymmend
_8X kaheksakymmend
_9X yheksakymmend
_12 k'aksteist
_13 k'olmteist
_14 n'eliteist
_15 v'i:steist
_16 k'u:steist
_17 s'eitseteist
_18 k'aheksateist
_19 'yheksateist
_2X k'aks||k,ymmend
_3X k'olm||k,ymmend
_4X n'elI1||k,ymmend
_5X v'i:s||k,ymmend
_6X k'u:s||k,ymmend
_7X s'eitse||k,ymmend
_8X k'aheksa||k,ymmend
_9X 'yheksa||k,ymmend

_0C sadA1_
_1C sadA1
@@ -148,8 +149,9 @@ ma $u
sa $u
ta $u
me $u
te $u

ise $u $double // reflexive pronoun
ise $u // reflexive pronoun

see $u+ // this
selle $u+
@@ -186,7 +188,7 @@ ehk $u $pause // nor

// negative

ei $u // not
ei $u // not

// questions

@@ -198,7 +200,7 @@ on $u
oleme $u
olete $u

ole $u $double
ole $u
olnud $u
olin $u
olid $u
@@ -228,51 +230,147 @@ yogurt jogurt

abc $abbrev
ad $abbrev $dot // anno Domini
(à la) 'ala $dot // moodi
ca ts'irka $dot // circa
(à la) 'aa:||la: $dot // moodi
em $abbrev $dot
ekr $abbrev $dot // enne Kristust
etc et_setera $dot // et cetera, jne.
eg n'&it:eks $dot // exempli gratia
kt $abbrev $dot // kohusetäitja
os $abbrev $dot
//os $abbrev $dot
oü $abbrev // osaühing
USA $abbrev $allcaps
AS $abbrev $allcaps
AP $abbrev $allcaps
ATM $abbrev $allcaps
ATV $abbrev $allcaps
AüE $abbrev $allcaps
BBC b,i:||b,i:||s'ii: $allcaps
DNA $abbrev $allcaps
EN $abbrev $allcaps
EOK $abbrev $allcaps
IT $abbrev $allcaps
MA $abbrev $allcaps
MTü $abbrev $allcaps
RNA $abbrev $allcaps
SEJ s'o:jus||el'ektri||j'aa:m $allcaps
UV $abbrev $allcaps
WTO v,e:||t,e:||'oo: $allcaps

// expanded to something more meaningful

a 'a:sta $dot // circa
(à la) 'ala $dot // moodi
ca ts'irka $dot // circa
cm s'entim,e:trit
etc et_setera $dot // et cetera, jne.
eg n'&it:eks $dot // exempli gratia
jm j'a||m'u:d $dot
jms j'a||m'u:||sel:ine $dot
jne j'a:ni:edasi $dot
jt j'a||teised $dot
lp l'ugupe:tud $dot
nn n'i:nimetatud $dot
nr n'umber $dot
sh s'ealh,ulgas $dot
st s'e:||t&hendab $dot
u 'umbes $dot
va v'&lja_arvatud $dot
vt v'a:ta $dot
wc v'e:||ts'e:

//a 'a:sta $dot //
apr ,appr'il^l^ $dot
aug 'au:gust $dot
aü 'aa:||'yy: $dot
ca ts'irka $dot // circa
cm s'enti||m,e:trit $dot
dm t,ei1t^si||m'e:trit $dot
dB t,ei1t^si||b'elli $dot
dets t,ets'emmber $dot
dir d,ir'ek:tor $dot
dl t,ei1t^si||l'i:t:rit $dot
dr t'ok:tor $dot
eg n'&it:eks $dot // exempli gratia
EKG 'ee:||k,aa:||g'ee: $dot
(e kr) 'enne||kr'is:tust $dot
(e . m . a) 'enne||m,eije||,ajA1||'ar:vamist $dot
etc et||tsetera $dot // et cetera, jne.
//g kr'ammi $dot
GMO g'ee:||,emm||'oo: $dot
ha h'ek:tarit $dot
hr h'&RRa $dot
hrl h'arI1l,ikult $dot
IQ 'ii:||k'uu: $dot
jj j,a:||j'&rrgmised $dot
jm j,a:||m'uu:d $dot
jms j,a:||m'uu:||s'elline $dot
jmt j,a:||m'uu:d||t'eised $dot
jn j'o:n^is $dot
jne j,a:||n,i:||'edasi $dot
jt j,a:||t'eised $dot
jr j'u:n^ior $dot
jrk j,&rje||k'orrd $dot
jsk j,aosk'onnd $dot
jv j'&rrv $dot
kd k'Yide $dot
kg k,ilO1gr'amm $dot
khk k,ihE1lk'ond $dot
knd k,an^did'a:t $dot
kod k'odA1nik $dot
kp k'u:p'&ev $dot
kpl k'aup:lus $dot
kpt k'ap:ten $dot
// kr kr'oo:n $dot
krt k'orter $dot
Kü k'orteri||'yh,istu $dot
lp l,ugU1||p'e:tud $dot
(m . a . j) m,eije||'ajA1||'arvam,ise||j'&rgi
mg m,il^l^i||gr'ammi $dot
mh m'uu:||h'ulgas $dot
mjr m'ajO1r $dot
mk m'a:||k'onnd $dot
ml m,il^l^i||l'i:trit $dot
mld m'il^jardit $dot
mln m'il^jonit $dot
// mm m,il^l^im'e:trit $dot
mnt m'a:n||t'ee: $dot
mob m,ob'ii:l $dot
Mr m'ister $dot
Mrs m'is^s^is $dot
nn n'ii:||n'imet,atud $dot
nov n,ov'emmber $dot
nr n'ummber $dot
nt n'&iteks $dot
näd n'&dA1l $dot
okt ,okt'o:ber $dot
osk 'osA1||k'onnd $dot
// PhD f,ilO1ss2'o:fia||d,ok:tor $dot
(p kr) p'&rA1st||kr'istust $dot
pms p'eamiselt $dot
pr pr'oua $dot
prk p'erE1||k'ond $dot
prl pr'eili $dot
prof pr,of'ess2or $dot
pst p'uijes||t,e: $dot
ptk p,ea||t'yk: $dot
rbl r'ubla $dot
rdt r,aud||t'e: $dot
rmtk r'a:matu||k'ogu $dot
rtj r,aud||t'ee:||j'aa:m $dot
(s . a) s'el||'a:stal $dot
saj s'ajA1ndil $dot
sealh s'eal||h,ulgas $dot
sek s'ekU1ndit $dot
sept s'ept'emmber $dot
sh s'eal||h,ulgas $dot
snd s'yn^n^dinud $dot
s.o s'ee:||'onn $dot
spl s'upI1||l,usika||t'&it: $dot
srn s'urrnud $dot
st s'ee:||t'&hendab $dot
tel t'elE1fon $dot
tk t'yk:i $dot
tlk t'8l^kinud $dot
tn t'&nA1v $dot
tr tr'yk: $dot
veebr v'e:bruar $dot
vms v,8i||m'uu:||s'ee:||s,ugune $dot
vrd v'8rrdle $dot
vt v'aa:ta $dot
wc v'ee:||ts'ee: $dot
õa '8p:e||,a:sta $dot
õp '8pE1t,aja $dot
// Erandid

// exceptions to ll_ palatalization
all 'al:l
kell k'el:l
lill l'il:l
vill v'il:l // ==hair, ==bristle is palatalized
hull h'ul:l
põll p'8l:l
all 'al:
kell k'el:
lill l'il:
vill v'il: // ==hair, ==bristle is palatalized
hull h'ul:
põll p'8l:

// exceptions to nn_ palatalization
konn k'on:n
nunn n'un:n
konn k'on:
nunn n'un:

// exceptions to tt_ palatalization
sitt s'it:
@@ -280,4 +378,3 @@ sitt s'it:
// exceptions to ss_ palatalization
äss '&s:s
mäss m'&s:s


+ 345
- 276
dictsource/et_rules View File

@@ -1,276 +1,345 @@
// Estonian translation rules
// This file is UTF-8 encoded
.L01 i j // used in palatalization rules
.group a
a a
Ai) a ja // maia -> maija
au) a wa // kaua -> kauUa
uu) a wa // juua -> juuUa
õu) a wa // n8uab -> n8uUab
@) aa 'a:
@) aa (_ 'aa:
_AC) a A1 // rõhuta silbi vokaali pikendamine 1. vältes sõnadel VCV mallis
_CAC) a A1 // CVCV mallis
.group b
b b
_) b p
bb bb
.group c
c k
c (i ts
c (e ts
_) c (e s
city siti // Pronounce foreign word city as siti. Include all inflections and compound words.
// eg. city, cityst, intercity.
.group d
d d
_) d t
dd dd
&) d (L01 d^ // default d + i/j
K) d (L01 d
@@) d (L01 d // kaugemal 1.- 2. silbipiirist mitte
.group e
e e
@) ee 'e:
@) ee (_ 'ee:
Ai) e je // meie -> meije
au) e we // kauem -> kauUem
uu) e we // juues -> juuUes
õu) e we // 8ue -> 8uUe
_AC) e E1 // rõhuta silbi vokaali pikendamine 1. vältes sõnadel VCV mallis
_CAC) e E1 // CVCV mallis
.group f
f f
.group g
g g
_) g k
gg gg
.group h
h h
hh h:h
.group i
i i
@) ii 'i:
@) ii (_ 'ii:
_AC) i I1 // rõhuta silbi vokaali pikendamine 1. vältes sõnadel VCV mallis
_CAC) i I1 // CVCV mallis
.group j
j j
jj j:j
jazz dZ&s:
.group k
k k
kk k:k
.group l
l l
ll l:l
A) ll (_ i1l^:l^ // v.a all, kell, lill, vill, hull, põll
l (ss_ l^ // valss
&) l (dL01 l^ // meeldib, haldjas
&) l (gL01 l^ // palgi, sulgjas
&) l (kL01 l^ // palki, mõlkis, nälkjas
&) l (ni l^ // sulnis, kölni
&) l (si l^ // valsi
&) l (s%i l^ // valssi
&) l (ti l^ // pilti
&) l (L01 l^ // default l + i/j
K) l (L01 l
@@) l (L01 l
&) ll (i l^:l^ // palataliseerime 1. ja 2. silbi piiril
K) ll (i l:l
@@) ll (i l:l // kaugemal ei palataliseeri
.group m
m m
mm m:
.group n
n n
A) nn (_ i1n^:n^ // v.a konn, nunn
i) nn (_ n:n // linn
n (st_ n^ // kunst
&) n (dL01 n^ // vindi, tundi, tundja
&A) n (lL01 n // piinlik
&) n (si n^ // Ansip
&) n (ti n^ // tinti
&) n (t_ n^ // tint
&) n (L01 n^ // default n+i/j
K) n (L01 n
@@) n (L01 n
&) nn (i n^:n^ // palataliseerime 1. ja 2. silbi piiril
K) nn (i nn
@@) nn (i nn // kaugemal ei palataliseeri
n (k N // will retain the k/g; link -> liNk
n (_k N
n (g N
n (_g N
.group o
o o
ii) o o // do nothing
Ai) o jo //
@) oo 'o:
@) oo (_ 'oo:
_AC) o O1 // rõhuta silbi vokaali pikendamine 1. vältes sõnadel VCV mallis
_CAC) o O1 // CVCV mallis
.group p
p p
pp p:p
.group q
q k
qq k:
qu kv
.group r
r r
rr R:R
.group s
s s
A) ss (_ i1s^:s^ // v.a äss, mäss
&) s (di s^ // ?
&) s (lL01 s // oskuslik, usjas
&) s (nL01 s // mõisnik
&A) s (ti s^ // hästi
// C) s (ti s
&) s (L01 s^ // default s + i/j
K) s (L01 s
@@) s (L01 s
&) ss (i i1s^s^ // palataliseerime ss 1. ja 2. silbi piiril
K) ss (i ss
@@) ss (i ss // kaugemal ei palataliseeri
ss ss2 // [s2] is a continuation for [s]
K) sh S
K) sch S // Schmitt
.group t
t t
tt t:
A) tt (_ i1t^: // v.a sitt
&) t (lL01 t // mõtlik
&) t (nL01 t // kunstnik
&) t (si i1t^ // patsi, otsi, ...
@@) t (si t
&) t (L01 t^ // default t + i/j
K) t (L01 t
@@) t (L01 t // kaugemal ei palataliseeri
&) tt (i i1t^: // palataliseerime 1. ja 2. silbi piiril
K) tt (i t:
@@) tt (i t: // kaugemal ei palataliseeri
// @) tse (_ tse_X1 // double the initial consonant of the next word
.group u
u u
ii) u u // do nothing
Ai) u ju // t&ius -> t&ijus
@) uu 'u:
@) uu (_ 'uu:
_AC) u U1 // rõhuta silbi vokaali pikendamine 1. vältes sõnadel VCV mallis
_CAC) u U1 // CVCV mallis
// ui wi
uo uo
.group v
v v
vv v:v
.group w
w v
.group õ
õ 8
õõ '8:
õu 8u
.group ä
ä &
ää '&:
äi &i
.group ö
ö Y
öö 'Y:
öi Yi
.group ü
ü y
üü 'y:
üü (a yij // pyya -> pyija
üü (ja yi // myyja -> myija
üi yi
.group x
x ks
xx k:s
.group y
y i
yy y:
yi ji
.group z
z z
K) zh Z
zz ts // pizza, mozzarella, mezzo
.group
Å¡ S
ž Z
$ dol:lar
__) - (_D mi:nus
A_) - (_D _
C_) - (_D _
// Estonian translation rules
// This file is UTF-8 encoded



.L01 i j // used in palatalization rules

.L02 b d f g h j l m n r s v

.L03 l m n r

.L04 a b c d e f g h i j k l m n o p q r s t u v õ ä ö ü

.L05 a e i l m n o r u õ ä ö ü


.group a
a a
Ai) a ja // maia -> maija
au) a wa // kaua -> kauUa
uu) a wa // juua -> juuUa
õu) a wa // n8uab -> n8uUab
aa 'a: // pikk aa r�huliseks
X) aa (L02_ 'aa: // �hesilbilised pika aa-ga s�nad, millele järgneb mitte-klusiil, III vältesse
X) aa (_ 'aa:
_AL02) a (K A1 // r�huta silbi vokaali pikendamine 1. v�ltes s�nadel VCV mallis
_CAL02) a (K A1 // CVCV mallis

ao 'ao:
ai (_ 'ai:
au (_ 'au:
ae (_ 'ae:
ambi ambi

.group b
b b
_) b p


.group c
c k
c (i ts
c (e ts
_) c (e s
city siti // Pronounce foreign word city as siti.
_) ch tS // Charles, Charlie

.group d
d d
_) d t
&) d (L01 d^ // default d + i/j
K) d (L01 d
@@) d (L01 d // kaugemal 1.- 2. silbipiirist mitte

.group e
e e
Ai) e je // meie -> meije
au) e we // kauem -> kauUem
uu) e we // juues -> juuUes
õu) e we // 8ue -> 8uUe
ee 'e: // pikk ee r�huliseks
X) ee (L02_ 'ee: // �hesilbilised pika ee-ga s�nad kolmandasse v�ltesse, va klusiiliga lõppevad
X) ee (_ 'ee:
_AL02) e (K E1 // r�huta silbi vokaali pikendamine 1. v�ltes s�nadel VCV mallis
_CAL02) e (K E1 // CVCV mallis

eo 'eo:
ea (_ 'ea:
ei (_ 'ei:


.group f
f f


.group g
g g
_) g k


.group h
h h

la) h (ti hh

.group i
i i
ii 'i:
X) ii (L02_ 'ii:
X) ii (_ 'ii:
_AL02) i (K I1 // r�huta silbi vokaali pikendamine 1. v�ltes s�nadel VCV mallis
_CAL02) i (K I1 // CVCV mallis

.group j
j j
jj j:
jazz tZ&s:
jumbu jumbu

.group k
k k
kk k:
AA) k (L05 k: //kiikus, söökla IIIv
AL03) k (L05 k: //kinkis, parkla IIIv
A) k (L03 k: //akna IIIv

kamba kamba
kimbatus kimbatus
kimbu kimbu
kauge k'au:ge

.group l
l l

A) ll (_ i1l^: // v.a all, kell, lill, vill, hull, p�ll
l (ss_ l^ // valss

&) l (dL01 l^ // meeldib, haldjas
&) l (gL01 l^ // palgi, sulgjas
&) l (kL01 l^ // palki, m�lkis, n�lkjas
&) l (ni l^ // sulnis, k�lni
&) l (si l^ // valsi
&) l (s%i l^ // valssi
&) l (ti l^ // pilti
&) l (L01 l^ // default l + i/j
K) l (L01 l
@@) l (L01 l

&) ll (i l^: // palataliseerime 1. ja 2. silbi piiril
K) ll (i l:
@@) ll (i l: // kaugemal ei palataliseeri


.group m
m m
&) m (b mm // sõnades nagu november IIIv
&) m (bA% m //sõnades nagu plombiir ei lähe m IIIv-sse


.group n
n n

A) nn (_ i1n^: // v.a konn, nunn
i) nn (_ n: // linn
n (st_ n^ // kunst

&) n (dL01 n^ // vindi, tundi, tundja
&A) n (lL01 n // piinlik
&) n (si n^ // Ansip
&) n (ti n^ // tinti
&) n (t_ n^ // tint
&) n (L01 n^ // default n+i/j
K) n (L01 n
@@) n (L01 n

&) nn (i n^: // palataliseerime 1. ja 2. silbi piiril
K) nn (i nn
@@) nn (i nn // kaugemal ei palataliseeri

n (k N // will retain the k/g; link -> liNk
n (_k N
n (g N
n (_g N


.group o
o o
ii) o o // do nothing
Ai) o jo //
oo 'o:
X) oo (L02_ 'oo:
X) oo (_ 'oo:
_AL02) o (K O1 // r�huta silbi vokaali pikendamine 1. v�ltes s�nadel VCV mallis
_CAL02) o (K O1 // CVCV mallis

oa 'oa:
oi (_ 'oi:
oe (_ 'oe:

.group p
p p
pp p:
AA) p (L05 p: //liiper, liipri IIIv
AL03) p (_ p: //kirp IIIv

.group q
q k
qq k:
qu kv


.group r
r r
rr RR
ke) r (ge RR
kõ) r (ge RR

.group s
s s
A) ss (_ i1s^: // v.a �ss, m�ss

&) s (di s^ // ?
&) s (lL01 s // oskuslik, usjas
&) s (nL01 s // m�isnik
A) s (ti s^ // h�sti
&) s (L01 s^ // default s + i/j
K) s (L01 s
@@) s (L01 s

&) ss (i s^s^ // palataliseerime ss 1. ja 2. silbi piiril
K) ss (i ss
@@) ss (i ss // kaugemal ei palataliseeri
ss ss2 // [s2] is a continuation for [s]
K) sh S
K) sch S // Schmitt

sombu sombu
sümboliseer s,ymbolis'e:r

.group t
t t
tt t:
AA) t (L05 t: //kiita IIIv
//AL03) t (L05 t: //vintis IIIv
A) t (L03 t: //ütles IIIv
&ma) t (a_ t: //elamata

XA) tt (_ i1t^: // v.a sitt

&) t (lL01 t^ // m�tlik
&) t (nL01 t^ // kunstnik
&A) t (si i1t^ // patsi, otsi, ...
@@) t (si t
&) t (L01 t^ // default t + i/j
K) t (L01 t
@@) t (L01 t // kaugemal ei palataliseeri
// s) t (L01 t^ // vesti, kuna kuulates vahet pole, siis välja

&) tt (i t^: // palataliseerime 1. ja 2. silbi piiril
K) tt (i t:
@@) tt (i t: // kaugemal ei palataliseeri

tambu tambu
tumba tumba

.group u
u u
ii) u u // do nothing
Ai) u ju // t&ius -> t&ijus
uu 'u:
X) uu (L02_ 'uu:
X) uu (_ 'uu:
_AL02) u (K U1 // r�huta silbi vokaali pikendamine 1. v�ltes s�nadel VCV mallis
_CAL02) u (K U1 // CVCV mallis

ui (_ 'ui:



.group v
v v
vabarii v'abar,ii
vembu vembu


.group w
w v


.group õ
õ 8
õõ '8:
X) õõ (L02_ '88:
X) õõ (_ '88:
õu 8u

õo '8o:
õa '8a:
õi (_ '8i:
õu (_ '8u:
õe (_ '8e:


.group ä
ä &
ää '&:
X) ää (L02_ '&&:
X) ää (_ '&&:
äi &i

äo '&o:
äi (_ '&i:
äu (_ '&u:
äe (_ '&e:



.group ö
ö Y
öö 'Y:
X) öö (L02_ 'YY:
X) öö (_ 'YY:
öi Yi

öe 'Ye:
öa 'Ya:


.group ü
ü y
üü 'y:
X) üü (L02_ 'yy:
X) üü (_ 'yy:
üü (a yij // pyya -> pyija
üü (ja yi // myyja -> myija
üi yi

ümbri ymbri

.group x
x ks
xx k:s


.group y
y i
yy y:
yi ji


.group z
z z
K) zh Z
zz ts // pizza, mozzarella, mezzo

.group
Å¡ S
ž Z

// $ dol:lar
__) - (_D mi:nus
A_) - (_D _
C_) - (_D _



+ 21
- 19
dictsource/fr_list View File

@@ -1,4 +1,4 @@
/
// ***************************************************************************
// * Copyright (C) 2005 to 2010 by Jonathan Duddington *
// * email: [email protected] *
@@ -24,7 +24,7 @@

// 2006-11-18 Gilles Casse <[email protected]>
//
// Updated 2011-04-15 Michel Such <[email protected]>
// Updated 2011-10-14 Michel Such <[email protected]>
//
// * Numbers, a few abbreviations and exceptions.
//
@@ -350,6 +350,7 @@ tva $abbrev
uk $abbrev
ups ypeEs
url y:ErEl
USA $abbrev
usb y:Esbe
utc $abbrev
utf $abbrev
@@ -372,10 +373,10 @@ le $nounf $u+
le $verb $verbextend $u
el $u+
los los $u+
la $nounf $u+
la $verb $verbextend $u
les lez2 $nounf $u+
les lez2 $verb $verbextend $u
la la- $nounf $u+
la la- $verb $verbextend $u
les le-z2 $nounf $u+
les le-z2 $verb $verbextend $u
un $nounf $u+
une $nounf $u+

@@ -465,33 +466,33 @@ voici $u+
voilà $u+

// possessives
ma $u $nounf
ma ma- $u $nounf
mon $u $nounf
mes mez2 $u $nounf
ta $u $nounf
mes me-z2 $u $nounf
ta ta- $u $nounf
ton $u $nounf
tes tez2 $u $nounf
sa $u $nounf
tes te-z2 $u $nounf
sa sa- $u $nounf
son $u+ $nounf
son sO~ $noun
ses sez2 $u $nounf
ses se-z2 $u $nounf
notre $u $nounf
votre $u $nounf
leur $u $nounf
leur $u $verb $verbextend
(la leur) la||lYr $u+ $verbf
(le leur) l@||lYr $u+ $verbf
(la leur) la-||lYr $u+ $verbf
(le leur) l@-||lYr $u+ $verbf
nos $u $nounf
vos $u $nounf
leurs $u+ $nounf
leurs $u $verb $verbextend
(les leur) le||lYr $u+ $verbf
(les leurs) le||lYr $u+ $verbf
(les leur) le-||lYr $u+ $verbf
(les leurs) le-||lYr $u+ $verbf

// prepositions
de $u $nounf
du $u $nounf
des dez2 $u $nounf
du dy- $u $nounf
des de-z2 $u $nounf


à a $u+
@@ -758,6 +759,7 @@ peter _^_en
phallus falys
pokémon pokemOn
polder pOldEr
pouls pu
premier pr@mjer2
program _^_en
query _^_en
@@ -942,7 +944,7 @@ votions vOotjO~z2
évitions evitjO~z2

// no liaison
(quelqu'un) kElkW~ $U+
(quelqu'un) kElkW~ $u+
pourcent pursA~
vincent vE~sA~


+ 9
- 6
dictsource/fr_rules View File

@@ -27,7 +27,7 @@
// http://www.fluxnic.net/cicero
//
// Rules are now maintained by Michel Such <[email protected]>
// Last update: 2011-08-13 Michel Such <[email protected]>
// Last update: 2011-10-26 Michel Such <[email protected]>
//

// Letter classes:
@@ -292,7 +292,7 @@ _ingré) dien (t_ djA~ // ingrédient
e (ct+++++ E
e (x+++++ E

_C) e (_ @ // je te
_C) e (_ @- // je te
-c) e (_
-j) e (_
C) e (-
@@ -638,7 +638,8 @@ no) ë (_ e // canoë
_neu) f (_heures v

// group f: English section
_) fire _^_en
_) fire (CA _^_en
_) fire (CCA _^_en
fly _^_en
_) frame _^_en
fter (_ _^_en
@@ -1078,7 +1079,7 @@ _C) oy (X _^_en // boy, toy


.group q
q k // coq
q k // coq
_) qu' (AP3 k
_) qua (d kwa // quadrature
_) qua (tA kwa // quaternaire
@@ -1094,7 +1095,9 @@ _C) oy (X _^_en // boy, toy
_) qua (rtz kwa // quartz
qu k // quatre
_) que (_ k@ // que
n) q (_ k // cinq cent
n) q (_ k // cinq
n) q (_mill // cinq mille
n) q (_cent_ // cinq cent

// group q: English section
quick _^_en // quick, quickly
@@ -1213,7 +1216,7 @@ _cACpu) s (_ s

// group s: English section
send (_ _^_en
server (X _^_en
_) server (X _^_en
sh (_ _^_en
sh (Ap _^_en // shop, ship
sh (At _^_en // shut, shot

+ 1008
- 22
dictsource/hu_list
File diff suppressed because it is too large
View File


+ 23
- 1
dictsource/hu_rules View File

@@ -125,6 +125,12 @@ szanité) c (cs ts
kilen) c (sáv ts
cszs tSZ
kilen) c (schill ts
_bohó) cs ts|S
_ar) c (sérül ts
_har) c (sor ts
_áká) c (söv ts
_áká) c (söv ts
_bohó) c (sz ts

.group ch
anar) ch (i h
@@ -308,6 +314,10 @@ standar) d (jegy d
dt (sz t:
miliár) d (szor d
tér) d (sérül d
jó) d (szivár d
beszé) d (jel d
_biliár) d (szo d
rekor) d (sebesség d

.group dz
fogó) dz (kod ts
@@ -466,6 +476,8 @@ imádsá) g (gyűjt g
végi) g (gyö g
ro) ggyj (ék J:
rá) g (gyűjt g //for example virággyűjtés, virággyűjteményt words
_lo) g (gyűjt g //for example loggyűjtemény word
dro) g (gyanú g

.group gy
gy J
@@ -580,6 +592,7 @@ harmince) gy (edik J:
huszone) gy (es J:
_e) gy (é_ J:
_mint-e) gy (é_ J:
na) gy (sáp J

.group h
h h
@@ -748,6 +761,7 @@ bagate) ll (iz l
pihe) nj (_S2 n^
főbe) n (jár n

_) nvda (- Enve:de:a:
ingye) n n
?1 _) nylon nEjlon
ajá) nlj j:
@@ -801,6 +815,7 @@ helybe) n (jár n
benzi) nj nj
mikrofo) n (nyílás n
szí) n (nyom n
kormá) ny (javaslat n^

.group o
o o
@@ -897,6 +912,7 @@ pedagógu) s (sztrájk S
identitá) s (zavar S
fáklyá) s (zen S
_ki) s (zombor S
_alvá) ssz (üksé Ss

.group ss
ssz ss2
@@ -1212,7 +1228,6 @@ gaboná) szs (ák SZ
t (-t t: // use long [t:], not two [t]
t-) t // silent after 'tt-'


-) t (_ t
_) t (_ te:
tc ts:
@@ -1290,6 +1305,9 @@ fejeze) t (sor t
_spor) t (cél t
pó) t (selejt t
diva) t (cikk t
küldö) tt (gyűl t
szé) t (söpör t
rokkan) t (segít t

.group tj
C) tj c
@@ -1357,6 +1375,7 @@ természe) tj (ár tj
terüle) tj (elöl tj
_á) tj (u tj
_tábláza) tj (egy tj
üzene) tj (el tj

.group ts
ts (_S2 tS //general rule with word end of ts letters
@@ -1779,6 +1798,9 @@ magyará) z (kod s
_gő) z (süvölt z
ezkö) z (sor z
wal) z (er ts
tanácskö) z (társaság s
tű) z (sebesség z
_tű) z (zsonglőr z

.group
$ dolla:R2

+ 38
- 11
dictsource/nl_list View File

@@ -61,8 +61,8 @@ _tld t'Ild@
_, k'Oma:
_: d'8b@l@p,8nt
_; p'8ntkOm,a:
/ sl'As
\ b'AkkslAs
/ sl'ES
\ b'EkslES
_? v@-*'a:xte:k@n
_! 'Wyt@-*upt,e:k@n
_" 'a:nha:lInxste:k@n
@@ -93,9 +93,9 @@ _8 'Axt
_9 n'e:Q@n
_10 t'in
_11 'Elf
_12 tw'a:lf
_12 tv#'a:lf
_13 d'Ertin
_14 v'e:rtin
_14 f'I:rtin
_15 v'EIftin
_16 z'Estin
_17 z'e:v@ntin
@@ -103,7 +103,7 @@ _18 'Axtin
_19 n'e:Q@ntin
_2X tv#'Int@x
_3X d'Ert@x
_4X v'e:rt@x
_4X f'I:rt@x
_5X v'EIft@x
_6X z'Est@x
_7X z'e:v@nt@x
@@ -269,12 +269,12 @@ niet n,it $strend

// auxillary verbs (be, have, can, etc)
zijn $u // to be
ben $u
bent $u
is $u
was $u
waren $u
geweest $u
ben $u $only
bent $u $only
is $u $only
was $u $only
waren $u $only
geweest $u $only

hebben $u // to have
heb $u
@@ -335,6 +335,7 @@ game _^_EN
hardware _^_EN
homepage _^_EN
items _^_EN
jaws _^_EN
laptop _^_EN
malware _^_EN
medical _^_EN
@@ -397,6 +398,7 @@ baster $alt
beender $alt
belemmer $alt
beter $alt
beirer $alt
bibber $alt
bitter $alt
bladder $alt
@@ -1386,9 +1388,20 @@ amnestie $3
april a:pr'Il
armand _^_FR
augustus VUQ'8st8s
bacterie bAkt'I:ri
banengids $alt3
beha be:_h'a:
beige bEZ@
benard b@nArt
beker be:k@r
bendes bEnd@s
benig be:n@Q
benige be:n@Q@
berig bI:r@Q
berige bI:r@Q@
berin bI:r'In
beste bEst@
bevend be:v@nd
bijziend $2 // bijziendheid
blitzkrieg blItskri:g
boudoir budw'a:r
@@ -1429,6 +1442,7 @@ gamasche Qa:m'AS
gazet $2
gouache Qu'AS
gefrituurd $3
hysterie hIstI:r'i
impregnering Impr,EQn'e:IN
inductie $2
ingewikkeld $3
@@ -1441,11 +1455,13 @@ informatie $3
januari $3
kadaster $2
mangat $alt3
materie ma:t'e:ri
maxima $1
meteen mEt'e:n
metro me:tro:
minima $1
(mise-en) mizA~
ministerie minIst'I:ri
misbaksel $1
misbruik $1
misdruk $1
@@ -1465,6 +1481,7 @@ misstap $1
mistral mistr'Al
misvatting $1
miszit $1
mysterie mIst'I:ri
nabij nab'EI
new nyU
november $2
@@ -1479,6 +1496,7 @@ ongemakkelijk $3
ongerieflijk $3
//ongrondwettig $3
partijvoorzitters $2
periferie pI:rifI:r'i
pistache pist'AS
proces $2
projectielen $3
@@ -1491,7 +1509,9 @@ rubriek rybr'ik
sacristie $3
saint _^_FR
salomo $1
selderie $1
september $2
serie sI:ri
sms'jes EsEm'Es_j@s
spektakel $2
tegennatuur $4
@@ -1512,17 +1532,23 @@ ziekenhuisbevalling zi:k@nhWysb@vAlIN

// names
(al-qaeda) Al_:k'AjdA
Beilen bEIl@n
Betty bE:ti
charlotte $2
Danica dan'itsa
Dewever d@'v#e:v@r
Herman $1
Henin _^_FR
Inge IN@
Ingeborg INe:bOrx
Ingmar INmAr
Ingrid IN@-*It
Joe dZo:
Joey dZo:wi
Justine Zyst'in
kennedy kEn@dE
Laurent lo:r'An^
Lisette _^_FR
Naomi $2
Nys nEIsd'WyzEnt

@@ -1535,6 +1561,7 @@ google gu:g@l

// places
alexandrië $3
Benin be:n'in
canada kAna:da:
Kinshasa kInS'a:sa:
Nairobi nAjr'o:bi

+ 21
- 4
dictsource/nl_rules View File

@@ -47,6 +47,7 @@
@) ant (er_ 'Ant
aris (_ 'a:rIs
arissen (_ 'a:rIs@n
a (tor_ 'a:

@) a (de_ 'a:
@) a (ta_ 'a:
@@ -75,9 +76,15 @@
.group be
_) be (@P2 b@
_) bee (+ be:
_) be (CjeK bE
_) be (C% bE
_) be (CCe_ bE
_) be (CCen_ bE
_) be (Cer_ be:
_) be (cC bE
_) be (del be:
_) bei (de bEI
_) beie (r bEi@
_) bei (tel bEI
be (lg bE
_) be (ngel bE
@@ -88,7 +95,7 @@
_) be (ven_ be:
_) bever be:v@r
_) be (zem be:
_) bezig be:z@x
_) be (zig be:
_) beu bY:


@@ -153,6 +160,8 @@
// _) de (CC@P2 d@ // Used a lot in family names
_) de (geen d@ // degene, degenen
_) de (zelf d@
_) dj dZ
dj tj


.group e
@@ -172,6 +181,7 @@

&C) e (_S1qd @
KAC) e (_S1e @ // remove 'e' and double the vowel
KAj) e (_S1 @
el) e (_+S1qd @
er) e (_+S1qd @
ig) e (_+S1qd @
@@ -210,6 +220,7 @@

&) en (_S2qd @n
KAC) en (_S2e @n // flag 'e' means double the previous vowel
KAj) en (_S2 @n
and) en (_S2 @n
el) en (_+S2qd @n
er) en (_+S2qd @n
@@ -286,6 +297,8 @@
&) er (en_$p_alt @r // where 'eren' is not a verb ending
eren (_ 'I:r@n

erie (_ @r'i
er (ij_ @r
tol) er (abel @r
mis) er (abel @r
_) erger ErQ@r // ergeren
@@ -380,6 +393,7 @@
ij (_ 'EI
ij (e_ 'EI
@) ij (n_ 'EI
ij (tjeX 'EI
ij (en 'EI
&) ika (_ =ika:
&) iko (_ =iko:
@@ -460,7 +474,7 @@ _) inn (@P2 'I // ?? inneren
n (k$w_alt3 n

_) na (C@@P2 n'a:
_) na (C@ n'a:
_) na (C@N n'a:
_) na (C% nA
_) na (cht nA
_) narci (s n%ArsI
@@ -512,7 +526,6 @@ _) inn (@P2 'I // ?? inneren
_) openings (P8 'o:p@nINs
_) op (era 'o:p
_) op (tion Op
@at) or (_ 'o:r
ou (che_ u
ouch (en_ uS
d) ou (blu u
@@ -605,7 +618,8 @@ _) inn (@P2 'I // ?? inneren
_) sh S
sh (K S
sj S
@@) s (_S1 s
@) sje (_ sj@
@) s (_S1 s

sc (oop sk
sc (opi sk
@@ -762,4 +776,7 @@ _) inn (@P2 'I // ?? inneren
__) - (_D m'In
@) 's (_S2 s

erie) ën (_S2 @n



+ 13
- 2
dictsource/ta_list View File

@@ -126,7 +126,7 @@ _3 mu:nRU
_4 na:ngU
_5 aIndU
_6 a:RU
_7 ;e:lU
_7 ;e:z.U
_8 ;et.t.U
_9 onbVd.U
_10 pattU
@@ -360,6 +360,7 @@ tamil தமிழ் $text
பைக்க $alt
பாதிக்கும் $alt
பாதிக்குமா $alt
பத்திரப் bVttirVp



@@ -424,6 +425,8 @@ tamil தமிழ் $text
தன $alt
தடியா $alt
தட $alt
தடியாய் $alt
தொள $alt


// initial ட
@@ -500,6 +503,13 @@ tamil தமிழ் $text
காட் $alt
கிடு $alt
களிலேயே $alt
கோபிக்கு $alt
கிரே gre:
க்ரே $alt
கவுன் $alt
கௌன் $alt
கிண் $alt
கிர் $alt



@@ -529,4 +539,5 @@ tamil தமிழ் $text
ஓகோ o:Ho:
கப் kVp
செட் set.
திக் dik
திக் dik
பிட் bit.

+ 121
- 1
dictsource/ta_rules View File

@@ -83,6 +83,11 @@

.L14 நெருப்பு நெருப்புப் தீ தீப்

// words after 'full'
.L15 மீல்ஸ கிளாஸ பாட்டில டிக்கெட் டாஸ



// consonants

.group க
@@ -106,6 +111,7 @@

க (ீத g
க (ஜ gV
க் (_க k

//sort

@@ -164,6 +170,8 @@
_) க (வர்ன்மெண்ட gV
_) கவர்மெண்ட gVvVrmen.t.V#
_) க (வாஸ்கர gV
_) க (வுனை gV
_) க (வுன்கள gV
_) க (வுர gV
_) க (ாண்டாமிருக g
_) க (ாண்டீப g
@@ -179,13 +187,18 @@
_) க (ாயத்திரி g
க (ாரன k
_) க (ார்டன g
_) க (ிஃப்ட g
_) க (ிடுகிடு g
_) க (ிண்ணென்ற g
_) க (ின்னஸ g
_) க (ின்னென்ற g
_) கிப் (ட gif
_) க (ியர g
_) கி (யூ k
_) கி (ரக g
_) கி (ரகண g
_) கி (ரணி ki
_) கி (ரண்_ ki
_) கி (ரந்த g
_) கி (ரவுண்ட g
_) கி (ரஹ g
@@ -223,6 +236,7 @@
_) கி (ரேய k
_) கி (ரைண்டர g
_) கி (ரௌண்ட g
_) க (ிர்ரெ g
_) கி (ளப்_ k
_) கிளப்ப (ில kl.Vbb
_) கிளப்ப (ுக் kl.Vbb
@@ -364,6 +378,7 @@ _மன்மதக்) க (ுகை g
_) க (ொரில g
_) கோக (ிலா go:k
_) க (ோகுல g
_) க (ோசாலை g
_) கோட்ச (ே go:d.s
_) க (ோதாவரி g
_) க (ோதுமை g
@@ -408,6 +423,8 @@ _மன்மதக்) க (ுகை g
_) க (ோஷ g
_) கௌசிக kaUsikV#
_) கௌத gaUtV#
_) க (ௌனை g
_) க (ௌன்கள g
_) க (ௌரவ g
_) க (ௌரி g
_) க் (ரவுண்ட g
@@ -451,6 +468,7 @@ _தலைக்) க (ன gV
_சௌ) க (ரிய kV
அசௌ) க (ரிய kV
சுதா) க (ர்_ kV
_குல்) க (ர்னி kV
விஸ்வ) க (ர்மா kV
_விண்) க (ற் kV
_லோ) க (ல kV
@@ -490,6 +508,7 @@ _சூரிய) க (லா kV
_கார்த்தி) க (ா k
_கிருத்தி) க (ா k
_சந்திரி) க (ா k
_சாமுத்ரி) க (ா k
_மாளவி) க (ா k
_மோனி) க (ா k
_மௌனி) க (ா k
@@ -598,6 +617,8 @@ _டா) குமெண்ட kUmen.tV#
_ட) க் k
_மை) க் k
_ஷா) க் (_ k
_ஜோ) க் (_ k
_ஈஸ்பீ) க் (_ k
_விவே) க் (_ k
_ஜ) க்க ggV#
துர்) க்க ggV#
@@ -647,6 +668,7 @@ _துப்பாக்கி) க்க (ுண்ட gg
_ல) க்க (ேஜ gg
L03) க்க (ோபுர gg
_வி) க்ச (னரி ks.V
_மி) க்ச (ர ktSV
_பி) க்ச (ர ktSV
_லெ) க்ச (ர ktSV
_மெ) க்சிக (ோ ksik
@@ -777,6 +799,8 @@ _தணிகா) ச (ல tSV
_) சிக (ாகோ tSik
_) ச (ிக்கனு tS
_) ச (ிக்கனை tS
_) ச (ிக்கன்னா tS
_) ச (ிக்காகோ tS
_) சிக் (மங்களூர tSik
_) சிக் (லெட் tSik
_) ச (ிட்டாக tS
@@ -799,6 +823,7 @@ _தணிகா) ச (ல tSV
_ச) ச (ின tS
_) சி (னே s
_) ச (ின் tS
_) ச (ின்ஹா s
_) சிப் (கள tSip
_) ச (ிப்பு tS
_) ச (ிப்பை tS
@@ -826,6 +851,7 @@ _தணிகா) ச (ல tSV
_ஈ) சு s
_) ச (ுடிதார tS
_) ச (ுட்டிப் tS
_) சு (ருதி s
_) சு (லோக s
கே) சு (வ s
மே) சு (வ s
@@ -877,12 +903,14 @@ _தணிகா) ச (ல tSV
_) ச (ெல்லப்பையன tS
_) ச (ெல்லமா tS
_) ச (ெல்லமே_ tS
_) ச (ெல்லையா tS
_) ச (ெஸ் tS
ச (ெஸ்டர tS // -chester
_) ச (ேஞ்ச tS
_) ச (ேட்டன tS
_) ச (ேனல tS
_) ச (ேரி tS
_) ச (ேர்கள tS
_) ச (ேர்மேன tS
_) ச (ேலஞ் tS
_) ச (ேஷ்டை tS
@@ -910,6 +938,9 @@ _தணிகா) ச (ல tSV
ஞ (B n^

_கா) ஞ்ச (னா ntSV
இ) ஞ்ச் ntS
_வி) ஞ்ச் ntS


.group ட
ட d.V
@@ -924,11 +955,15 @@ _தணிகா) ச (ல tSV

//sort


_வால்) ட t.V#
_கமெண்) ட t.V#
_க்ளையண்) ட t.V#
_பேஷண்) ட t.V#
_ரிப்போர்) ட t.V#
_ஷிஃப்) ட t.V#
அL04ால்) ட t.V#
அக்ரீமெண்) ட t.V#
அர்ஜண்) ட t.V#
அர்ஜெண்) ட t.V#
இண்டர்மீடியே) ட t.V#
@@ -984,6 +1019,7 @@ _ரிப்போர்) ட t.V#
_) ட (ான்சானிய t.
_) ட (ான்ஜானிய t.
_) டாபிக் t.a:pik
_) டாப் t.a:p
_) ட (ாமி t.
_) டாய்லட் t.a:jlVt.
_) டாய்லெட் t.a:jlet.
@@ -991,6 +1027,7 @@ _ரிப்போர்) ட t.V#
அண்) டார்டிக t.a:rt.ikV#
_) ட (ாலமி t.
_) ட (ால்ஸ்டாய t.
புல்_) ட (ாஸ t.
பெண்) டாஸ்டிக் t.a:st.ik
_) ட (ாஸ்மாக் t.
_டியூ) ட (ி t.
@@ -1057,6 +1094,7 @@ _செண்) டிமெண்ட t.imen.t.V#
_) டி (ரெய்லர t.
_) டி (ரெஸ d.
இண்) டி (ரெஸ்ட t.
_) டி (ரே t.
_) டிரேயின (ை t.re:jn
_) டி (ரை_ d.
_) டி (ரை_செஞ்ச t.
@@ -1071,6 +1109,9 @@ _செண்) டிமெண்ட t.imen.t.V#
_) டிவிங்க (ிள t.wiNk
_) ட (ிவிய t.
_) ட (ிவில t.
_) ட (ிஷ்ய t.
_) டீசண்ட d.i:sVn.t.V#
_) ட (ீசல d.
_காண்) ட (ீன t.
_கேண்) ட (ீன t.
_) ட (ுனிசியா t.
@@ -1079,8 +1120,10 @@ _செண்) டிமெண்ட t.imen.t.V#
_) ட (ுனீஷிய t.
_) டுவிங்க (ிள t.wiNk
_) டுவ (ிட்டர t.w
_) டூத் t.u:t
_கார்) ட (ூன t.
_) ட (ூர t.
இண்) ட (ெ t.
_) டெக் (னாலஜி t.ek
_) டெக்னிக (ல t.eknikV
_) ட (ெக்ஸாஸ t.
@@ -1174,6 +1217,7 @@ _லான்_) ட (ென்னிஸ t.
_) ட் (ரெண் t.
_) ட்ரெயி (லர t.rej
_) ட் (ரெய்லர t.
_) ட் (ரே t.
இண்) ட் (ரேஸ்ட t.
_) ட் (ரை_செஞ்ச t.
_) ட் (ரை_செய் t.
@@ -1226,6 +1270,7 @@ _நடுரோ) ட் (ல t.
ஸ்) த (B t
ப்) த tV
ப்) த (B t
த் (_த t

// exceptions, த as [d]

@@ -1310,6 +1355,7 @@ _நடுரோ) ட் (ல t.
_) த (ருமச் dV
_) த (ருமத் dV
_) த (ருமன dV
_) தருமப (ால dVrumVb
_) த (ருமபுர dV
_) தருமப (ுரி dVrUmVp
_) த (ருமப் dV
@@ -1331,6 +1377,7 @@ _நடுரோ) ட் (ல t.
_) த (வம dV
_) தவுலதாப (ாத dVvUlVda:b
_) த (ாக்கா d
_) த (ாக்காத t
_) த (ாக்காம t
_) த (ாக்காவிட்டா t
_) த (ாச d
@@ -1418,6 +1465,8 @@ _நடுரோ) ட் (ல t.
_) திரு (ஷ்டி dri
_) த (ிரௌபதி d
_) தி (ரௌபதி t
_) திலிப் dilip
_) திலீப் dili:p
_) த (ில்லாக d
_) த (ில்லி d
_) த (ில்லு_ d
@@ -1503,6 +1552,7 @@ _நடுரோ) ட் (ல t.
_) த (ேக d
_) த (ேக்க t
_) த (ேச d
_) த (ேச்ச t
_) த (ேவகான d
_) த (ேவகி d
_) த (ேவகுமார d
@@ -1532,11 +1582,14 @@ _நடுரோ) ட் (ல t.
_) த (ேவேந் d
_) த (ைரிய d
_) த (ொனி d
_) த (ொன்னை d
_) த (ொபதொப d
_) த (ொபுக் d
_) த (ொப்புன d
_) த (ொப்பெ d
_) த (ொம் d
_) த (ொளதொள d
_) த (ொளவெ d
_) த (ோசை d
_) த (ோஷ d
_) த (ோஸ்த் d
@@ -1566,6 +1619,7 @@ _வசந்) த tV#
_சுனி) த (ா t
_மம்) த (ா t
_ஹரி) த (ா t
_மஜந்) த (ா t
_வனி) த (ா t
_வினி) த (ா t
_நிவேதி) த (ா t
@@ -1718,11 +1772,14 @@ _காமசூ) த் (ர t
ப (ூர p
ப (ட்டர bV

ப் (_ப p // next word starts with ப

//sort


பி_._) ப(ி_._சி b // b.b.c
_) ப (L06ுகுணா bV
_) ப (L06ுஜ bV
_) ப (L07லர b
_) ப (ஃபூன bV
_) ப (கதூர bV
@@ -1782,6 +1839,7 @@ _சொந்த_) ப (ந்த bV
_) ப (ந்துவ bV
_) ப (ந்தோபஸ்த bV
_) ப (னல fV
_) ப (னாரஸ bV
_) ப (னியன bV
_) ப (ன்னாரி bV
_டீயும்_) ப (ன்னும்_ bV
@@ -1821,7 +1879,7 @@ _டீயும்_) ப (ன்னும்_ bV
_) ப (ர்னாலா bV
_) பர்னிச (ர fVrnitSV
_) ப (ர்னிச்சர fV
_) ப (ர்ம bV
_) ப (ர்ம bV
_) ப (ர்லாங் fV
_) ப (லகீன bV
_) ப (லங் bV
@@ -1837,6 +1895,7 @@ _டீயும்_) ப (ன்னும்_ bV
_) ப (லப்பரீட்சை bV
_) ப (லமணைத்த bV
_) ப (லமாகC் bV
_) ப (லமாகவே bV
_) ப (லமாகி bV
_) ப (லமாச்ச bV
_) ப (லமான bV
@@ -1873,6 +1932,7 @@ _டீயும்_) ப (ன்னும்_ bV
_) பவுண்ட (ன faUn.t.V
_) ப (வுத்தத்தில bV
_) ப (வுலர bV
_) ப (வுலிங் bV
_) ப (வ்ய bV
_) ப (ஷீர bV
_) ப (ஸ bV
@@ -1912,7 +1972,10 @@ _டெட்_) ப (ாடி b
_) ப (ாணங் b
_) ப (ாணமு b
_) ப (ாணி b
_) ப (ாதிக்கக்கூட b
_) ப (ாதிக்கண் p
_) ப (ாதிக்கப்பட b
_) ப (ாதிக்கப்பட b
_) ப (ாதிக்கலாம b
_) ப (ாதிக்கவா b
_) ப (ாதிக்கவில் b
@@ -1926,6 +1989,9 @@ _டெட்_) ப (ாடி b
_) ப (ாதிக்கும்_மேற்பட்ட_ p
_) ப (ாதிக்கும்_மேல p
_) ப (ாதித்த b
_) ப (ாதிப்படைகி b
_) ப (ாதிப்படையுமெ b
_) ப (ாதிப்படைவ b
_) ப (ாதிப்பதா b
_) ப (ாதிப்பதை b
_) ப (ாதிப்பினால b
@@ -1934,6 +2000,7 @@ _டெட்_) ப (ாடி b
_) ப (ாதிப்புக் b
_) ப (ாதிப்பும b
_) ப (ாதிப்பேர p
_) ப (ாதிப்பை b
_) பாத (ிமா fa:t
_) ப (ாதுஷா b
_) ப (ாத்திமா f
@@ -2000,6 +2067,7 @@ _விளையாடு_) ப (ாம்பே p
_நேய_) ப (ாவ b
_ராக_) ப (ாவ b
_சகோதர_) ப (ாவ b
_சாந்த_) ப (ாவ b
_சிநேக_) ப (ாவ b
_சினேக_) ப (ாவ b
_முக_) ப (ாவ b
@@ -2114,6 +2182,7 @@ _ராகத்தின்_) ப (ாவ b
_) பி (ரளய p
_) பி (ரவாக p
_) பி (ரவீண p
_) பி (ரவீன p
_) பி (ரவுச b
_) பி (ரவேச p
_) பி (ரவேசி p
@@ -2132,6 +2201,7 @@ _ராகத்தின்_) ப (ாவ b
_) பி (ராட்_ f
_) பி (ராட்வே b
_) பி (ராண_ p
_) பி (ராணத் p
_) பி (ராணன p
_) பி (ராணி p
_) பி (ராண்ட p
@@ -2152,6 +2222,7 @@ _ராகத்தின்_) ப (ாவ b
_) பி (ராமி b
_) பி (ராமிக் b
_) பி (ராமின்_ b
_) பி (ராமிஸ p
_) பி (ரார்தன p
_) பி (ரார்தி p
_) பி (ரார்த்த p
@@ -2184,6 +2255,8 @@ _ராகத்தின்_) ப (ாவ b
_) பி (ரியாவை p
_) பி (ரிஸ்டல b
_) பிரிஸ்ப (ேன brisb
_) ப (ிருகண்டி b
_) ப (ிருகநள b
_) பிரு (கன்நளை bri
_) பி (ருகு b
_) பிரு (ந்தா bri
@@ -2224,6 +2297,8 @@ _ராகத்தின்_) ப (ாவ b
_) ப (ிஸ்கோத் b
_) ப (ிஸ்மார்க் b
_) ப (ிஸ்மில்லா b
_) ப (ிஸ்லரி b
_) ப (ிஸ்வாஸ b
_) ப (ீகார b
_) ப (ீச்சில b
_) ப (ீச்சுக்க b
@@ -2252,6 +2327,7 @@ _ராகத்தின்_) ப (ாவ b
_) ப (ீரோ b
_) ப (ீர்பால b
_) ப (ீஹார b
_) ப (ுக்கிங் b
_) ப (ுக்கில b
_) ப (ுக்கென்ற b
_) ப (ுக்கை b
@@ -2283,6 +2359,8 @@ _பெனசீர்_) ப (ுட்டோ b
_) பு (ரோக்கர b
_) புரோட (ான pro:t.
_) பு (ரௌச b
_) ப (ுல்_L15 f
_) ப (ுல்டோசர b
_) ப (ுல்லட் b
_) ப (ுல்லா_ f
_) ப (ுல்லாக்க b
@@ -2353,6 +2431,7 @@ _பெனசீர்_) ப (ுட்டோ b
_) ப (ேஜார b
_) ப (ேட்டரி b
_) ப (ேட்டா b
_) ப (ேட்டிங் b
_) ப (ேதங் b
_) ப (ேதமி b
_) ப (ேதமு b
@@ -2369,6 +2448,8 @@ _பெனசீர்_) ப (ுட்டோ b
_) ப (ைக்குகள b
_) ப (ைசன b
_) ப (ைண்ட b
_) ப (ைனாக b
_) ப (ைனாமி b
_) ப (ைபிள b
_) ப (ைரவ b
_) ப (ொம்மன b
@@ -2395,12 +2476,18 @@ _பெனசீர்_) ப (ுட்டோ b
_) ப (ோதன b
_) ப (ோதிக்க b
_) ப (ோதிசத்வ b
_) ப (ோதிதர்ம b
_) ப (ோதித் b
_) ப (ோதிப்ப b
_) ப (ோதியி b
_) ப (ோதியை b
_) ப (ோதை b
_) ப (ோனின்_ f
_) ப (ோனியாக b
_) ப (ோனில f
_) ப (ோனுக்க f
_) ப (ோனுடைய f
_) ப (ோனுல f
_) ப (ோன்கள f
_) ப (ோன்ஸ்லே b
_) போப (ால bo:p
@@ -2420,6 +2507,7 @@ _சந்திர_) ப (ோஸ b
_) பௌண்ட (ன faUn.t.V
_) ப (ௌதிக b
_) ப (ௌத்த b
_) ப (ௌலிங் b
சு) ப்பி (ரமணி b
_) ப் (ரசல்ஸ b
_) ப்ரபொ (சர profV
@@ -2608,6 +2696,8 @@ _வெளிப்) ப (ாக b
_சக்கிர) ப (ாணி p
பஞ்ச) ப (ாண்ட p
ப (ாண்டி p
ஒரு) ப (ாத p
_மறு) ப (ாத p
ஆமதா) ப (ாத b
அL06மதா) ப (ாத b
ஒளரங்கா) ப (ாத b
@@ -2620,8 +2710,12 @@ _வெளிப்) ப (ாக b
_சாய்) பாப (ா ba:b
அ) பாயிண்ட்மெண்ட pa:jin.t.ment.V#
_டீ) ப (ாய் p
_சரி) ப (ார p
எதிர்) ப (ார p
_பிளாட்) ப (ார f
அ) பார்மெண்ட pa:rment.V#
கண்) ப (ார்வை p
இம்) ப (ால f
இரு) ப (ால p
ஒரு) ப (ால p
ஆண்) ப (ால p
@@ -2649,11 +2743,13 @@ _தமிழ்ப்) ப (ாஷ _b
_கன்) ப (ிகர f
வாலி) பிக (ேஷன fik
_பசி) ப (ிக் f
_கா) பிட(ல pit.V
கண்டு) ப (ிடி p
திமிர்) ப (ிடி p
ராவல்) ப (ிண்டி p
_டால்) ப (ின f
ஒ) ப (ினியன p
_மர) ப (ின் b
அன்) ப (ின் b
_பண்) ப (ின் b
ர்) ப (ின்_ b
@@ -2675,6 +2771,8 @@ _ஞானப்) பிரக (ா prVk
பிரக (ாஷ prVk
மதப்) பிரச (ார prVtS
பி (ரத p
ராஜப்) பி (ரதிநிதி p
அரசுப்) பி (ரதிநிதி p
_தர்மப்) பி (ரப p
_தானப்) பி (ரப p
_மL06ாப்) பி (ரப p
@@ -2688,6 +2786,7 @@ L03ந்தப்) பி (ரளய p
L03ந்தப்) பி (ராய p
ஆ) ப (ிரிக்க f
போஜனப்) பி (ரியர p
_) பி (ரீயா f
_மறு) ப (ிற p
உடன்) ப (ிற p
ப (ிறகு+ p
@@ -2722,7 +2821,9 @@ L03ந்தப்) பி (ராய p
மண்) ப (ுழு p
ப (ூச்சி p
ம்) ப (ூர b
_லம்) ப (ூர p
ராம்) ப (ூர p
_கோலாலம்) ப (ூர p
அ) ப (ூர்வ b
இன்ஸ்) ப (ெக்டர p
_) பெஞ்ச (ா_ pen^dZ
@@ -2745,10 +2846,16 @@ L03ந்தப்) பி (ராய p
_செல்) ப (ேசி p
அலை) ப (ேசி p
தொலை) ப (ேசி p
_மறு) ப (ேச்ச p
ஒரு) ப (ேச்ச p
வீண்) ப (ேச்ச p
_சில) ப (ேர p
_பல) ப (ேர p
_வெல்) ப (ேர f
ப (ேரில்_ p
அத்திம்) ப (ேர் b
ப (ேர்_ p
அம்) ப (ையர p
_தவிடு) ப (ொடி p
_வன்) ப (ொரு p
_மென்) ப (ொரு p
@@ -2803,6 +2910,7 @@ L03ந்தப்) பி (ராய p
_டே) ப (் p
_போ) ப் p
_லாக) ப் p
_டெஸ்க்டா) ப் p
ஆ) ப் (கானிய f
ஆ) ப் (கானிஸ்தான f
_பா) ப்க (ார்ன pk
@@ -2815,6 +2923,7 @@ _மைக்ரோசா) ப் (ட f
L03) ப்ப (ங்களா bbV
L03) ப்ப (தில bbV
நிர்) ப்ப (ந்த bbV
_ரி) ப்ப (ன bbV
நிர்) ப்ப (ய bbV
_ர) ப்ப (ர bbV
ஆ) ப்ப (ரிக்க fV
@@ -2850,12 +2959,17 @@ _ஒL10ி) ப்பி (ரவாக pp
ஆ) ப்பி (ரிக்க f
தென்னா) ப்பி (ரிக்க fV
_ஹ) ப்ப (ிள bb
உ) ப்ப (ுசத்த bb
உ) ப்ப (ுசம bb
_சந்தேக) ப்ப (ுத்தி bb
இ) ப்ப (ூமி bb
_ல) ப்ப (ை bb
துர்) ப்ப (ோதனை bb
கம்) ப்யூட (ர pjU:t.V
_சு) ப் (ரீம p
_) ப் (ரீயா f
_கம்) ப் (ரெஸ p
இம்) ப் (ரெஸ p
_) ப் (லெட்சர f
_மா) ப் (ள p
ஏரோ) ப் (ளேன p
@@ -2944,6 +3058,8 @@ _சந்தேக) ப்ப (ுத்தி bb

_விம) ரி (ச r
_நித) ரி (சன r
அதி) ரு (ஷ்ட r
_துரதி) ரு (ஷ்ட r

.group ற
ற RV
@@ -2957,6 +3073,7 @@ _சந்தேக) ப்ப (ுத்தி bb
ல (B l

_செய) ல்ப RpV#
_காவ) ல் (துறை t.


.group ள
@@ -2964,6 +3081,8 @@ _சந்தேக) ப்ப (ுத்தி bb
ள (B l.

_மக்க) ள்த (ொகை t.t
உ) ள் (துறை t.


.group ழ
ழ z.V
@@ -3025,6 +3144,7 @@ _சந்தேக) ப்ப (ுத்தி bb
இ (ரதம
இ (ரத்த
இரப்ப (ர rVbbV
இ (ரம்மிய
இ (ரயில
இ (ரவீந்திர
இ (ராக

+ 1
- 1
espeak-data/voices/!v/f5 View File

@@ -1,5 +1,5 @@
language variant
name female2
name female5
gender female

pitch 160 228

+ 2
- 1
espeak-data/voices/!v/m7 View File

@@ -1,5 +1,6 @@
language variant
name Test
name male7
gender male

pitch 75 125


+ 1
- 1
espeak-data/voices/!v/whisperf View File

@@ -1,5 +1,5 @@
language variant
name female whisper
name female_whisper
gender female

pitch 160 220

+ 1
- 1
espeak-data/voices/es View File

@@ -3,5 +3,5 @@ language es
gender male

dictrules 1
intonation 3
//intonation 3


+ 1
- 1
espeak-data/voices/es-la View File

@@ -7,6 +7,6 @@ gender male
phonemes es-la
dictrules 2
intonation 2
stressLength 170 200 180 180 0 0 250 280
stressLength 170 200 230 180 0 0 250 280

replace 00 T s

+ 1
- 0
espeak-data/voices/mb/mb-es1 View File

@@ -4,4 +4,5 @@ gender male
pitch 82 117

mbrola es1 es_phtrans
voicing 120


+ 1
- 1
espeak-data/voices/mb/mb-es2 View File

@@ -3,5 +3,5 @@ name spanish-mbrola-2
gender male
pitch 82 117

mbrola es2 es_phtrans
mbrola es2 es_phtrans 22050


+ 65
- 46
phsource/compile_report View File

@@ -1,4 +1,4 @@
76 phoneme tables
77 phoneme tables
new total
base 107 107
consonants 10 116
@@ -17,9 +17,9 @@ consonants 10 116
jbo 2 114
nci 3 123
fi 41 133
et 47 139
fr 59 140
fr-ca 11 140
et 40 133
fr 64 144
fr-ca 11 144
hi 57 148
ta 23 152
kn 17 148
@@ -37,7 +37,7 @@ consonants 10 116
bg 14 123
it 19 127
la 21 124
es 11 123
es 15 123
es-la 1 123
ca 11 125
pt 29 138
@@ -66,7 +66,7 @@ consonants 10 116
sl 10 135
gd 6 107
nso 12 111
ht 11 140
ht 11 144
az 10 127
ak 8 109
am 15 112
@@ -76,6 +76,7 @@ consonants 10 116
si 24 154
tn 27 119
mt 32 127
bo 10 152

Data file Used by
b/b [b] base
@@ -165,6 +166,8 @@ d/xd [d] base
[d] sr
[d] sq
[d] mt
[dz] bo
[dzh] bo
d/xd3 [dh] hi
d/xd_pzd [d^] et
[d;] pl
@@ -172,6 +175,8 @@ d/xdr [d] fr
[d.] hi
[dh.] hi
d/xdz [dz] consonants
[dz] bo
[dzh] bo
d/x_tap [t#] en
[*] pt
dzh/dzh [dZ] base
@@ -286,11 +291,12 @@ h/hi [h] base
[<h>] la
[h] mt
h/ho [h] base
[h] et
[<h>] la
h/hu [h] base
[h] et
[<h>] la
h/hu_fi [h] fi
[h] et
[h] mt
j2/_j2 [;] base
j2/j2@ [;] base
@@ -394,7 +400,7 @@ l/l_ [l] base
[l/] fr
l/l_@ [l/3] base
[l/] fr
l/l@ [h] base
l/l@ [h¡ý] base
[l#] base
[l] fr
[l/2] fr
@@ -428,7 +434,7 @@ l/L2_oL [l/2] base
l/L2_uL [l/2] base
l/l_3 [l/] de
l/l_4 [ll] sq
l/la [h] base
l/la [h¡ý] base
[l#] base
[l] fr
[l/2] fr
@@ -436,7 +442,7 @@ l/la [ha
[K] tn
l/l_a [l/3] base
[l/] fr
l/le [h] base
l/le [h¡ý] base
[l#] base
[l] fr
[l/2] fr
@@ -448,7 +454,7 @@ l/L_eL_af [&] af
[&:] af
l/l_front [L] sq
l/l_front_ [l/4] sq
l/li [h] base
l/li [h¡ý] base
[l#] base
[l] fr
[l/2] fr
@@ -462,7 +468,7 @@ ll/ll [L] bg
ll/_ll [L] bg
l/l_long [l] base
[l] fr
l/lo [h] base
l/lo [h¡ý] base
[l#] base
[l/2] fr
[K] nso
@@ -472,7 +478,7 @@ l/l_o [l/3] base
l^/l_rfx [l.] base
[l] ru
[l^] ru
l/lu [h] base
l/lu [h¡ý] base
[l#] base
[l] fr
[l/2] fr
@@ -634,10 +640,8 @@ r3/r_trill3.wav [R3] base
[r] af
[r] tn
r3/r_trill_short [R2] fi
[R2] et
r3/r_trill.wav [R2] base
[R2] fi
[R2] et
[R2] lv
[R] pl
[r*] sr
@@ -918,6 +922,7 @@ ustop/t_dnt2 [t] base2
[d] kn
ustop/t_hi [t[] base
[t] et
[t^] et
[t`] am
ustop/t_pzd [c] base
[t^] et
@@ -931,13 +936,19 @@ ustop/ts [ts] consonants
[z] zhy
[tsh] zh
[ts] tn
[tsh] bo
[dzh] bo
ustop/ts_ [ts] consonants
[dz] consonants
[ts] lv
[ts] tn
[tsh] bo
[dzh] bo
ustop/ts2 [ts] lv
[ts] hy
[ts] ka
[ts] bo
[dz] bo
ustop/tsh [tS] base
[c] zhy
[tS] tn
@@ -1047,7 +1058,6 @@ vdiph2/y-y# [yY] fi
[y@] vi
[yY] mt
vdiph/8u [oU] en-us
[8u] et
[ou] zh
vdiph/aae [aI] en-us
vdiph/aai [ai] lv
@@ -1287,7 +1297,7 @@ vnasal/o_n [o~] hi
[o~] pt
[O~] ht
vnasal/o_n2 [o~] af
[O~] fr
vnasal/o_n4 [O~] fr
vnasal/oo_n2 [O~] en
[O~] hi
[O~] nl
@@ -1356,6 +1366,8 @@ voc/z_ [z] base
[z] fr
[z;] ro
[z] sq
[dz] bo
[dzh] bo
voc/zh [Z] base
[z.] base
[R^] sk
@@ -1439,12 +1451,12 @@ vowel/@_6 [@] en
[W2] fr
vowel/8 [o-] zh
vowel/8_2 [U] en-us
[8] et
[8] sv
vowel/8_3 [eo] zhy
vowel/8_4 [8:] et
vowel/8_5 [8] ku
vowel/8_6 [V] sq
vowel/8_7 [8:] et
vowel/8_7 [8] et
[@] lv
vowel/a [a] base
[a] en
@@ -1468,12 +1480,12 @@ vowel/a [a] base
[a] zh
[a] id
[a] sl
[a] bo
vowel/a# [a] base2
[a/] base2
[a#] en-sc
[a#] en-wi
[&] sr
[a] es
[a#] rw
[a/] rw
[a] wo
@@ -1486,7 +1498,6 @@ vowel/a_2 [a] base2
[aa] en-wi
[a] eo
[a] nl
[a] es
[A] pt
[a] pt-pt
[a] ro
@@ -1538,7 +1549,8 @@ vowel/a#_3 [a#] en
[a] sq
[a/] sq
[3] da
vowel/a_4 [a] el
vowel/a_4 [a] es
[a] el
[a] vi
vowel/a#_4 [a:] nl
[a] bg
@@ -1555,10 +1567,11 @@ vowel/a_6 [a] ca
[a:] vi
[a] am
[a:] wo
vowel/a_7 [a] en
[a] fr
[a] sk
vowel/a_7 [a] fr
[a-] fr
[a] ht
vowel/a_8 [a] en
[a] sk
vowel/aa [a:] et
[A] fr-ca
[A] no
@@ -1588,7 +1601,6 @@ vowel/aa_6 [A] de
[A:] de
vowel/aa_8 [0] en-us
[A:] en-us
[A] et
[A1] et
[A] nl
[a:] is
@@ -1641,6 +1653,7 @@ vowel/e [e] base
[e:] dv
[e:] te
vowel/e# [I] en-sc
[e] et
vowel/e_2 [eI] en-sc
[e:] de
[e] hi
@@ -1655,10 +1668,10 @@ vowel/e_3 [i] en-n
vowel/e_5 [i] en-sc
vowel/e_6 [e] ht
[e] ak
vowel/e_7 [e] et
[e:] et
vowel/e_7 [e:] et
vowel/e_8 [E:] de
[e] fr
[e-] fr
vowel/ee [E] en-n
[E] sv
[e] ka
@@ -1680,16 +1693,15 @@ vowel/ee_2 [E] cy
[E#] ku
[&] da
[E] pa
vowel/ee#_2 [E-] sv
vowel/ee#_2 [E1] et
[E-] sv
[E#] sq
[e] tn
vowel/ee_3 [&] af
[&:] af
[E] pt
[E] vi
vowel/ee_4 [E] et
[E1] et
[E] sq
vowel/ee_4 [E] sq
vowel/ee_5 [E] en
[E] ak
[E] wo
@@ -1702,6 +1714,7 @@ vowel/ee_6 [&] sk
[&:] si
vowel/e_mid [E] en-rp
[E] fr
[E-] fr
[E~] fr
[E] fr-ca
[E] hi
@@ -1752,11 +1765,13 @@ vowel/e_mid2 [E] af
[e] te
[e:] si
[e] mt
[e] bo
vowel/@_fnt [@] en-wi
[@2] en-wi
[@2] hr
vowel/@_fr [3] en-n
vowel/@_hgh [@] fr
[@-] fr
[@] hr
vowel/i [i] base
[i] base2
@@ -1771,6 +1786,7 @@ vowel/i [i] base
[i:] ml
[i:] hu
[i] it
[i] es
[i] pt-pt
[i/] ro
[i] el
@@ -1790,16 +1806,14 @@ vowel/i [i] base
[i:] dv
[i:] te
[i:] si
[i] bo
vowel/i# [y:] cy
vowel/i_2 [i2] de
[i:] de
[i] et
[i] nl
[i:] la
[i:] sv
vowel/i_3 [i] af
[I] et
[I1] et
[i:] sk
vowel/i_4 [i] fi
[i] hu
@@ -1830,8 +1844,10 @@ vowel/i#_6 [i.] zh
vowel/i_7 [i:] et
[i] pl
[i] sq
vowel/i#_7 [i[] zh
vowel/i_8 [i] fr
vowel/i#_7 [i1] et
[i[] zh
vowel/i_8 [i] et
[i] fr
[i] ht
vowel/i_en [i:] en
[i:] en-us
@@ -1865,6 +1881,7 @@ vowel/ii#_2 [y] pl
[y] am
vowel/ii_3 [I] cy
[I] fi
[I1] et
[I] hi
[i] sk
[I] hr
@@ -1876,8 +1893,7 @@ vowel/ii#_3 [I2] en-us
vowel/ii_4 [I2] en
[I] en-us
[I2] tn
vowel/ii_5 [i1] et
[i] ta
vowel/ii_5 [i] ta
[i] bg
[I] la
[i] zh
@@ -1934,6 +1950,7 @@ vowel/o [o] base2
[o] it
[o/] it
[O] la
[o] es
[o] ca
[o] pt-pt
[o] grc
@@ -1949,6 +1966,7 @@ vowel/o [o] base2
[o:] wo
[o] te
[o:] te
[o] bo
vowel/o_2 [o:] cy
[o:] hi
[o:] hu
@@ -1975,9 +1993,7 @@ vowel/oe [W] af
vowel/oe_2 [W] no
vowel/oe_4 [W] sv
vowel/o_mid [U@] en-rp
[O] et
[o] et
[O1] et
[O] fr
[o] hu
[o] bg
@@ -2037,6 +2053,7 @@ vowel/oo_4 [O] base2
[0] en-wm
[V] en-wi
[3:] en-wi
[O1] et
[O:] hi
[O] it
[O] pa
@@ -2078,6 +2095,7 @@ vowel/u [u] base
[u] prs
[u] ak
[u:] wo
[u] bo
vowel/u# [u:] en-sc
[Y] tr
vowel/u_2 [u1] fi
@@ -2091,15 +2109,12 @@ vowel/u_2 [u1] fi
[u] am
[u] wo
vowel/u#_2 [u-] sv
vowel/u_3 [u] et
[u:] et
vowel/u#_3 [U] ta
[U:] ta
vowel/u#_4 [U] en-sc
[u:] en-sc
[y] ml
vowel/u_5 [U] et
[U1] et
vowel/u_5 [U1] et
[u] sw
[u] nso
[u] az
@@ -2151,10 +2166,13 @@ vowel/u_bck [u] base2
[u] ne
[u] pa
[u] mt
vowel/u_bck2 [u] fr
vowel/u_bck2 [u] et
[u] fr
[u:] fr
[u:] la
[u] es
[u] ht
vowel/u_bck3 [u:] et
vowel/uu [U] en
[U] en-n
[U] en-wm
@@ -2204,6 +2222,7 @@ vowel/y [y] base2
[y] et
[y:] et
[y] fr
[y-] fr
[y:] hu
[y] nl
[y] la

+ 1
- 1
phsource/ph_english View File

@@ -176,7 +176,7 @@ phoneme a
length 160
ChangeIfDiminished(a#)
IF thisPh(isUnstressed) THEN
FMT(vowel/a_7)
FMT(vowel/a_8)
ENDIF
FMT(vowel/a)
endphoneme

+ 57
- 84
phsource/ph_estonian View File

@@ -11,7 +11,7 @@ endphoneme
phoneme a
vowel starttype #a endtype #a
length 170
ChangeIfUnstressed(A)
// ChangeIfUnstressed(A)
FMT(vowel/aa_9)
endphoneme

@@ -21,11 +21,11 @@ phoneme a:
FMT(vowel/aa)
endphoneme

phoneme A
vowel starttype #a endtype #a
length 170
FMT(vowel/aa_8)
endphoneme
//phoneme A
// vowel starttype #a endtype #a
// length 170
// FMT(vowel/a#_2)
//endphoneme

phoneme A1
vowel starttype #a endtype #a
@@ -36,8 +36,8 @@ endphoneme
phoneme e
vowel starttype #e endtype #e
length 160
ChangeIfUnstressed(E)
FMT(vowel/e_7)
// ChangeIfUnstressed(E)
FMT(vowel/e#)
endphoneme

phoneme e:
@@ -46,23 +46,23 @@ phoneme e:
FMT(vowel/e_7)
endphoneme

phoneme E
vowel starttype #e endtype #e
length 160
FMT(vowel/ee_4)
endphoneme
//phoneme E
// vowel starttype #e endtype #e
// length 160
// FMT(vowel/ee_4)
//endphoneme

phoneme E1
vowel starttype #e endtype #e
length 240
FMT(vowel/ee_4)
FMT(vowel/ee#_2)
endphoneme

phoneme i
vowel starttype #i endtype #i
length 140
ChangeIfUnstressed(I)
FMT(vowel/i_2)
// ChangeIfUnstressed(I)
FMT(vowel/i_8)
endphoneme

phoneme i:
@@ -71,28 +71,28 @@ phoneme i:
FMT(vowel/i_7)
endphoneme

phoneme I
vowel starttype #i endtype #i
length 140
FMT(vowel/i_3)
endphoneme
//phoneme I
// vowel starttype #i endtype #i
// length 140
// FMT(vowel/i_3)
//endphoneme

phoneme I1
vowel starttype #i endtype #i
length 210
FMT(vowel/i_3)
FMT(vowel/ii_3)
endphoneme

phoneme i1
vowel starttype #i endtype #i
length 40
FMT(vowel/ii_5)
length 30
FMT(vowel/i#_7)
endphoneme

phoneme o
vowel starttype #o endtype #o
length 160
ChangeIfUnstressed(O)
// ChangeIfUnstressed(O)
FMT(vowel/o_mid)
endphoneme

@@ -102,36 +102,36 @@ phoneme o:
FMT(vowel/o)
endphoneme

phoneme O
vowel starttype #o endtype #o
length 150
FMT(vowel/o_mid)
endphoneme
//phoneme O
// vowel starttype #o endtype #o
// length 150
// FMT(vowel/o_mid)
//endphoneme

phoneme O1
vowel starttype #o endtype #o
length 225
FMT(vowel/o_mid)
FMT(vowel/oo_4)
endphoneme

phoneme u
vowel starttype #u endtype #u
length 145
ChangeIfUnstressed(U)
FMT(vowel/u_3)
// ChangeIfUnstressed(U)
FMT(vowel/u_bck2)
endphoneme

phoneme u: // TEST
vowel starttype #u endtype #u
length 290
FMT(vowel/u_3)
FMT(vowel/u_bck3)
endphoneme

phoneme U // TEST
vowel starttype #u endtype #u
length 145
FMT(vowel/u_5)
endphoneme
//phoneme U // TEST
// vowel starttype #u endtype #u
// length 145
// FMT(vowel/u_5)
//endphoneme

phoneme U1 // TEST
vowel starttype #u endtype #u
@@ -143,13 +143,13 @@ endphoneme
phoneme 8
vowel starttype #@ endtype #@
length 165
FMT(vowel/8_2)
FMT(vowel/8_7)
endphoneme

phoneme 8:
vowel starttype #@ endtype #@
length 330
FMT(vowel/8_7)
FMT(vowel/8_4)
endphoneme

// ä
@@ -234,12 +234,12 @@ endphoneme
// phoneme ca


phoneme 8u
vowel starttype #@ endtype #u
length 310
long
FMT(vdiph/8u)
endphoneme
//phoneme 8u
// vowel starttype #@ endtype #u
// length 310
// long
// FMT(vdiph/8u)
//endphoneme

// phoneme xu

@@ -250,20 +250,6 @@ endphoneme
//===========



phoneme R2 // this is [R2], but shorter
liquid
trill
lengthmod 6
ipa r
Vowelin f1=0 f2=1700 -300 300 f3=-300 80
Vowelout f1=2 f2=1700 -300 300 f3=-300 80 brk
FMT(r3/r_trill_short) addWav(r3/r_trill.wav, 50)
endphoneme




phoneme v // approximant, not fricative
vcd lbd frc
lengthmod 6
@@ -278,16 +264,16 @@ endphoneme


phoneme t // dental variant of /t/
vls dnt stop
voicingswitch d[
vls dnt stop lengthenstop
voicingswitch d
lengthmod 2
Vowelin f1=1 f2=1500 -250 250 f3=-100 80 amp=16
Vowelin f1=1 f2=1500 -250 250 f3=-100 80 amp=20
Vowelout f1=0 f2=1500 -300 250 f3=-100 80 rms=20

IF nextPh(isPause2) THEN
WAV(ustop/t_dnt, 35)
WAV(ustop/t_dnt, 60)
ENDIF
WAV(ustop/t_hi, 40)
WAV(ustop/t_hi, 80)
endphoneme


@@ -371,13 +357,14 @@ phoneme h
ELIF nextPh(#i) THEN
WAV(h/hi)
ELIF nextPh(#o) THEN
WAV(h/hu_fi, 70)
WAV(h/ho)
ELIF nextPh(#u) THEN
WAV(h/hu_fi, 80)
WAV(h/hu)
ENDIF
WAV(h/h_, 70) // no vowel following
endphoneme


// Palatalized versions of consonants

phoneme s^
@@ -386,24 +373,10 @@ phoneme s^
lengthmod 3
Vowelin f1=0 f2=1700 -300 300 f3=-100 80
Vowelout f1=0 f2=1700 -300 250 f3=-100 80 rms=20
// Vowelin f1=1 f2=2700 400 600 f3=200 70 rate len=70
// Vowelout f1=1 f2=2700 400 600 f3=200 70 rate len=70

WAV(ufric/s_pal)
endphoneme

//phoneme t;
// import_phoneme pl/t;
//endphoneme

//phoneme d
// import_phoneme pl/d
//endphoneme

//phoneme d;
// import_phoneme pl/d;
//endphoneme

phoneme t^
vls pal stop palatal
lengthmod 2
@@ -411,9 +384,9 @@ phoneme t^
Vowelin f1=0 f2=2700 400 600 f3=300 80 rate len=70
Vowelout f1=1 f2=2700 400 600 f3=200 70 len=50 colr=1
IF nextPh(isPause2) THEN
WAV(ustop/t_pzd, 30)
WAV(ustop/t_pzd, 60)
ENDIF
WAV(ustop/t_pzd, 60)
WAV(ustop/t_hi, 80)
endphoneme

phoneme d^

+ 45
- 3
phsource/ph_french View File

@@ -1,7 +1,7 @@
//====================================================
// French
//====================================================
// Updated 2011-04-15 Michel Such <[email protected]>
// Updated 2011-10-14 Michel Such <[email protected]>

phoneme #l virtual
// Used for l and l/
@@ -272,6 +272,13 @@ phoneme @
FMT(vowel/@_hgh)
endphoneme

phoneme @-
vowel starttype #@ endtype #@
unstressed
length 130
FMT(vowel/@_hgh)
endphoneme


phoneme a
vowel starttype #a endtype #a
@@ -281,7 +288,16 @@ phoneme a
length 170
ENDIF

FMT(vowel/a_7, 85)
FMT(vowel/a_7, 80)
endphoneme


phoneme a-
vowel starttype #a endtype #a
unstressed
length 130

FMT(vowel/a_7, 80)
endphoneme


@@ -305,6 +321,14 @@ phoneme e
endphoneme


phoneme e-
vowel starttype #e endtype #e
unstressed
length 130
FMT(vowel/e_8)
endphoneme


phoneme E
vowel starttype #e endtype #e

@@ -318,6 +342,14 @@ phoneme E
endphoneme


phoneme E-
vowel starttype #e endtype #e
unstressed
length 130
FMT(vowel/e_mid)
endphoneme


phoneme i
vowel starttype #i endtype #i
palatal
@@ -442,6 +474,15 @@ phoneme y
endphoneme


phoneme y-
vowel starttype #u endtype #u
unstressed

length 130
FMT(vowel/y)
endphoneme


phoneme W
vowel starttype #@ endtype #@
length 180
@@ -539,7 +580,7 @@ endphoneme
phoneme O~
vowel starttype #o endtype #o
length 190
FMT(vnasal/o_n2)
FMT(vnasal/o_n4)
endphoneme


@@ -958,6 +999,7 @@ A: a :
A@ a r
aa a :
aI a j
aI3 a j W2 r
aI@ a j W2 r
aU a w
aU@ a w @

+ 1
- 1
phsource/ph_slovak View File

@@ -37,7 +37,7 @@ phoneme a
length 120

IF thisPh(isWordEnd) AND thisPh(isUnstressed) THEN
FMT(vowel/a_7)
FMT(vowel/a_8)
ENDIF
FMT(vowel/a)
endphoneme

+ 41
- 11
phsource/ph_spanish View File

@@ -6,31 +6,47 @@

phoneme a
vowel starttype #a endtype #a
length 160
IF thisPh(isDiminished) THEN
FMT(vowel/a#)
ENDIF
FMT(vowel/a_2)
length 180
FMT(vowel/a_4)
endphoneme

phoneme e
vowel starttype #e endtype #e
length 170
length 190
FMT(vowel/e_mid2)
endphoneme

phoneme E
vowel starttype #e endtype #e
length 180
length 190
FMT(vowel/e_mid)
endphoneme

phoneme i
vowel starttype #i endtype #i
length 170
IfNextVowelAppend(;)
FMT(vowel/i)
endphoneme

phoneme o
vowel starttype #o endtype #o
length 190
FMT(vowel/o)
endphoneme

phoneme O
vowel starttype #o endtype #o
length 170
length 190
FMT(vowel/oo)
endphoneme

phoneme u
vowel starttype #u endtype #u
length 180
FMT(vowel/u_bck2)
endphoneme




@@ -41,7 +57,7 @@ phoneme g
Vowelin f1=2 f2=2300 200 300 f3=-300 80
Vowelout f1=2 f2=2300 250 300 f3=-300 80 brk

IF thisPh(isWordStart) AND nextPh(isVowel) THEN
IF nextPh(isVowel) OR nextPh(isRhotic) OR nextPh(isLiquid) THEN
IF prevPh(isPause) OR prevPh(isNasal) THEN
ELSE
ChangePhoneme(Q)
@@ -61,7 +77,7 @@ endphoneme
phoneme d
vcd dnt stop

IF thisPh(isWordStart) AND nextPh(isVowel) THEN
IF nextPh(isVowel) OR nextPh(isRhotic) OR nextPh(j) THEN
IF prevPh(isPause) OR prevPh(isNasal) OR prevPh(l) THEN
ELSE
ChangePhoneme(D)
@@ -74,7 +90,7 @@ endphoneme
phoneme b
vcd blb stop

IF thisPh(isWordStart) AND nextPh(isVowel) THEN
IF nextPh(isVowel) OR nextPh(isRhotic) OR nextPh(isLiquid) THEN
IF prevPh(isPause) OR prevPh(isNasal) THEN
ELSE
ChangePhoneme(B)
@@ -127,5 +143,19 @@ phoneme v# // a shorter [v], a little towards [b]
endphoneme


phoneme r
vcd alv flp rhotic
brkafter
ipa ɾ
lengthmod 3

IF nextPhW(isVowel) OR nextPhW(t) THEN
ChangePhoneme(**)
ENDIF

CALL base/*
endphoneme





+ 4
- 1
phsource/phonemes View File

@@ -833,7 +833,7 @@ endphoneme


phoneme ** // TEST flap
liquid alv
liquid alv rhotic
ipa ɾ
lengthmod 3
Vowelout f1=3 f2=1600 -300 300 f3=-300 80 rms=35 len=15
@@ -1881,3 +1881,6 @@ include ph_setswana

phonemetable mt base
include ph_maltese

phonemetable bo hi
include ph_tibetan

BIN
phsource/ufric/s_pal.wav View File


BIN
phsource/vdiph/au_4 View File


BIN
phsource/vdiph/vowelchart.png View File


BIN
phsource/vdiph2/vowelchart.png View File


BIN
phsource/vnasal/vowelchart.png View File


BIN
phsource/vowel/a_7 View File


BIN
phsource/vowel/vowelchart.png View File


+ 22
- 14
src/compiledict.cpp View File

@@ -373,6 +373,7 @@ static int compile_line(char *linebuf, char *dict_line, int *hash)
unsigned int ix;
int step;
unsigned int n_flag_codes = 0;
int flagnum;
int flag_offset;
int length;
int multiple_words = 0;
@@ -395,10 +396,6 @@ static char nullstring[] = {0};
text_not_phonemes = 0;
phonetic = word = nullstring;

if(memcmp(linebuf,"_-",2)==0)
{
step=1; // TEST
}
p = linebuf;
// while(isspace2(*p)) p++;

@@ -460,26 +457,26 @@ step=1; // TEST
while(!isspace2(c = *p)) p++;
*p = 0;
ix = LookupMnem(mnem_flags,mnemptr);
if(ix > 0)
flagnum = LookupMnem(mnem_flags,mnemptr);
if(flagnum > 0)
{
if(ix == 200)
if(flagnum == 200)
{
text_mode = 1;
}
else
if(ix == 201)
if(flagnum == 201)
{
text_mode = 0;
}
else
if(ix == BITNUM_FLAG_TEXTMODE)
if(flagnum == BITNUM_FLAG_TEXTMODE)
{
text_not_phonemes = 1;
}
else
{
flag_codes[n_flag_codes++] = ix;
flag_codes[n_flag_codes++] = flagnum;
}
}
else
@@ -539,11 +536,21 @@ step=1; // TEST
}
}
else
if((c == ')') && multiple_words)
if(c == ')')
{
p[0] = 0;
step = 3;
multiple_words = 0;
if(multiple_words)
{
p[0] = 0;
multiple_words = 0;
step = 3;
}
else
if(word[0] != '_')
{
fprintf(f_log, "%5d: Missing '('\n", linenum);
error_count++;
step = 3;
}
}
break;

@@ -720,6 +727,7 @@ step=1; // TEST
if(multiple_words > 10)
{
fprintf(f_log,"%5d: Two many parts in a multi-word entry: %d\n",linenum,multiple_words);
error_count++;
}
else
{

+ 3
- 4
src/dictionary.cpp View File

@@ -776,7 +776,7 @@ static int IsLetter(Translator *tr, int letter, int group)

if(tr->letter_bits_offset > 0)
{
if(((letter2 = (letter - tr->letter_bits_offset)) > 0) && (letter2 < 0x80))
if(((letter2 = (letter - tr->letter_bits_offset)) > 0) && (letter2 < 0x100))
letter = letter2;
else
return(0);
@@ -787,7 +787,7 @@ static int IsLetter(Translator *tr, int letter, int group)
return(tr->letter_bits[remove_accent[letter-0xc0]] & (1L << group));
}

if((letter >= 0) && (letter < 0x80))
if((letter >= 0) && (letter < 0x100))
return(tr->letter_bits[letter] & (1L << group));

return(0);
@@ -1610,7 +1610,7 @@ void SetWordStress(Translator *tr, char *output, unsigned int *dictionary_flags,

if(v_stress <= 1)
{
if((v > 1) && (max_stress >= 4) && (stressflags & 4) && (v == (vowel_count-1)))
if((v > 1) && (max_stress >= 2) && (stressflags & 4) && (v == (vowel_count-1)))
{
// option: mark unstressed final syllable as diminished
v_stress = 0;
@@ -2573,7 +2573,6 @@ int TranslateRules(Translator *tr, char *p_start, char *phonemes, int ph_size, c
if((match1.points == 0) && ((option_sayas & 0x10) == 0))
{
n = utf8_in(&letter,p-1)-1;

if(tr->letter_bits_offset > 0)
{
// not a Latin alphabet, switch to the default Latin alphabet language

+ 9
- 0
src/readclause.cpp View File

@@ -94,6 +94,9 @@ static const unsigned short punct_chars[] = {',','.','?','!',':',';',
0x0b1b, // Arabic ;
0x061f, // Arabic ?

0x0f0d, // Tibet Shad
0x0f0e,

0x1362, // Ethiopic period
0x1363,
0x1364,
@@ -137,6 +140,9 @@ static const unsigned int punct_attributes [] = { 0,
CLAUSE_SEMICOLON, // Arabic ;
CLAUSE_QUESTION, // Arabic question mark

CLAUSE_PERIOD+0x8000, // Tibet period
CLAUSE_PARAGRAPH,

CLAUSE_PERIOD, // Ethiopic period
CLAUSE_COMMA, // Ethiopic comma
CLAUSE_SEMICOLON, // Ethiopic semicolon
@@ -2391,6 +2397,9 @@ f_input = f_in; // for GetC etc
continue;
}

if(c1 == 0xf0b)
c1 = ' '; // Tibet inter-syllabic mark, ?? replace by space ??

if(iswspace(c1))
{
char *p_word;

+ 8
- 0
src/synth_mbrola.cpp View File

@@ -218,6 +218,8 @@ static int GetMbrName(PHONEME_LIST *plist, PHONEME_TAB *ph, PHONEME_TAB *ph_prev
// bit 2 only at the start of a word
// bit 3 don't match two phonemes across a word boundary
// bit 4 add this phoneme name as a prefix to the next phoneme name (used for de4 phoneme prefix '?')
// bit 5 only in stressed syllable
// bit 6 only at the end of a word

*name2=0;
*split=0;
@@ -257,6 +259,12 @@ static int GetMbrName(PHONEME_LIST *plist, PHONEME_TAB *ph, PHONEME_TAB *ph_prev
if((pr->control & 4) && (plist->newword == 0)) // only at start of word
found = 0;

if((pr->control & 0x40) && (plist[1].newword == 0)) // only at the end of a word
found = 0;

if((pr->control & 0x20) && (plist->stresslevel < plist->wordstress))
found = 0; // only in stressed syllables

if(found)
{
*name2 = pr->mbr_name2;

+ 2
- 2
src/synthdata.cpp View File

@@ -35,8 +35,8 @@
#include "translate.h"
#include "wave.h"

const char *version_string = "1.45.47 24.Oct.11";
const int version_phdata = 0x014500;
const char *version_string = "1.46.01 22.Nov.11";
const int version_phdata = 0x014600;

int option_device_number = -1;
FILE *f_logespeak = NULL;

+ 25
- 3
src/tr_languages.cpp View File

@@ -60,9 +60,11 @@
#define OFFSET_KANNADA 0xc80
#define OFFSET_MALAYALAM 0xd00
#define OFFSET_SINHALA 0x0d80
#define OFFSET_TIBET 0x0f00
#define OFFSET_GEORGIAN 0x1080

#define OFFSET_KOREAN 0x1100
#define OFFSET_ETHIOPIC 0x1200


static void Translator_Russian(Translator *tr);

@@ -375,6 +377,7 @@ Translator *SelectTranslator(const char *name)
case L('a','m'): // Amharic, Ethiopia
{
SetupTranslator(tr,stress_lengths_fr,stress_amps_fr);
tr->letter_bits_offset = OFFSET_ETHIOPIC;
tr->langopts.stress_rule = STRESSPOSN_1L;
tr->langopts.stress_flags = 0x0024; // don't use secondary stress
tr->langopts.length_mods0 = tr->langopts.length_mods; // don't lengthen vowels in the last syllable
@@ -422,6 +425,19 @@ Translator *SelectTranslator(const char *name)
}
break;

case L('b','o'): // Tibet
{
tr->langopts.stress_rule = STRESSPOSN_1L;
tr->letter_bits_offset = OFFSET_TIBET;
SetLetterBitsRange(tr,LETTERGP_A,0x71,0x7d); // vowel signs
SetLetterBitsRange(tr,LETTERGP_B,0x71,0x81); // vowel signs and subjoined letters
SetLetterBitsRange(tr,LETTERGP_B,0x90,0xbc);
SetLetterBitsRange(tr,LETTERGP_C,0x40,0x6c); // consonant letters (not subjoined)
tr->langopts.param[LOPT_UNPRONOUNCABLE] = 1; // disable check for unpronouncable words
tr->langopts.numbers = 1;
}
break;

case L('c','y'): // Welsh
{
static const short stress_lengths_cy[8] = {170,220, 180,180, 0, 0, 250,270};
@@ -578,8 +594,7 @@ Translator *SelectTranslator(const char *name)
case L('c','a'): // Catalan
case L_pap: // Papiamento
{
static const short stress_lengths_es[8] = {180, 210, 190, 190, 0, 0, 230, 260};
// static const short stress_lengths_es[8] = {170, 200, 180, 180, 0, 0, 220, 250};
static const short stress_lengths_es[8] = {180, 190, 230, 180, 0, 0, 240, 270};
static const unsigned char stress_amps_es[8] = {16,12, 18,18, 20,20, 20,20 }; // 'diminished' is used to mark a quieter, final unstressed syllable
static const wchar_t ca_punct_within_word[] = {'\'',0xb7,0}; // ca: allow middle-dot within word

@@ -1276,6 +1291,13 @@ SetLengthMods(tr,3); // all equal
}
break;

case L('u','k'): // Ukrainian
{
SetCyrillicLetters(tr);
tr->langopts.param[LOPT_UNPRONOUNCABLE] = 0x432; // [v] don't count this character at start of word
}
break;

case L('u','r'): // Urdu
tr->letter_bits_offset = OFFSET_ARABIC;
tr->langopts.param[LOPT_UNPRONOUNCABLE] = 1; // disable check for unpronouncable words

+ 7
- 1
src/translate.cpp View File

@@ -401,6 +401,9 @@ int IsAlpha(unsigned int c)
if((c >= 0x780) && (c <= 0x7b1))
return(1); // taani/divehi (maldives)

if((c >= 0xf40) && (c <= 0xfbc))
return(1); // tibetan

if((c >= 0x1100) && (c <= 0x11ff))
return(1); //Korean jamo

@@ -1436,9 +1439,11 @@ if(dictionary_flags2[0] & FLAG_ABBREV)
dictionary_flags[0] &= ~FLAG_PAUSE1;
}

#ifdef deleted
// but it causes problems if these are not a person name
if(tr->translator_name == L('h','u'))
{
// lang=Hungarian, If the last two words of a clause have capital letters (eg. a person name), unstress the last word.
// lang=hu, If the last two words of a clause have capital letters (eg. a person name), unstress the last word.
if((wflags & (FLAG_LAST_WORD | FLAG_FIRST_UPPER | FLAG_ALL_UPPER | FLAG_FIRST_WORD)) == (FLAG_LAST_WORD | FLAG_FIRST_UPPER))
{
if(((wtab[-1].flags & (FLAG_FIRST_UPPER | FLAG_ALL_UPPER)) == FLAG_FIRST_UPPER) && ((tr->clause_terminator != 0x90028) || (wflags & FLAG_HAS_DOT)))
@@ -1447,6 +1452,7 @@ if(dictionary_flags2[0] & FLAG_ABBREV)
}
}
}
#endif

if((wflags & FLAG_HYPHEN) && (tr->langopts.stress_flags & S_HYPEN_UNSTRESS))
{

Loading…
Cancel
Save