eSpeak NG is an open source speech synthesizer that supports more than hundred languages and accents.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

ta_rules 12KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608
  1. // This file is UTF8 encoded
  2. // Spelling to phoneme rules for Tamil
  3. // B means a combining vowel sign, or a virama
  4. // K means a consonant or end-of-word
  5. .replace
  6. ௦ 0 // Tamil numbers
  7. ௧ 1
  8. ௨ 2
  9. ௩ 3
  10. ௪ 4
  11. ௫ 5
  12. ௬ 6
  13. ௭ 7
  14. ௮ 8
  15. ௯ 9
  16. ொ ொ
  17. ோ ோ
  18. ௌ ௌ
  19. // consonants
  20. .group க
  21. க்ஷ ks.V
  22. க்ஷ (B ks.
  23. க gV // inter-vocalic, unless there is virama before or after
  24. க (B g
  25. _) க kV
  26. _) க (B k
  27. _) க (T gV // if word has $alt attribute in ta_list
  28. _) க (BT g // $alt
  29. க்க kkV
  30. க்க (B kk
  31. ற்) க _kV
  32. ற்) க (B _k
  33. ட்) க kV
  34. ட்) க (B k
  35. க (ிரு k
  36. க (ீத g
  37. க (ஜ gV
  38. _) க (ௌ g
  39. _) க (ம்பீர gV
  40. _) க (ந்தர்வ gV
  41. _) க (ோவிந்த g
  42. _) க (ணே gV
  43. _) க (ருட gV
  44. _) க (ர்ஜ gV
  45. _) க (ாண்டாமிருக g
  46. _) க (ோந்து g
  47. _) க (ாந்த g
  48. _) க (ுண்ட g
  49. _) க (ோபுர g
  50. _) க (ுகன g
  51. _) க (ணபதி gV
  52. _) க (ணீர gV
  53. _) க (ோதுமை g
  54. _) க (ுகை g
  55. _) க (ோஷ g
  56. _) க (ுண g
  57. _) க (தியில் gV
  58. _) க (டிகார gV
  59. வி) க்ட (ோரியா kt. // victoria
  60. க (ாரன k
  61. க (ாரர k
  62. _) கோப (ித்து ko:b
  63. _) க (ோபப் k
  64. _) க (ெட்டி g
  65. _) க (வண gV
  66. _) க (ோகுல g
  67. கோப (ால go:p
  68. _) க (ோபிய g
  69. _) க (ோபிநா g
  70. _) க (ோபிசெட் g
  71. _) க (ூடலூர g
  72. _) க (ுடியாத்த g
  73. _) க (வன gV
  74. _) க (ுருவின g
  75. _) க (ுருவிட g
  76. _) க (ுருக்கள g
  77. _) க (ுருவோட g
  78. _) க (ுருவுடை g
  79. _) க (ுருரா g
  80. _) க (ுருநா g
  81. _) க (ுருவாய g
  82. .group ங
  83. ங NV
  84. ங (B N
  85. .group ச
  86. ச sV // ?? [z]
  87. ச (B s
  88. _) ச sV
  89. _) ச (B s
  90. ச்ச tS:V
  91. ச்ச (B tS:
  92. ட்) ச tSV
  93. ட்) ச (B tS
  94. ற்) ச tSV
  95. ற்) ச (B tS
  96. ஞ்) ச dZV
  97. ஞ்) ச (B dZ
  98. ச் (_ tS
  99. ச்_) ச tSV // previous word ends in ச்
  100. ச்_) ச (B tS
  101. _) ச (ிட் tS
  102. _) ச (ின் tS
  103. _) ச (ேரி tS
  104. _) ச (ப்பாத்தி tSV
  105. _) சிரு (ஷ்டி sri
  106. ச (ாந்தி s.
  107. ச (ண்மு s.V
  108. .group ஜ
  109. ஜ dZV
  110. ஜ (B dZ
  111. .group ஞ
  112. ஞ n^V
  113. ஞ (B n^
  114. .group ட
  115. ட d.V
  116. ட (B d.
  117. _) ட (ீ t.
  118. ட்ட t.t.V
  119. ட்ட (B t.t.
  120. ஷ்) ட t.V
  121. ஷ்) ட (B t.
  122. _) டாக்ட (ர d.a:kt.V
  123. _) ட (ோக்கியோ t.
  124. ிங்) ட (ன் t.V // -ington
  125. _) ட (ாக்க t. // talkies
  126. .group ண
  127. ண n.V
  128. ண (B n.
  129. .group த
  130. த dV
  131. த (B d
  132. _) த tV
  133. _) த (B t
  134. _) த (T dV // if word has $alt attribute in ta_list
  135. _) த (BT d // if word has $alt
  136. த்த ttV
  137. த்த (B tt
  138. க்) த tV
  139. க்) த (B t
  140. ஸ்) த tV
  141. ஸ்) த (B t
  142. // exceptions, த as [d]
  143. _) த (ர்ம dV
  144. _) த (ுர் d
  145. _) த (ூர d
  146. _) த (ெய்வ d
  147. _) த (ுஷ் d
  148. _) த (க்ஷிணா dV
  149. _) த (ண்ட dV
  150. _) த (ண்டவாள tV
  151. _) த (ருமி dV
  152. _) த (ர்பை dV
  153. _) த (ாவா d
  154. _) த (ாதா d
  155. _) த (ரித்திரம dV
  156. _) த (ர்பார dV
  157. _) த (ீர்க d
  158. _) த (ீரன d
  159. _) த (ீரர் d
  160. _) த (ீரச் d
  161. _) த (ினுச d
  162. _) த (ாராவி d
  163. _) த (ர்க dV
  164. // _) த (ான d
  165. _) த (ேக d
  166. _) த (ேக்கு t
  167. _) த (ேக்கிலை t
  168. _) த (ேக்கடி t
  169. _) த (ிரவிய d
  170. _) த (ூப d
  171. _) த (ீப d
  172. _) த (ைரிய d
  173. _) த (ிட d
  174. _) த (ிரவ d
  175. _) த (ிடீ d
  176. _) த (ிவச d
  177. _) த (ியான d
  178. _) த (ானிய d
  179. _) த (ுக்க d
  180. _) த (ிகில d
  181. _) த (ூம d
  182. _) த (ாவணி d
  183. _) த (ாம்_தூம d
  184. _) த (ாடி d
  185. _) த (ாச d
  186. _) த (சரா dV
  187. _) த (ோஷ d
  188. _) த (ரணி dV
  189. _) த (ாரணி d
  190. _) த (ோசை d
  191. _) த (வம dV
  192. _) த (ட்சன dV
  193. _) த (ாட்சாய d
  194. _) த (ாக்கா d
  195. _) த (ில்லி d
  196. _) த (டித்த dV
  197. _) த (டியன dV
  198. _) த (டியர dV
  199. _) த (ிக்கு d
  200. _) த (ிக்கு_வாய t
  201. _) த (ிக்கில d
  202. _) த (னபால dV
  203. _) த (னசேகரன dV
  204. _) த (னலட்சுமி dV
  205. _) த (னகோடி dV
  206. _) த (னன்ஜெயன dV
  207. _) த (ிசை d
  208. _) த (சை dV
  209. _) த (னராஜ dV
  210. _) த (ன்மந்திரி dV
  211. _) த (ினம d
  212. _) த (ினக d
  213. _) த (னலக்ஷ்மி dV
  214. _) த (க்க்ஷிண dV
  215. _) த (ட்சிண dV
  216. _) த (ன்ராஜ dV
  217. _) த (ாராபுர d
  218. _) த (டி_மாட dV
  219. _) த (ேவன d
  220. _) த (ேவி d
  221. _) த (ேவர்க d
  222. _) த (ேவதை d
  223. _) த (ேவாம்ச d
  224. _) த (ிவ்ய d
  225. _) த (ிண்டிவன d
  226. _) த (ுறை d
  227. _) த (ிண்டுக்கல d
  228. _) த (மயந்தி dV
  229. _) த (ுரோண d
  230. _) த (ுரியோதனன d
  231. _) த (ுச்சாதனன d
  232. _) த (ிரௌபதி d
  233. யு) த்த ddV
  234. யு) த்த(B dd
  235. பு) த்த (ி dd
  236. பு) த்த (ியி dd
  237. பு) த்த (ர ddV
  238. பு) த்த (ன ddV
  239. _சாந்) த (ி t
  240. _சும) த (ி t
  241. _வசந்) த (ி t
  242. _சுகந்) த (ி t
  243. _வனி) த (ா t
  244. _சுனி) த (ா t
  245. _ல) த (ா t
  246. பிரேமல) த (ா t
  247. _ரேவ) த (ி t
  248. _வினி) த (ா t
  249. _வசந்) த tV
  250. _பார்வ) த (ி t
  251. பிரபாவ) த (ி t
  252. _கோம) த (ி t
  253. _பிர) த (ீ t
  254. _) திரு (ஷ்டி dri
  255. _) திரு (திரா dri
  256. _) துர (ோண tr
  257. _) திர (ௌபதி tr
  258. .group ந
  259. ந nV
  260. ந (B n // dental n
  261. .group ன
  262. ன nV
  263. ன (B n // alveolar n
  264. .group ப
  265. ப bV
  266. ப (B b
  267. _) ப pV
  268. _) ப (B p
  269. _) ப (T bV // if word has $alt attribute in ta_list
  270. _) ப (BT b // if word has $alt
  271. ப்ப ppV
  272. ப்ப (B pp
  273. ட்) ப pV
  274. ட்) ப (B p
  275. ற்) ப pV
  276. ற்) ப (B p
  277. று) ப _pV
  278. று) ப(B _p
  279. ன்) ப pV
  280. ன்) ப (B p
  281. ம) ப pV
  282. ம) ப (ா p
  283. ம) ப (B b
  284. த) ப pV
  285. த) ப (ா p
  286. த) ப (B b
  287. @) பத (ி pVt
  288. ப (ுர p
  289. ப (ால p
  290. ப (ாள p
  291. ம்) ப (ா b
  292. // _) ப (ால b
  293. _) ப (ால் p
  294. _) ப (ாலின் p
  295. _) ப (ாலை p
  296. // _) ப (ாலில் p
  297. _) ப (ாலுடன் p
  298. // _) ப (ாலினுடைய p
  299. _) ப (ாலாபிஷேக p
  300. _) ப (ாலு b
  301. _) ப (ானு b
  302. _) ப (ீம b
  303. _) ப (காசுர bV
  304. _) ப (ோஜ b
  305. _) ப (தில bV
  306. _) ப (ஜ bV
  307. _) ப (ைரவ b
  308. _) ப (யம bV
  309. _) ப (ார்கவி b
  310. _) ப (ூதேவி b
  311. _) ப (ம்பாய bV
  312. _) ப (ாதுஷா b
  313. _) ப (க்த bV
  314. _) ப (லம bV
  315. _) ப (லவான bV
  316. _) ப (ிராமண b
  317. _) ப (ிரம்ம b
  318. _) ப (ம்பர bV
  319. _) ப (லூன bV
  320. _) ப (ூமி b
  321. _) ப (ூலோக b
  322. _) ப (ூகோல b
  323. _) ப (ூத b
  324. _) ப (ுதன b
  325. _) ப (லி bV
  326. _) ப (கவான bV
  327. _) ப (ௌதிக b
  328. _) ப (ரோட bV
  329. _) ப (ெர்லிங b
  330. _) ப (ீஜிங b
  331. _) ப (ுவன b
  332. _) ப (ரதநாட்டிய bV
  333. _) ப (ேதலித்த b
  334. _) ப (ோன்ஸ்லே b
  335. _) ப (ௌத்த b
  336. _) ப (கீர bV
  337. _) ப (கிரங்க bV
  338. _) ப (ோபால b
  339. _) ப (ெங்களூர b
  340. _) ப (ூபாள b
  341. _) புத்த(K buddV
  342. _) புத் (தJ_புத+ put
  343. _) ப (னியன bV
  344. கோ) ப (ி p
  345. _) ப (ாலச b
  346. _) ப (ாலக b
  347. _) ப (ாலமு b
  348. _) ப (ாலதண் b
  349. _) ப (ூவுலக b
  350. _) ப (ிரகஸ்பதி b
  351. _) ப (ிரகதீ b
  352. _) ப (ொம்மை b
  353. _) ப (ொம்மல b
  354. _) ப (ாக்கி b
  355. _) ப (ஸ bV
  356. _) ப (ாஷை b
  357. _) ப (ிரம்மை b
  358. _) ப (ாரம b
  359. _) ப (ங்களா bV
  360. _) ப (ங்கம bV
  361. _) ப (ுட்டி b
  362. _) பிர (ம்மன brV
  363. _) பிர (ாமணன br
  364. _) பிர (கஸ்பதி brV
  365. _) பிர (கதீ brV
  366. _) பிர (கலாதன prV
  367. _) பிர (காஷ prV
  368. _) பிர (காச prV
  369. _) பிர (சாத prV
  370. _) பிர (ே pr
  371. _) பிரு (கன்நளை bri
  372. _) பிர (சாந்தி prV
  373. _) பிர (ம்மை brV
  374. _) பிர (சன்ன prV
  375. _) பிர (ச்சனை prV
  376. _) பிர (ப prV
  377. _) பிர (தீ prV
  378. // musical notes
  379. சா) ப (ா p
  380. ரி) ப (K pV
  381. ரீ) ப (K pV
  382. ரி) ப (ா p
  383. ரீ) ப (ா p
  384. ம) ப (K pV
  385. மா) ப (K pV
  386. ம) ப (ா p
  387. மா) ப( ா p
  388. பப (K pVpV
  389. பாப (K pa:pV
  390. பப (ா pVp
  391. பாப (ா pa:p
  392. // த) ப (K pV
  393. தா) ப (K pV
  394. // த) ப (ா p
  395. தா) ப (ா p
  396. னி) ப (K pV
  397. னீ) ப (K pV
  398. னி) ப (ா p
  399. னீ) ப( ா p
  400. க) ப (K pV
  401. க) ப (ா p
  402. கா) ப (K pV
  403. கா) ப (ா p
  404. // (exceptions)
  405. தா) ப (ம் bV
  406. _த) ப (ால b
  407. _க) ப (ால b
  408. _கா) ப (ந்து bV
  409. .group ம
  410. ம mV
  411. ம (B m
  412. .group ய
  413. ய jV
  414. ய (B j
  415. .group ர
  416. ர rV
  417. ர (B r
  418. .group ற
  419. ற RV
  420. ற (B R
  421. ற் (ற t. // RR -> t.R
  422. ற்ச tS:
  423. ற்ச (B tS:
  424. .group ல
  425. ல lV
  426. ல (B l
  427. .group ள
  428. ள l.V
  429. ள (B l.
  430. .group ழ
  431. ழ z.V
  432. ழ (B z.
  433. .group வ
  434. வ vV
  435. வ (B v
  436. .group ஶ
  437. ஶ SV
  438. ஶ (B S
  439. .group ஷ
  440. ஷ s.V
  441. ஷ (B s.
  442. .group ஸ
  443. ஸ sV
  444. ஸ (B s
  445. .group ஹ
  446. ஹ HV
  447. ஹ (B H
  448. .group ஃ
  449. ஃ h
  450. ஃப fV
  451. ஃப (B f
  452. ஃத QdV
  453. ஃத (B Qd
  454. ஃக gQV
  455. ஃக (B gQ
  456. // vowel letters
  457. .group 0xe0ae // characters which start with UTF-8 bytes: [e0 ae]
  458. ஂ // anusvara
  459. அ a
  460. ஆ a:
  461. இ i
  462. _) இ (ரா // silent before 'raa'
  463. ஈ i:
  464. உ u
  465. ஊ u:
  466. எ e
  467. _) எ ;e // add a short [j] sound at start of word ?
  468. ஏ e:
  469. _) ஏ ;e: // add a short [j] sound at start of word ?
  470. ஐ aI
  471. ஒ o
  472. ஓ o:
  473. ஔ aU
  474. // combining vowels
  475. ா a:
  476. ி i
  477. .group 0xe0af // characters which start with UTF-8 bytes: [e0 af]
  478. ீ i:
  479. ு u
  480. ூ u:
  481. ெ e
  482. ே e:
  483. ை aI
  484. ொ o
  485. ோ o:
  486. ௌ aU
  487. ் // virama
  488. ௗ : // aU length mark
  489. .group 0xe0a4 // devanagari
  490. \340\244 _^_HI // switch to hindi voice
  491. .group 0xe0a5 // devanagari
  492. \340\245 _^_HI
  493. .group
  494. ் // virama
  495. $ dolV
  496. D) . (D+ _pul.l.i
  497. !) rs (_.D ru:pi:z // Rs.
  498. __) - (_D kVz.ittVl // minus கழித்தல்
  499. A_) - (_D _
  500. C_) - (_D _