eSpeak NG is an open source speech synthesizer that supports more than hundred languages and accents.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

ar_rules 11KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366
  1. // * Arabic Language ar ar_rules
  2. // * This file writen by Taha Zerrouki 2012
  3. // ***************************************************************************
  4. // * This program is free software; you can redistribute it and/or modify *
  5. // * it under the terms of the GNU General Public License as published by *
  6. // * the Free Software Foundation; either version 3 of the License, or *
  7. // * (at your option) any later version. *
  8. // * *
  9. // * This program is distributed in the hope that it will be useful, *
  10. // * but WITHOUT ANY WARRANTY; without even the implied warranty of *
  11. // * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the *
  12. // * GNU General Public License for more details. *
  13. // * *
  14. // * You should have received a copy of the GNU General Public License *
  15. // * along with this program; if not, see: *
  16. // * <http://www.gnu.org/licenses/>. *
  17. // ***************************************************************************/
  18. //
  19. // This file is UTF-8 encoded
  20. // all words must be LOWER CASE (although the initial letter will be automatically
  21. // converted if it's a 7bit ascii character)
  22. // Text to phoneme rules for Arabic
  23. //
  24. // replace Arabic eastern character numbers with Arabic western character numbers
  25. .replace
  26. ٠ 0
  27. ۰ 0
  28. ۱ 1
  29. ١ 1
  30. ٢ 2
  31. ۲ 2
  32. ٣ 3
  33. ۳ 3
  34. ٤ 4
  35. ۴ 4
  36. ٥ 5
  37. ۵ 5
  38. ٦ 6
  39. ۶ 6
  40. ٧ 7
  41. ۷ 7
  42. ٨ 8
  43. ۸ 8
  44. ٩ 9
  45. ۹ 9
  46. ، ,
  47. ؛ ;
  48. //all vowels
  49. .L01 ا ي و َ ُ ِ ً ٌ ٍ ّ ى
  50. //short vowels (commonly unwritten )
  51. .L02
  52. //list of consonants
  53. .L03 ب پ ت ة ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ئ ؤ ء أ آ إ ه
  54. // all Arabic characters without ا آ
  55. .L04 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ت ن م ك َ ُ ِ ّ ـ « » ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ
  56. // all Arabic characters without short vowels and A
  57. .L05 ض ص ث ق ف غ ع ه خ ح ج ش س ي ب ل ت ن م ك ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ
  58. // group of digits
  59. .L06 0 1 2 3 4 5 6 7 8 9
  60. // all Arabic characters
  61. .L09 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ا ت ن م ك َ ُ ِ ّ آ ـ « » ظ ط ز ر ذ د ئ و ة ي ژ ؤ إ أ ء ؟ پ گ
  62. // Arabic Sun characters
  63. .L10 ض ص ث ش س ل ت ن ظ ط ز ر ذ د
  64. // Arabic Moon characters
  65. .L11 ق ف غ ع ه خ ح ج ي ب م ك و إ أ ء
  66. .group آ
  67. آ ?aa
  68. .group ا
  69. L03) ا aa // if a consonant is before it, make the fatha long
  70. L03) ا (L03 aa
  71. ا (َ ?
  72. ا (ُ ?
  73. ا (ِ ?
  74. _) ا a // make the previous fatha long
  75. _) ال (L10P2 ?a //الشمس
  76. _) ال (L11P2 ?al //القمر
  77. _) ال (تP2 ?at
  78. _) ال (ثP2 ?aT
  79. _) ال (دP2 ?ad
  80. _) ال (ذP2 ?aD
  81. _) ال (رP2 ?ar
  82. _) ال (زP2 ?az
  83. _) ال (سP2 ?as
  84. _) ال (شّP2 ?a
  85. _) ال (شP2 ?aS
  86. _) ال (صP2 ?as[
  87. _) ال (ضP2 ?adH
  88. _) ال (ظP2 ?aZ
  89. _) ال (لP2 ?al
  90. _) ال (نP2 ?an
  91. _ب) ا (ل i
  92. .group أ
  93. أ a
  94. .group إ
  95. إ ?i
  96. .group ب
  97. ب b
  98. بّ Bb
  99. _) بال (L10P3 bi //بالشمس
  100. _) بال (L11P3 bil //بالقمر
  101. _) بال (تP3 bit
  102. _) بال (ثP3 biT
  103. _) بال (دP3 bid
  104. _) بال (ذP3 biD
  105. _) بال (رP3 bir
  106. _) بال (زP3 biz
  107. _) بال (سP3 bis
  108. _) بال (شP3 biS
  109. _) بال (صP3 bis[
  110. _) بال (ضP3 bidH
  111. _) بال (طP3 bit[
  112. _) بال (ظP3 biZ
  113. _) بال (لP3 bil
  114. _) بال (نP3 bin
  115. .group پ
  116. پ p
  117. .group ت
  118. ت t
  119. _) ت (َP1 t
  120. _) ت (P1 ta //تسأل
  121. _َ) ت (P2 t
  122. ت (_S1 at //سألت
  123. تّ tt
  124. .group ث
  125. ث T
  126. .group ج
  127. ج dZ
  128. جّ dZdZ
  129. .group ح
  130. ح H
  131. .group خ
  132. خ X
  133. .group د
  134. د d
  135. دّ dd
  136. .group ذ
  137. ذ D
  138. .group ر
  139. ر r
  140. .group ز
  141. ز z
  142. .group س
  143. س s
  144. سّ ss
  145. .group ش
  146. ش S
  147. شّ SS
  148. .group ص
  149. ص s[
  150. صّ s[s[
  151. .group ض
  152. ض dH
  153. .group ط
  154. ط t[
  155. .group ظ
  156. ظ Z
  157. .group ع
  158. ع A
  159. .group غ
  160. غ gH
  161. .group ف
  162. ف f
  163. _) فال (L10P3 fa //فالشمس
  164. _) فَال (L10P4 fa
  165. _) فَالْ (L10P4 fa
  166. _) فال (L11P3 fal //فالقمر
  167. _) فَال (L11P4 fa
  168. _) فَالْ (L11P4 fal
  169. _) فال (تP3 fat
  170. _) فال (ثP3 faT
  171. _) فال (دP3 fad
  172. _) فال (ذP3 faD
  173. _) فال (رP3 far
  174. _) فال (زP3 faz
  175. _) فال (سP3 fas
  176. _) فال (شP3 faS
  177. _) فال (صP3 fas[
  178. _) فال (ضP3 fadH
  179. _) فال (طP3 fat[
  180. _) فال (ظP3 faZ
  181. _) فال (لP3 fal
  182. _) فال (نP3 fan
  183. .group ق
  184. ق q
  185. .group ك
  186. ك k
  187. ك (_S1 ka // الضمير المتصل
  188. _) كال (L10P3 ka //كالشمس
  189. _) كَال (L10P4 ka
  190. _) كَالْ (L10P4 ka
  191. _) كال (L11P3 kal //كالقمر
  192. _) كَالْ (L11P4 kal
  193. _) كال (تP3 kat
  194. _) كال (ثP3 kaT
  195. _) كال (دP3 kad
  196. _) كال (ذP3 kaD
  197. _) كال (رP3 kar
  198. _) كال (زP3 kaz
  199. _) كال (سP3 kas
  200. _) كال (شP3 kaS
  201. _) كال (صP3 kas[
  202. _) كال (ضP3 kadH
  203. _) كال (طP3 kat[
  204. _) كال (ظP3 kaZ
  205. _) كال (لP3 kal
  206. _) كال (نP3 kan
  207. كم (_S2 kum //الضمير المتصل
  208. كما (_S3 kumaa //الضمير المتصل
  209. كن (_S2 kunna //الضمير المتصل
  210. .group گ
  211. گ g
  212. .group ل
  213. ل l
  214. _ا) ل (L10 ' // Sun letters
  215. _بِا) ل (L10 ' // Sun letters
  216. _فَا) ل (L10 ' // Sun letters
  217. _كَا) ل (L10 ' // Sun letters
  218. لّ ll
  219. _لِ) ل (L10 ' // Sun letters
  220. _وَا) ل (L10 ' // Sun letters
  221. .group م
  222. م m
  223. .group ن
  224. ن n
  225. ن (ب m
  226. ن (ْب m
  227. .group ه
  228. ه h
  229. ه (_S1 h // الضمير المتصل
  230. ها (_S2 haa //الضمير المتصل
  231. هم (_S2 hum //الضمير المتصل
  232. هما (_S3 humaa //الضمير المتصل
  233. هن (_S2 hunna //الضمير المتصل
  234. .group و
  235. L03) و uu //واو بعد صامت دون تشكيل
  236. ا) و w //واو بعد الألف
  237. و (L01 w //واو بعدها حرف علة
  238. ْ) و w // واو بعد سكون
  239. َ) و w //واو بعد فتحة
  240. ِ) و w //واو بعد كسرة
  241. _) و w //واو في أول الكلمة
  242. وا (_S2 u
  243. وا (_S2 uu // فعل مع ضمائر الجمع المذكرة درسوا
  244. _) وال (L10P3 wa //والشمس
  245. _) وَال (L10P4 wa
  246. _) وَالْ (L10P4 wa
  247. _) وال (L11P3 wal //والقمر
  248. _) وَال (L11P4 wal
  249. _) وَالْ (L11P4 wal
  250. _) وال (تP3 wat
  251. _) وال (ثP3 waT
  252. _) وال (دP3 wad
  253. _) وال (ذP3 waD
  254. _) وال (رP3 war
  255. _) وال (زP3 waz
  256. _) وال (سP3 was
  257. _) وال (شP3 waS
  258. _) وال (صP3 was[
  259. _) وال (ضP3 wadH
  260. _) وال (طP3 wat[
  261. _) وال (ظP3 waZ
  262. _) وال (لP3 wal
  263. _) وال (نP3 wan
  264. ون (_S2 uuna //جمع مذكر سالم فلاحون
  265. .group ي
  266. L03) ي ii // ياء بعد صامت دون تشكيل
  267. ا) ي j // ياء بعد ألف
  268. يِ jii
  269. ْ) ي j //ياء بعد سكون
  270. ُ) ي j //ياء بعد ضمّة
  271. َ) ي j // ياء بعد فتحة
  272. _) ي j // ياء في أول الكلمة
  273. ي (L01 j //يا بعدها حروف علة
  274. ي (_S1 i
  275. ي (_S1 ii //ياء النسبة
  276. يات (_S3 ijjaat //يّة النسبة في جمع المؤنث جزائريات
  277. ية (_S2 ijjah //يّة النسبة
  278. ين (_S2 iina //جمع مذكر سالم منصوب أو مجرور
  279. يون (_S3 ijjuun //kجمع مذكر سالم منسوب جزائريون
  280. يين (_S3 ijjiin //kجمع مذكر سالم منسوب جزائريين
  281. .group ى //ألف مقصورة
  282. ى a
  283. L03) ى (_ aa
  284. .group ء
  285. ء ?
  286. ء (ً ?an
  287. .group ئ
  288. ئ ?
  289. .group ؤ
  290. ؤ ?
  291. .group ة
  292. ة t
  293. ةً tan
  294. // Other diacritics
  295. .group
  296. ٍ (_S1 in // kasratan at the end of word
  297. ٌ (_S1 un // dammatan at the end of word
  298. ُ u // damma
  299. ُو uu
  300. َا aa
  301. ًا (_S2 an
  302. َى aa
  303. ٰ aa // superscript alef
  304. ِ i // kasra
  305. َ %a // fatha
  306. // Following are default rules for other diacritics and they are just silence.
  307. // Diacritics should be consumed together with leading letters in rules above.
  308. ٌ // dammatan
  309. ً // fathatan
  310. ٍ // kasratan
  311. ـ // tatweel
  312. ۡ // small high dotless head of khan
  313. ْ // sukun
  314. // non-ascii characters with specified pronunciations
  315. // List the accented characters in en_list with the $accent attribute