// * arabic Language ar ar_list | // * arabic Language ar ar_list | ||||
// * This file writen by TAHA Zerrouki 2012 | // * This file writen by TAHA Zerrouki 2012 | ||||
//********* | |||||
// *************************************************************************** | |||||
// * This program is free software; you can redistribute it and/or modify * | // * This program is free software; you can redistribute it and/or modify * | ||||
// * it under the terms of the GNU General Public License as published by * | // * it under the terms of the GNU General Public License as published by * | ||||
// * the Free Software Foundation; either version 3 of the License, or * | // * the Free Software Foundation; either version 3 of the License, or * | ||||
// * You should have received a copy of the GNU General Public License * | // * You should have received a copy of the GNU General Public License * | ||||
// * along with this program; if not, see: * | // * along with this program; if not, see: * | ||||
// * <http://www.gnu.org/licenses/>. * | // * <http://www.gnu.org/licenses/>. * | ||||
// ***************************************************************************/ | |||||
//********* | |||||
// *************************************************************************** | |||||
// | |||||
// You can use the en_extra file, rather than this one | // You can use the en_extra file, rather than this one | ||||
// to add your own pronunciation definitions. | // to add your own pronunciation definitions. | ||||
// ***************************************************************************/ | |||||
// | |||||
// This file is UTF-8 encoded | // This file is UTF-8 encoded | ||||
// all words must be LOWER CASE (although the initial letter will be automatically | // all words must be LOWER CASE (although the initial letter will be automatically | ||||
// converted if it's a 7bit ascii character) | |||||
// converted if it's a 7bit ascii character) | |||||
// | |||||
//stress symbols ' primary , secondary % unstressed | //stress symbols ' primary , secondary % unstressed | ||||
// letter names, as they are spoken as a single character in text | // letter names, as they are spoken as a single character in text | ||||
// precede by _ to distinguish from pronunciation as a language word | // precede by _ to distinguish from pronunciation as a language word | ||||
//arabic alphabet | |||||
_آ alif mamduudah | |||||
_ا alif | |||||
ب baa? | |||||
پ pi | |||||
ت taa? | |||||
ث Taa? | |||||
ج dZim | |||||
ح Haa? | |||||
خ Xaa? | |||||
د daal | |||||
ذ Daal | |||||
ر raa? | |||||
ز zaaj | |||||
س siin | |||||
ش Siin | |||||
ص s[aad | |||||
ض dHaad | |||||
ط t[aa? | |||||
ظ Zaa? | |||||
ع Aajn | |||||
غ gHajn | |||||
ف faa? | |||||
ق qaaf | |||||
ك kaaf | |||||
گ gaaf | |||||
ل laam | |||||
م miim | |||||
ن nuun | |||||
و waaw | |||||
ه haa? | |||||
ي jaa? | |||||
َ fatHah | |||||
ُ dhammah | |||||
ِ kasrah | |||||
ّ Saddah | |||||
ْ sukuun | |||||
ً fatHataan | |||||
ٌ dhammataan | |||||
ٍ kasrataan | |||||
، faas[ilah | |||||
؛ nuqt[atah||faas[lah | |||||
ـ tat[wiil | |||||
ئ hamzah||Ala||?aljaa? | |||||
ؤ hamzah||Ala||?alwaa? | |||||
إ hamzah||taHta||?alwaa? | |||||
أ ?alif | |||||
ء hamzah | |||||
ة taa?||marbuut[ah | |||||
ى ?alif||maqs[uurah | |||||
ةً tan | |||||
// Arabic alphabet | |||||
_آ alif mamduudah | |||||
_ا alif | |||||
_ب baa? | |||||
_پ pi | |||||
_ت taa? | |||||
_ث Taa? | |||||
_ج dZim | |||||
_ح Haa? | |||||
_خ Xaa? | |||||
_د daal | |||||
_ذ Daal | |||||
_ر raa? | |||||
_ز zaaj | |||||
_س siin | |||||
_ش Siin | |||||
_ص s[aad | |||||
_ض dHaad | |||||
_ط t[aa? | |||||
_ظ Zaa? | |||||
_ع Aajn | |||||
_غ gHajn | |||||
_ف faa? | |||||
_ق qaaf | |||||
_ك kaaf | |||||
_گ gaaf | |||||
_ل laam | |||||
_م miim | |||||
_ن nuun | |||||
_و waaw | |||||
_ه haa? | |||||
_ي jaa? | |||||
_َ fatHah | |||||
_ُ dhammah | |||||
_ِ kasrah | |||||
_ّ Saddah | |||||
_ْ sukuun | |||||
_ً fatHataan | |||||
_ٌ dhammataan | |||||
_ٍ kasrataan | |||||
_، faas[ilah | |||||
_؛ nuqt[atah||faas[lah | |||||
_ـ tat[wiil | |||||
_ئ hamzah||Ala||?aljaa? | |||||
_ؤ hamzah||Ala||?alwaa? | |||||
_إ hamzah||taHta||?alwaa? | |||||
_أ ?alif | |||||
_ء hamzah | |||||
_ة taa?||marbuut[ah | |||||
_ى ?alif||maqs[uurah | |||||
_ةً tan | |||||
_ | |||||
// When letters entered one by one | |||||
آ alif mamduudah $atend | |||||
ا alif $atend | |||||
ب baa? $atend | |||||
پ pi $atend | |||||
ت taa? $atend | |||||
ث Taa? $atend | |||||
ج dZim $atend | |||||
ح Haa? $atend | |||||
خ Xaa? $atend | |||||
د daal $atend | |||||
ذ Daal $atend | |||||
ر raa? $atend | |||||
ز zaaj $atend | |||||
س siin $atend | |||||
ش Siin $atend | |||||
ص s[aad $atend | |||||
ض dHaad $atend | |||||
ط t[aa? $atend | |||||
ظ Zaa? $atend | |||||
ع Aajn $atend | |||||
غ gHajn $atend | |||||
ف faa? $atend | |||||
ق qaaf $atend | |||||
ك kaaf $atend | |||||
گ gaaf $atend | |||||
ل laam $atend | |||||
م miim $atend | |||||
ن nuun $atend | |||||
و waaw $atend | |||||
ه haa? $atend | |||||
ي jaa? $atend | |||||
َ fatHah $atend | |||||
ُ dhammah $atend | |||||
ِ kasrah $atend | |||||
ّ Saddah $atend | |||||
ْ sukuun $atend | |||||
ً fatHataan $atend | |||||
ٌ dhammataan $atend | |||||
ٍ kasrataan $atend | |||||
، faas[ilah $atend | |||||
؛ nuqt[atah||faas[lah $atend | |||||
ـ tat[wiil $atend | |||||
ئ hamzah||Ala||?aljaa? $atend | |||||
ؤ hamzah||Ala||?alwaa? $atend | |||||
إ hamzah||taHta||?alwaa? $atend | |||||
أ ?alif $atend | |||||
ء hamzah $atend | |||||
ة taa?||marbuut[ah $atend | |||||
ى ?alif||maqs[uurah $atend | |||||
ةً tan $atend | |||||
// numeric | // numeric | ||||
//_0 zero $text // TEST | |||||
_0 s[ifr | |||||
_1 waaHid | |||||
_2 ?iTnaan | |||||
_3 TalaaTah | |||||
_4 ?arbaAah | |||||
_5 Xamsah | |||||
_6 sittah | |||||
_7 sabAah | |||||
_8 Tamanijah | |||||
_9 tisAah | |||||
_10 AaSarah | |||||
_11 ?aHada||AaSarah | |||||
_12 ?iTnaa||AaSarah | |||||
_13 TalaaTata||AaSarah | |||||
_14 ?arbaAata||AaSarah | |||||
_15 Xamsata||AaSarah | |||||
_16 sittata||AaSarah | |||||
_17 sabAata||AaSarah | |||||
_18 Tamaanijata||AaSarah | |||||
_19 tisAata||AaSarah | |||||
_2X AiSruun | |||||
_3X TalaTuun | |||||
_4X ?arbaAuun | |||||
_5X Xamsuun | |||||
_6X sittuun | |||||
_7X sabA:n | |||||
_8X Tamaanuun | |||||
_9X tisAuun | |||||
_0C mi?ah | |||||
_1C mi?ah | |||||
_2C mi?ataan | |||||
_3C TalaaTumi?ah | |||||
_4C ?arbaAumi?ah | |||||
_5C Xamsumi?ah | |||||
_6C sittumi?ah | |||||
_7C sabAumi?ah | |||||
_8C Tamaanumi?ah | |||||
_9C tisAumi?ah | |||||
_0M1 ?alf | |||||
_1M1 ?alf | |||||
_2M1 ?alfaan | |||||
_3M1 TalaaTat||?aalaaf | |||||
_4M1 ?arbaAat||?aalaaf | |||||
_5M1 Xamsat||?aalaaf | |||||
_6M1 sittat||?aalaaf | |||||
_7M1 sabAat||?aalaaf | |||||
_8M1 Tamaanijat||?aalaaf | |||||
_9M1 tisAat||?aalaaf | |||||
_10M1 AaSarat||?aalaaf | |||||
_0 s[ifr | |||||
_1 waaHid | |||||
_2 ?iTnaan | |||||
_3 TalaaTah | |||||
_4 ?arbaAah | |||||
_5 Xamsah | |||||
_6 sittah | |||||
_7 sabAah | |||||
_8 Tamanijah | |||||
_9 tisAah | |||||
_10 AaSarah | |||||
_11 ?aHada||AaSarah | |||||
_12 ?iTnaa||AaSarah | |||||
_13 TalaaTata||AaSarah | |||||
_14 ?arbaAata||AaSarah | |||||
_15 Xamsata||AaSarah | |||||
_16 sittata||AaSarah | |||||
_17 sabAata||AaSarah | |||||
_18 Tamaanijata||AaSarah | |||||
_19 tisAata||AaSarah | |||||
_2X AiSruun | |||||
_3X TalaTuun | |||||
_4X ?arbaAuun | |||||
_5X Xamsuun | |||||
_6X sittuun | |||||
_7X sabA:n | |||||
_8X Tamaanuun | |||||
_9X tisAuun | |||||
_0C mi?ah | |||||
_1C mi?ah | |||||
_2C mi?ataan | |||||
_3C TalaaTumi?ah | |||||
_4C ?arbaAumi?ah | |||||
_5C Xamsumi?ah | |||||
_6C sittumi?ah | |||||
_7C sabAumi?ah | |||||
_8C Tamaanumi?ah | |||||
_9C tisAumi?ah | |||||
_0M1 ?alf | |||||
_1M1 ?alf | |||||
_2M1 ?alfaan | |||||
_3M1 TalaaTat||?aalaaf | |||||
_4M1 ?arbaAat||?aalaaf | |||||
_5M1 Xamsat||?aalaaf | |||||
_6M1 sittat||?aalaaf | |||||
_7M1 sabAat||?aalaaf | |||||
_8M1 Tamaanijat||?aalaaf | |||||
_9M1 tisAat||?aalaaf | |||||
_10M1 AaSarat||?aalaaf | |||||
_0M2 m%ilj%uun | |||||
_1M2 m%iljuun | |||||
_2M2 miljuunaan | |||||
_3M2 TalaaTat||malaajiin | |||||
_4M2 ?arbaAat||malaajiin | |||||
_5M2 Xamsat||malaajiin | |||||
_6M2 sittat||malaajiin | |||||
_7M2 sabAat||malaajiin | |||||
_8M2 Tamaanijat||malaajiin | |||||
_9M2 tisAat||malaajiin | |||||
_10M2 AaSarat||malaajiin | |||||
_0M2 m%ilj%uun | |||||
_1M2 m%iljuun | |||||
_2M2 miljuunaan | |||||
_3M2 TalaaTat||malaajiin | |||||
_4M2 ?arbaAat||malaajiin | |||||
_5M2 Xamsat||malaajiin | |||||
_6M2 sittat||malaajiin | |||||
_7M2 sabAat||malaajiin | |||||
_8M2 Tamaanijat||malaajiin | |||||
_9M2 tisAat||malaajiin | |||||
_10M2 AaSarat||malaajiin | |||||
_0M3 miljaar | |||||
_1M3 miljaar | |||||
_2M3 miljaaraan | |||||
_3M3 TalaaTat||miljaaraat | |||||
_4M3 ?arbaAat||miljaaraat | |||||
_5M3 Xamsat||miljaaraat | |||||
_6M3 sittat||miljaaraat | |||||
_7M3 sabAat||miljaaraat | |||||
_8M3 Tamaanijat||miljaaraat | |||||
_9M3 tisAat||miljaaraat | |||||
_10M3 AaSarat||miljaaraat | |||||
_0M3 miljaar | |||||
_1M3 miljaar | |||||
_2M3 miljaaraan | |||||
_3M3 TalaaTat||miljaaraat | |||||
_4M3 ?arbaAat||miljaaraat | |||||
_5M3 Xamsat||miljaaraat | |||||
_6M3 sittat||miljaaraat | |||||
_7M3 sabAat||miljaaraat | |||||
_8M3 Tamaanijat||miljaaraat | |||||
_9M3 tisAat||miljaaraat | |||||
_10M3 AaSarat||miljaaraat | |||||
_0and wa | |||||
_dpt faas[il | |||||
_roman rumaanii | |||||
_0and wa | |||||
_dpt faas[il | |||||
_roman rumaanii | |||||
_#st om | |||||
_#nd va | |||||
_#rd om | |||||
_#th om | |||||
_#st om | |||||
_#nd va | |||||
_#rd om | |||||
_#th om | |||||
// character names | // character names | ||||
÷ taqsiim | |||||
× fii | |||||
؟ Aalaaamat||?istifhaam | |||||
! Aalaaamat||taAadZdZub | |||||
$ duulaar | |||||
% bilmi?ah | |||||
[ AaaridHah||maftuuHah | |||||
] AaaridHah||mugHlaqah | |||||
( qaws||maftuuH | |||||
) qaws||mugHlaq | |||||
* nedZmah | |||||
- naaqis[ | |||||
/. nuqt[ah | |||||
/: nuqt[ataan | |||||
< ?as[gHar||min | |||||
= tusaawii | |||||
> ?akbar||min | |||||
{ HaadHinah||maftuuHah | |||||
} HaadHinah||mugHlaqah | |||||
... TalaaT||niqaat[ | |||||
÷ taqsiim | |||||
× fii | |||||
؟ Aalaaamat||?istifhaam | |||||
! Aalaaamat||taAadZdZub | |||||
$ duulaar | |||||
% bilmi?ah | |||||
[ AaaridHah||maftuuHah | |||||
] AaaridHah||mugHlaqah | |||||
( qaws||maftuuH | |||||
) qaws||mugHlaq | |||||
* nedZmah | |||||
- naaqis[ | |||||
/. nuqt[ah | |||||
/: nuqt[ataan | |||||
< ?as[gHar||min | |||||
= tusaawii | |||||
> ?akbar||min | |||||
{ HaadHinah||maftuuHah | |||||
} HaadHinah||mugHlaqah | |||||
... TalaaT||niqaat[ | |||||
//characters and numbers and words with English alphabet is translated by English phonemes | //characters and numbers and words with English alphabet is translated by English phonemes | ||||
th _^_en | |||||
th _^_en | |||||
// MAIN WORD DICTIONARY | // MAIN WORD DICTIONARY | ||||
//********************* | //********************* | ||||
// exceptional words with flags | |||||
ای ?aj $only | |||||
// exceptional words, (out of rules) | |||||
// propoer nouns | |||||
طه t[aahaa | |||||
عمرو Aamr | |||||
//abbriviation | |||||
د ?ad'duktuur $hasdot | |||||
أنا ?nba?anaa $hasdot | |||||
اه ?intahaa $hasdot | |||||
ثنا Had'daTanaa $hasdot | |||||
الخ ?ila||?aa_Xirih $hasdot | |||||
إلخ ?ila||?aaXirih $hasdot | |||||
رحه raHimahullah $hasdot | |||||
رضه radHijallahu||Anhu $hasdot | |||||
و wa $pause | |||||
//الألف اللينة | |||||
إله ?ilaah | |||||
أولئك ?ulaa?ika | |||||
أولو ?uluu | |||||
أولي ?ulii | |||||
داود daawuud | |||||
ذلك Daalika | |||||
التي ?allatii | |||||
الذي ?allaDii | |||||
الذين ?allaDiina | |||||
اللذين ?allaDajn | |||||
اللذان ?allaDaani | |||||
صلعم s[allaa|?allahu|Alajhi||wa||sallam | |||||
الرحمن ?arraHmaan | |||||
لكن laakin | |||||
الله ?allaah | |||||
اللهم ?allahumma | |||||
هؤلاء haa?ulaa?i | |||||
هذا haaDaa | |||||
هذان haaDaani | |||||
هذه haaDihi | |||||
//abbreviations | |||||
د ?ad'duktuur $hasdot | |||||
أنا ?nba?anaa $hasdot | |||||
اه ?intahaa $hasdot | |||||
ثنا Had'daTanaa $hasdot | |||||
الخ ?ila||?aa_Xirih $hasdot | |||||
إلخ ?ila||?aaXirih $hasdot | |||||
رحه raHimahullah $hasdot | |||||
رضه radHijallahu||Anhu $hasdot | |||||
و wa $pause | |||||
إله ?ilaah | |||||
أولئك ?ulaa?ika | |||||
أولو ?uluu | |||||
أولي ?ulii | |||||
داود daawuud | |||||
ذلك Daalika | |||||
التي ?allatii | |||||
الذي ?allaDii | |||||
الذين ?allaDiina | |||||
اللذين ?allaDajn | |||||
اللذان ?allaDaani | |||||
صلعم s[allaa|?allahu|Alajhi||wa||sallam | |||||
الرحمن ?arraHmaan | |||||
لكن laakin | |||||
الله ?allaah | |||||
اللهم ?allahumma | |||||
هؤلاء haa?ulaa?i | |||||
هذا haaDaa | |||||
هذان haaDaani | |||||
هذه haaDihi | |||||
//الوحدات | //الوحدات | ||||
كغ kiluu||gHraam | |||||
كجم kiluu||gHraam | |||||
كغم kiluu||gHraam | |||||
طن t[un | |||||
كم kiiluu||mitar | |||||
سا saaAa | |||||
// Units below conflict with single letter name | |||||
// م mitar | |||||
// س su?aal | |||||
// ج dZawaab | |||||
// ص s[afHah | |||||
// العملات | |||||
كغ kiluu||gHraam | |||||
كجم kiluu||gHraam | |||||
كغم kiluu||gHraam | |||||
طن t[un | |||||
كم kiiluu||mitar | |||||
سا saaAa | |||||
// Units below conflict with single letter word | |||||
// م mitar | |||||
// س su?aal | |||||
// ج dZawaab | |||||
// ص s[afHah | |||||
د.ج diinaar||dZazaa?irij | د.ج diinaar||dZazaa?irij | ||||
$ duulaar | |||||
€ ?uurruu | |||||
£ dZunajh | |||||
¥ juwaan | |||||
ج.م juwaan||mis[ri | |||||
ر.س rijaal||saAuudii | |||||
// مركب الاسم | |||||
ابن ?ibn | |||||
بن ban | |||||
$ duulaar | |||||
€ ?uurruu | |||||
£ dZunajh | |||||
¥ juwaan | |||||
ج.م juwaan||mis[ri | |||||
ر.س rijaal||saAuudii | |||||
ابن ?ibn | |||||
بن ban | |||||
//foreign language | //foreign language | ||||
إنجليزية ?ingliizijah // probelm | |||||
جوجل guugal | |||||
غوغل guugal | |||||
(بسم الله) bismillaah | |||||
إنجليزية ?ingliizijah // probelm | |||||
جوجل guugal | |||||
غوغل guugal | |||||
(بسم الله) bismillaah | |||||
// exceptional words with flags | |||||
ای ?aj $only | |||||
// exceptional words, (out of rules) | |||||
// proper nouns | |||||
طه t[aahaa | |||||
عمرو Aamr | |||||
أنا 'ana | |||||
// * Arabic Language ar ar_rules | |||||
// * This file writen by Taha Zerrouki 2012 | |||||
//********* | |||||
// * This program is free software; you can redistribute it and/or modify * | |||||
// * it under the terms of the GNU General Public License as published by * | |||||
// * the Free Software Foundation; either version 3 of the License, or * | |||||
// * (at your option) any later version. * | |||||
// * * | |||||
// * This program is distributed in the hope that it will be useful, * | |||||
// * but WITHOUT ANY WARRANTY; without even the implied warranty of * | |||||
// * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * | |||||
// * GNU General Public License for more details. * | |||||
// * * | |||||
// * You should have received a copy of the GNU General Public License * | |||||
// * along with this program; if not, see: * | |||||
// * <http://www.gnu.org/licenses/>. * | |||||
// ***************************************************************************/ | |||||
// This file is UTF-8 encoded | |||||
// all words must be LOWER CASE (although the initial letter will be automatically | |||||
// converted if it's a 7bit ascii character) | |||||
// Text to phoneme rules for Arabic | |||||
// replace Arabic eastern character numbers with Arabic western character numbers | |||||
.replace | |||||
٠ 0 | |||||
۰ 0 | |||||
۱ 1 | |||||
١ 1 | |||||
٢ 2 | |||||
۲ 2 | |||||
٣ 3 | |||||
۳ 3 | |||||
٤ 4 | |||||
۴ 4 | |||||
٥ 5 | |||||
۵ 5 | |||||
٦ 6 | |||||
۶ 6 | |||||
٧ 7 | |||||
۷ 7 | |||||
٨ 8 | |||||
۸ 8 | |||||
٩ 9 | |||||
۹ 9 | |||||
ئ ء //توحيد شكل الهمزة | |||||
ؤ ء | |||||
إ ءِ | |||||
أ ء | |||||
ـ //حذف التطويل | |||||
//all vowels | |||||
.A ا ي و َ ُ ِ ً ٌ ٍ ّ ى | |||||
//list of consonants | |||||
.C ب پ ت ة ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ئ ؤ ء أ آ إ ه | |||||
//all vowels | |||||
.L01 ا ي و َ ُ ِ ً ٌ ٍ ّ ى | |||||
//short vowels (commonly unwritten ) | |||||
.L02 َ ُ ِ ً ٌ ٍ | |||||
//list of consonants | |||||
.L03 ب پ ت ة ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ئ ؤ ء أ آ إ ه | |||||
// all Arabic characters without ا آ | |||||
.L04 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ت ن م ك َ ُ ِ ّ ـ « » ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ | |||||
// all Arabic characters without short vowels and A | |||||
.L05 ض ص ث ق ف غ ع ه خ ح ج ش س ي ب ل ت ن م ك ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ | |||||
// group of digits | |||||
.L06 0 1 2 3 4 5 6 7 8 9 | |||||
// all Arabic characters | |||||
.L09 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ا ت ن م ك َ ُ ِ ّ آ ـ « » ظ ط ز ر ذ د ئ و ة ي ژ ؤ إ أ ء ؟ پ گ | |||||
// Arabic Sun characters | |||||
.L10 ض ص ث ش س ل ت ن ظ ط ز ر ذ د | |||||
// Arabic Moon characters | |||||
.L11 ق ف غ ع ه خ ح ج ي ب م ك و إ أ ء | |||||
//.group | |||||
.group آ | |||||
آ ?aa | |||||
.group ا | |||||
_) ا a // make the previous fatha long | |||||
//ا aa | |||||
L03) ا aa // if a consonant is before it, make the fatha long | |||||
// ا (_ aa | |||||
ا (ُ ? | |||||
ا (ِ ? | |||||
ا (َ ? | |||||
// اً ' //ألف بعده تنوين نصب | |||||
// ا (ًS2 //a ألف بعده تنوين نصب | |||||
// السوابق قبل ال | |||||
_ب) ا (ل i | |||||
//_و) ا (ل a | |||||
//_ف) ا (ل a | |||||
//_ك) ا (ل a | |||||
L03) ا (L03 aa | |||||
_) ال (L10ّP2 ?a //الشمس | |||||
_) ال (L11P2 ?al //القمر | |||||
// ات (_S2 aat //جمع مؤنث سالم | |||||
//الحروف الشمسية | |||||
// ال التعريف مع حرف شمسي | |||||
//25/05 | |||||
_) ال (لP2 ?al | |||||
_) ال (نP2 ?an | |||||
_) ال (ثP2 ?aT | |||||
_) ال (تP2 ?at | |||||
_) ال (دP2 ?ad | |||||
_) ال (رP2 ?ar | |||||
_) ال (ذP2 ?aD | |||||
_) ال (سP2 ?as | |||||
_) ال (زP2 ?az | |||||
_) ال (صP2 ?as[ | |||||
_) ال (شP2 ?aS | |||||
_) ال (شّP2 ?a | |||||
//_) ال (طP2 ?at[ | |||||
_) ال (ضP2 ?adH | |||||
_) ال (ظP2 ?aZ | |||||
.group ب | |||||
ب b | |||||
ب (ّ Bb | |||||
// _) ب (P1 bi //بشمس | |||||
//_) ب (ال bi //حرف الجر باء قبل ال التعريف | |||||
_) بال (L10P3 bi //بالشمس | |||||
_) بال (L11P3 bil //بالقمر | |||||
//الحروف الشمسية | |||||
// ال التعريف مع حرف شمسي | |||||
_) بال (لP3 bil | |||||
_) بال (نP3 bin | |||||
_) بال (ثP3 biT | |||||
_) بال (تP3 bit | |||||
_) بال (دP3 bid | |||||
_) بال (رP3 bir | |||||
_) بال (ذP3 biD | |||||
_) بال (سP3 bis | |||||
_) بال (زP3 biz | |||||
_) بال (صP3 bis[ | |||||
_) بال (شP3 biS | |||||
_) بال (طP3 bit[ | |||||
_) بال (ضP3 bidH | |||||
_) بال (ظP3 biZ | |||||
.group پ | |||||
پ p | |||||
.group ت | |||||
ت t | |||||
ت (ّ tt | |||||
_) ت (َP1 t | |||||
_) ت (P1 ta //تسأل | |||||
_َ) ت (P2 t | |||||
ت (_S1 at //سألت | |||||
.group ث | |||||
ث T | |||||
.group ج | |||||
ج dZ | |||||
ج (ّ dZdZ | |||||
.group ح | |||||
ح H | |||||
.group خ | |||||
خ X | |||||
.group د | |||||
د d | |||||
د (ّ dd | |||||
.group ذ | |||||
ذ D | |||||
.group ر | |||||
ر r | |||||
.group ز | |||||
ز z | |||||
.group س | |||||
س s | |||||
س (ّ ss | |||||
.group ش | |||||
ش S | |||||
ش (ّ SS | |||||
.group ص | |||||
ص s[ | |||||
ص (ّ s[s[ | |||||
.group ض | |||||
ض dH | |||||
// ض (ّ dHdH | |||||
.group ط | |||||
ط t[ | |||||
.group ظ | |||||
ظ Z | |||||
.group ع | |||||
ع A | |||||
.group غ | |||||
// غ R2 | |||||
غ gH | |||||
.group ف | |||||
ف f | |||||
_) فال (L10P3 fa //فالشمس | |||||
_) فَالْ (L10P4 fa | |||||
_) فَال (L10P4 fa | |||||
_) فال (L11P3 fal //فالقمر | |||||
_) فَال (L11P4 fa | |||||
_) فَالْ (L11P4 fal | |||||
//الحروف الشمسية | |||||
// ال التعريف مع حرف شمسي | |||||
_) فال (لP3 fal | |||||
_) فال (نP3 fan | |||||
_) فال (ثP3 faT | |||||
_) فال (تP3 fat | |||||
_) فال (دP3 fad | |||||
_) فال (رP3 far | |||||
_) فال (ذP3 faD | |||||
_) فال (سP3 fas | |||||
_) فال (زP3 faz | |||||
_) فال (صP3 fas[ | |||||
_) فال (شP3 faS | |||||
_) فال (طP3 fat[ | |||||
_) فال (ضP3 fadH | |||||
_) فال (ظP3 faZ | |||||
.group ق | |||||
ق q | |||||
//ق (ّ qq | |||||
.group ك | |||||
ك k | |||||
//ك (ّ kk | |||||
_) كال (L10P3 ka //كالشمس | |||||
_) كَالْ (L10P4 ka | |||||
_) كَال (L10P4 ka | |||||
_) كال (L11P3 kal //كالقمر | |||||
_) كَالْ (L11P4 kal | |||||
ك (_S1 ka // الضمير المتصل | |||||
كم (_S2 kum //الضمير المتصل | |||||
كما (_S3 kumaa //الضمير المتصل | |||||
كن (_S2 kunna //الضمير المتصل | |||||
//الحروف الشمسية | |||||
// ال التعريف مع حرف شمسي | |||||
_) كال (لP3 kal | |||||
_) كال (نP3 kan | |||||
_) كال (ثP3 kaT | |||||
_) كال (تP3 kat | |||||
_) كال (دP3 kad | |||||
_) كال (رP3 kar | |||||
_) كال (ذP3 kaD | |||||
_) كال (سP3 kas | |||||
_) كال (زP3 kaz | |||||
_) كال (صP3 kas[ | |||||
_) كال (شP3 kaS | |||||
_) كال (طP3 kat[ | |||||
_) كال (ضP3 kadH | |||||
_) كال (ظP3 kaZ | |||||
.group گ | |||||
گ g | |||||
.group ل | |||||
ل l | |||||
ل (ّ ll | |||||
_ا) ل (L10 ' // Sun letters | |||||
_بِا) ل (L10 ' // Sun letters | |||||
_وَا) ل (L10 ' // Sun letters | |||||
_فَا) ل (L10 ' // Sun letters | |||||
_كَا) ل (L10 ' // Sun letters | |||||
_لِ) ل (L10 ' // Sun letters | |||||
// _) لل (L10P2 li //للشمس | |||||
// _) لل (L11P2 lil //للقمر | |||||
//الحروف الشمسية | |||||
// ال التعريف مع حرف شمسي | |||||
// _) لل (لP2 lil | |||||
// _) لل (نP2 lin | |||||
// _) لل (ثP2 liT | |||||
// _) لل (تP2 lit | |||||
// _) لل (دP2 lid | |||||
// _) لل (رP2 lir | |||||
// _) لل (ذP2 liD | |||||
// _) لل (سP2 lis | |||||
// _) لل (زP2 liz | |||||
// _) لل (صP2 lis[ | |||||
// _) لل (شP2 liS | |||||
// _) لل (طP2 lit[ | |||||
// _) لل (ضP2 lidH | |||||
// _) لل (ظP2 liZ | |||||
.group م | |||||
م m | |||||
.group ن | |||||
ن n | |||||
ن (ب m | |||||
ن (ْب m | |||||
.group ه | |||||
ه h | |||||
ه (_S1 h // الضمير المتصل | |||||
ها (_S2 haa //الضمير المتصل | |||||
هم (_S2 hum //الضمير المتصل | |||||
هما (_S3 humaa //الضمير المتصل | |||||
هن (_S2 hunna //الضمير المتصل | |||||
.group و | |||||
_) و w //واو في أول الكلمة | |||||
ا) و w //واو بعد الألف | |||||
ْ) و w // واو بعد سكون | |||||
َ) و w //واو بعد فتحة | |||||
ِ) و w //واو بعد كسرة | |||||
و (L01 w //واو بعدها حرف علة | |||||
// ُ) و : // make the prevuous damma long | |||||
L03) و uu //واو بعد صامت دون تشكيل | |||||
_) وال (L10P3 wa //والشمس | |||||
_) وَالْ (L10P4 wa | |||||
_) وَال (L10P4 wa | |||||
_) وال (L11P3 wal //والقمر | |||||
_) وَالْ (L11P4 wal | |||||
_) وَال (L11P4 wal | |||||
ون (_S2 uuna //جمع مذكر سالم فلاحون | |||||
وا (_S2 uu // فعل مع ضمائر الجمع المذكرة درسوا | |||||
ُ) وا (_S2 u | |||||
//الحروف الشمسية | |||||
// ال التعريف مع حرف شمسي | |||||
_) وال (لP3 wal | |||||
_) وال (نP3 wan | |||||
_) وال (ثP3 waT | |||||
_) وال (تP3 wat | |||||
_) وال (دP3 wad | |||||
_) وال (رP3 war | |||||
_) وال (ذP3 waD | |||||
_) وال (سP3 was | |||||
_) وال (زP3 waz | |||||
_) وال (صP3 was[ | |||||
_) وال (شP3 waS | |||||
_) وال (طP3 wat[ | |||||
_) وال (ضP3 wadH | |||||
_) وال (ظP3 waZ | |||||
.group ي | |||||
_) ي j ياء في أول الكلمة | |||||
ا) ي j // ياء بعد ألف | |||||
ْ) ي j //ياء بعد سكون | |||||
َ) ي j // ياء بعد فتحة | |||||
ُ) ي j //ياء بعد ضمّة | |||||
ي (L01 j //يا بعدها حروف علة | |||||
// ِ) ي %: // make the previous kasra long | |||||
L03) ي ii // ياء بعد صامت دون تشكيل | |||||
ية (_S2 ijjah //يّة النسبة | |||||
يون (_S3 ijjuun //kجمع مذكر سالم منسوب جزائريون | |||||
يين (_S3 ijjiin //kجمع مذكر سالم منسوب جزائريين | |||||
يات (_S3 ijjaat //يّة النسبة في جمع المؤنث جزائريات | |||||
ين (_S2 iina //جمع مذكر سالم منصوب أو مجرور | |||||
ي (_S1 ii //ياء النسبة | |||||
ِ)ي (_S1 i | |||||
.group ى //ألف مقصورة | |||||
L03) ى (_ aa | |||||
ى a | |||||
// َ) ى aa | |||||
.group ء | |||||
ء ? | |||||
ء (ً ?an | |||||
.group ّ | |||||
ّ | |||||
// L03) ّ %% // | |||||
//b) ّ bb | |||||
.group ئ | |||||
ئ ? | |||||
.group ؤ | |||||
ؤ ? | |||||
.group ة | |||||
ة t | |||||
ةً tan | |||||
// ة (L02 t // التاء المربوطة مشكولة | |||||
// ة (_S1 h //التاء المربوطة غير مشكولة | |||||
// L05) ة (_S1 ah //بوطة ما قبلها صامت، يضاف إليه فتحة | |||||
// L05) ة (L02 at //تاء بعدها حركة وقبلها صامت | |||||
// L02) ة (_S1 h // التاء المربوطة غير مشكولة وماقبلها مشكول | |||||
// ة (L02 t // التاء المربوطة مشكولة | |||||
// ة t // التاء المربوطة مشكولة | |||||
//vowels that are not usually written: | |||||
.group ْ | |||||
ْ | |||||
.group َ | |||||
َ %a | |||||
َ(ا aa // make the previous fatha long | |||||
.group ِ | |||||
ِ i | |||||
ِ(ي ii // make the previous kassra long | |||||
// ِ (_S1 i // e | |||||
.group ُ | |||||
ُ u | |||||
ُ(و uu // make the previous kassra long | |||||
// ُ (_S1 u // o | |||||
.group ٌ // dammatan | |||||
ٌ (_S1 un | |||||
ٌ ' | |||||
.group ً // fatahatan | |||||
ًا (S1 an | |||||
.group ٍ // kasratan | |||||
ٍ (_S1 in | |||||
ٍ ' | |||||
.group أ | |||||
// أ ? | |||||
.group إ | |||||
//إ (ِ ?i | |||||
إ ?i | |||||
.group ـ | |||||
ـ ' | |||||
.group ، | |||||
، || | |||||
.group ؛ | |||||
؛ | |||||
//characters and numbers and words with English alphabet is translated by English phonemes | |||||
// default group for "non of the above" | |||||
.group | |||||
// non-ascii characters with specified pronunciations | |||||
// List the accented characters in en_list with the $accent attribute | |||||
// * Arabic Language ar ar_rules | |||||
// * This file writen by Taha Zerrouki 2012 | |||||
// *************************************************************************** | |||||
// * This program is free software; you can redistribute it and/or modify * | |||||
// * it under the terms of the GNU General Public License as published by * | |||||
// * the Free Software Foundation; either version 3 of the License, or * | |||||
// * (at your option) any later version. * | |||||
// * * | |||||
// * This program is distributed in the hope that it will be useful, * | |||||
// * but WITHOUT ANY WARRANTY; without even the implied warranty of * | |||||
// * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * | |||||
// * GNU General Public License for more details. * | |||||
// * * | |||||
// * You should have received a copy of the GNU General Public License * | |||||
// * along with this program; if not, see: * | |||||
// * <http://www.gnu.org/licenses/>. * | |||||
// ***************************************************************************/ | |||||
// | |||||
// This file is UTF-8 encoded | |||||
// all words must be LOWER CASE (although the initial letter will be automatically | |||||
// converted if it's a 7bit ascii character) | |||||
// Text to phoneme rules for Arabic | |||||
// | |||||
// replace Arabic eastern character numbers with Arabic western character numbers | |||||
.replace | |||||
٠ 0 | |||||
۰ 0 | |||||
۱ 1 | |||||
١ 1 | |||||
٢ 2 | |||||
۲ 2 | |||||
٣ 3 | |||||
۳ 3 | |||||
٤ 4 | |||||
۴ 4 | |||||
٥ 5 | |||||
۵ 5 | |||||
٦ 6 | |||||
۶ 6 | |||||
٧ 7 | |||||
۷ 7 | |||||
٨ 8 | |||||
۸ 8 | |||||
٩ 9 | |||||
۹ 9 | |||||
، , | |||||
؛ ; | |||||
//all vowels | |||||
.L01 ا ي و َ ُ ِ ً ٌ ٍ ّ ى | |||||
//short vowels (commonly unwritten ) | |||||
.L02 | |||||
//list of consonants | |||||
.L03 ب پ ت ة ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ئ ؤ ء أ آ إ ه | |||||
// all Arabic characters without ا آ | |||||
.L04 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ت ن م ك َ ُ ِ ّ ـ « » ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ | |||||
// all Arabic characters without short vowels and A | |||||
.L05 ض ص ث ق ف غ ع ه خ ح ج ش س ي ب ل ت ن م ك ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ | |||||
// group of digits | |||||
.L06 0 1 2 3 4 5 6 7 8 9 | |||||
// all Arabic characters | |||||
.L09 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ا ت ن م ك َ ُ ِ ّ آ ـ « » ظ ط ز ر ذ د ئ و ة ي ژ ؤ إ أ ء ؟ پ گ | |||||
// Arabic Sun characters | |||||
.L10 ض ص ث ش س ل ت ن ظ ط ز ر ذ د | |||||
// Arabic Moon characters | |||||
.L11 ق ف غ ع ه خ ح ج ي ب م ك و إ أ ء | |||||
.group آ | |||||
آ ?aa | |||||
.group ا | |||||
L03) ا aa // if a consonant is before it, make the fatha long | |||||
L03) ا (L03 aa | |||||
ا (َ ? | |||||
ا (ُ ? | |||||
ا (ِ ? | |||||
_) ا a // make the previous fatha long | |||||
_) ال (L10P2 ?a //الشمس | |||||
_) ال (L11P2 ?al //القمر | |||||
_) ال (تP2 ?at | |||||
_) ال (ثP2 ?aT | |||||
_) ال (دP2 ?ad | |||||
_) ال (ذP2 ?aD | |||||
_) ال (رP2 ?ar | |||||
_) ال (زP2 ?az | |||||
_) ال (سP2 ?as | |||||
_) ال (شّP2 ?a | |||||
_) ال (شP2 ?aS | |||||
_) ال (صP2 ?as[ | |||||
_) ال (ضP2 ?adH | |||||
_) ال (ظP2 ?aZ | |||||
_) ال (لP2 ?al | |||||
_) ال (نP2 ?an | |||||
_ب) ا (ل i | |||||
.group أ | |||||
أ a | |||||
.group إ | |||||
إ ?i | |||||
.group ب | |||||
ب b | |||||
بّ Bb | |||||
_) بال (L10P3 bi //بالشمس | |||||
_) بال (L11P3 bil //بالقمر | |||||
_) بال (تP3 bit | |||||
_) بال (ثP3 biT | |||||
_) بال (دP3 bid | |||||
_) بال (ذP3 biD | |||||
_) بال (رP3 bir | |||||
_) بال (زP3 biz | |||||
_) بال (سP3 bis | |||||
_) بال (شP3 biS | |||||
_) بال (صP3 bis[ | |||||
_) بال (ضP3 bidH | |||||
_) بال (طP3 bit[ | |||||
_) بال (ظP3 biZ | |||||
_) بال (لP3 bil | |||||
_) بال (نP3 bin | |||||
.group پ | |||||
پ p | |||||
.group ت | |||||
ت t | |||||
_) ت (َP1 t | |||||
_) ت (P1 ta //تسأل | |||||
_َ) ت (P2 t | |||||
ت (_S1 at //سألت | |||||
تّ tt | |||||
.group ث | |||||
ث T | |||||
.group ج | |||||
ج dZ | |||||
جّ dZdZ | |||||
.group ح | |||||
ح H | |||||
.group خ | |||||
خ X | |||||
.group د | |||||
د d | |||||
دّ dd | |||||
.group ذ | |||||
ذ D | |||||
.group ر | |||||
ر r | |||||
.group ز | |||||
ز z | |||||
.group س | |||||
س s | |||||
سّ ss | |||||
.group ش | |||||
ش S | |||||
شّ SS | |||||
.group ص | |||||
ص s[ | |||||
صّ s[s[ | |||||
.group ض | |||||
ض dH | |||||
.group ط | |||||
ط t[ | |||||
.group ظ | |||||
ظ Z | |||||
.group ع | |||||
ع A | |||||
.group غ | |||||
غ gH | |||||
.group ف | |||||
ف f | |||||
_) فال (L10P3 fa //فالشمس | |||||
_) فَال (L10P4 fa | |||||
_) فَالْ (L10P4 fa | |||||
_) فال (L11P3 fal //فالقمر | |||||
_) فَال (L11P4 fa | |||||
_) فَالْ (L11P4 fal | |||||
_) فال (تP3 fat | |||||
_) فال (ثP3 faT | |||||
_) فال (دP3 fad | |||||
_) فال (ذP3 faD | |||||
_) فال (رP3 far | |||||
_) فال (زP3 faz | |||||
_) فال (سP3 fas | |||||
_) فال (شP3 faS | |||||
_) فال (صP3 fas[ | |||||
_) فال (ضP3 fadH | |||||
_) فال (طP3 fat[ | |||||
_) فال (ظP3 faZ | |||||
_) فال (لP3 fal | |||||
_) فال (نP3 fan | |||||
.group ق | |||||
ق q | |||||
.group ك | |||||
ك k | |||||
ك (_S1 ka // الضمير المتصل | |||||
_) كال (L10P3 ka //كالشمس | |||||
_) كَال (L10P4 ka | |||||
_) كَالْ (L10P4 ka | |||||
_) كال (L11P3 kal //كالقمر | |||||
_) كَالْ (L11P4 kal | |||||
_) كال (تP3 kat | |||||
_) كال (ثP3 kaT | |||||
_) كال (دP3 kad | |||||
_) كال (ذP3 kaD | |||||
_) كال (رP3 kar | |||||
_) كال (زP3 kaz | |||||
_) كال (سP3 kas | |||||
_) كال (شP3 kaS | |||||
_) كال (صP3 kas[ | |||||
_) كال (ضP3 kadH | |||||
_) كال (طP3 kat[ | |||||
_) كال (ظP3 kaZ | |||||
_) كال (لP3 kal | |||||
_) كال (نP3 kan | |||||
كم (_S2 kum //الضمير المتصل | |||||
كما (_S3 kumaa //الضمير المتصل | |||||
كن (_S2 kunna //الضمير المتصل | |||||
.group گ | |||||
گ g | |||||
.group ل | |||||
ل l | |||||
_ا) ل (L10 ' // Sun letters | |||||
_بِا) ل (L10 ' // Sun letters | |||||
_فَا) ل (L10 ' // Sun letters | |||||
_كَا) ل (L10 ' // Sun letters | |||||
لّ ll | |||||
_لِ) ل (L10 ' // Sun letters | |||||
_وَا) ل (L10 ' // Sun letters | |||||
.group م | |||||
م m | |||||
.group ن | |||||
ن n | |||||
ن (ب m | |||||
ن (ْب m | |||||
.group ه | |||||
ه h | |||||
ه (_S1 h // الضمير المتصل | |||||
ها (_S2 haa //الضمير المتصل | |||||
هم (_S2 hum //الضمير المتصل | |||||
هما (_S3 humaa //الضمير المتصل | |||||
هن (_S2 hunna //الضمير المتصل | |||||
.group و | |||||
L03) و uu //واو بعد صامت دون تشكيل | |||||
ا) و w //واو بعد الألف | |||||
و (L01 w //واو بعدها حرف علة | |||||
ْ) و w // واو بعد سكون | |||||
َ) و w //واو بعد فتحة | |||||
ِ) و w //واو بعد كسرة | |||||
_) و w //واو في أول الكلمة | |||||
وا (_S2 u | |||||
وا (_S2 uu // فعل مع ضمائر الجمع المذكرة درسوا | |||||
_) وال (L10P3 wa //والشمس | |||||
_) وَال (L10P4 wa | |||||
_) وَالْ (L10P4 wa | |||||
_) وال (L11P3 wal //والقمر | |||||
_) وَال (L11P4 wal | |||||
_) وَالْ (L11P4 wal | |||||
_) وال (تP3 wat | |||||
_) وال (ثP3 waT | |||||
_) وال (دP3 wad | |||||
_) وال (ذP3 waD | |||||
_) وال (رP3 war | |||||
_) وال (زP3 waz | |||||
_) وال (سP3 was | |||||
_) وال (شP3 waS | |||||
_) وال (صP3 was[ | |||||
_) وال (ضP3 wadH | |||||
_) وال (طP3 wat[ | |||||
_) وال (ظP3 waZ | |||||
_) وال (لP3 wal | |||||
_) وال (نP3 wan | |||||
ون (_S2 uuna //جمع مذكر سالم فلاحون | |||||
.group ي | |||||
L03) ي ii // ياء بعد صامت دون تشكيل | |||||
ا) ي j // ياء بعد ألف | |||||
يِ jii | |||||
ْ) ي j //ياء بعد سكون | |||||
ُ) ي j //ياء بعد ضمّة | |||||
َ) ي j // ياء بعد فتحة | |||||
_) ي j // ياء في أول الكلمة | |||||
ي (L01 j //يا بعدها حروف علة | |||||
ي (_S1 i | |||||
ي (_S1 ii //ياء النسبة | |||||
يات (_S3 ijjaat //يّة النسبة في جمع المؤنث جزائريات | |||||
ية (_S2 ijjah //يّة النسبة | |||||
ين (_S2 iina //جمع مذكر سالم منصوب أو مجرور | |||||
يون (_S3 ijjuun //kجمع مذكر سالم منسوب جزائريون | |||||
يين (_S3 ijjiin //kجمع مذكر سالم منسوب جزائريين | |||||
.group ى //ألف مقصورة | |||||
ى a | |||||
L03) ى (_ aa | |||||
.group ء | |||||
ء ? | |||||
ء (ً ?an | |||||
.group ئ | |||||
ئ ? | |||||
.group ؤ | |||||
ؤ ? | |||||
.group ة | |||||
ة t | |||||
ةً tan | |||||
// Other diacritics | |||||
.group | |||||
ٍ (_S1 in // kasratan at the end of word | |||||
ٌ (_S1 un // dammatan at the end of word | |||||
ُ u // damma | |||||
ُو uu | |||||
َا aa | |||||
َى aa | |||||
ٰ aa // superscript alef | |||||
ِ i // kasra | |||||
َ %a // fatha | |||||
// Following are default rules for other diacritics and they are just silence. | |||||
// Diacritics should be consumed together with leading letters in rules above. | |||||
ٌ // dammatan | |||||
ً // fathatan | |||||
ٍ // kasratan | |||||
ـ // tatweel | |||||
ۡ // small high dotless head of khan | |||||
ْ // sukun | |||||
// non-ascii characters with specified pronunciations | |||||
// List the accented characters in en_list with the $accent attribute |
Character substitutions can be specified by using a `.replace` section | Character substitutions can be specified by using a `.replace` section | ||||
at the start of the `*_rules` file. Each line specified either one or | at the start of the `*_rules` file. Each line specified either one or | ||||
two alphabetic characters to be replaced by another one or two | two alphabetic characters to be replaced by another one or two | ||||
alphabetic characters. This substitution is done to a word before it is | |||||
translated using the spelling-to-phoneme rules. Only the lower-case | |||||
version of the characters needs to be specified. e.g. | |||||
alphabetic characters. This substitution is done to a word before word is searched | |||||
in `*_list` or `*_listx` file and translated using the spelling-to-phoneme rules. | |||||
Only the lower-case version of the characters needs to be specified. e.g. | |||||
.replace | .replace | ||||
ô ő // (Hungarian) allow the use of o-circumflex instead of o-double-accute | ô ő // (Hungarian) allow the use of o-circumflex instead of o-double-accute |
name Arabic | name Arabic | ||||
language ar | language ar | ||||
phonemes ar | phonemes ar | ||||
pitch 160 120 | |||||
roughness 0 | |||||
speed 70 | |||||
formant 0 105 80 150 | |||||
formant 1 110 80 160 | |||||
formant 2 110 70 150 | |||||
formant 3 110 70 150 | |||||
formant 4 115 80 200 | |||||
formant 5 115 80 100 | |||||
formant 6 110 70 150 | |||||
formant 7 110 70 100 | |||||
formant 8 110 70 150 | |||||
stressAdd 0 0 -10 -10 0 0 10 40 | |||||
echo 20 10 | |||||
voicing 75 | |||||
consonants 150 150 |
ipa ðˤ | ipa ðˤ | ||||
lengthmod 5 | lengthmod 5 | ||||
voicingswitch z | voicingswitch z | ||||
Vowelin f1=1 f2=2700 400 600 f3=200 70 rate len=70 | |||||
Vowelout f1=1 f2=2700 400 600 f3=200 70 rate | |||||
WAV(vwl_ar/zah) | |||||
ChangePhoneme (D) // FIXME: vwl_ar/zah wav file is wrong, therefore English D is used | |||||
endphoneme | endphoneme | ||||
phoneme A // arabic Ain | phoneme A // arabic Ain |
static const char ru_hard[] = { 0x2a, 0x16, 0x26, 0x28, 0 }; // letter group H [S Z ts] -- ъ ж ц ш | static const char ru_hard[] = { 0x2a, 0x16, 0x26, 0x28, 0 }; // letter group H [S Z ts] -- ъ ж ц ш | ||||
static const char ru_nothard[] = { 0x11, 0x12, 0x13, 0x14, 0x17, 0x19, 0x1a, 0x1b, 0x1c, 0x1d, 0x1f, 0x20, 0x21, 0x22, 0x24, 0x25, 0x27, 0x29, 0x2c, 0 }; // б в г д з й к л м н п р с т ф х ч щ ь | static const char ru_nothard[] = { 0x11, 0x12, 0x13, 0x14, 0x17, 0x19, 0x1a, 0x1b, 0x1c, 0x1d, 0x1f, 0x20, 0x21, 0x22, 0x24, 0x25, 0x27, 0x29, 0x2c, 0 }; // б в г д з й к л м н п р с т ф х ч щ ь | ||||
static const char ru_voiced[] = { 0x11, 0x12, 0x13, 0x14, 0x16, 0x17, 0 }; // letter group G (voiced obstruents) -- б в г д ж з | static const char ru_voiced[] = { 0x11, 0x12, 0x13, 0x14, 0x16, 0x17, 0 }; // letter group G (voiced obstruents) -- б в г д ж з | ||||
static const char ru_ivowels[] = { 0x2c, 0x2e, 0x2f, 0x31, 0 }; // letter group Y (iotated vowels & soft-sign) -- ь ю я ё | |||||
static const char ru_ivowels[] = { 0x15, 0x2c, 0x2e, 0x2f, 0x31, 0x34, 0x37, 0 }; // letter group Y (iotated vowels & soft-sign) -- е ь ю я ё є ї | |||||
tr->encoding = ESPEAKNG_ENCODING_KOI8_R; | tr->encoding = ESPEAKNG_ENCODING_KOI8_R; | ||||
tr->transpose_min = 0x430; // convert cyrillic from unicode into range 0x01 to 0x22 | tr->transpose_min = 0x430; // convert cyrillic from unicode into range 0x01 to 0x22 | ||||
tr->transpose_max = 0x451; | tr->transpose_max = 0x451; | ||||
{ | { | ||||
static const unsigned char stress_amps_ru[] = { 16, 16, 18, 18, 20, 24, 24, 22 }; | static const unsigned char stress_amps_ru[] = { 16, 16, 18, 18, 20, 24, 24, 22 }; | ||||
static const short stress_lengths_ru[8] = { 150, 140, 220, 220, 0, 0, 260, 280 }; | static const short stress_lengths_ru[8] = { 150, 140, 220, 220, 0, 0, 260, 280 }; | ||||
static const char ru_ivowels2[] = { 0x2c, 0x15, 0x18, 0x2e, 0x2f, 0 }; // add more vowels to letter group Y (iotated vowels & soft-sign) | |||||
static const char ru_ivowels2[] = { 0x18, 0 }; // add и to Y lettergroup (iotated vowels & soft-sign) | |||||
SetupTranslator(tr, stress_lengths_ru, stress_amps_ru); | SetupTranslator(tr, stress_lengths_ru, stress_amps_ru); | ||||
SetCyrillicLetters(tr); | SetCyrillicLetters(tr); | ||||
SetLetterBits(tr, 6, ru_ivowels2); | |||||
SetLetterBits(tr, LETTERGP_Y, ru_ivowels2); | |||||
tr->langopts.param[LOPT_UNPRONOUNCABLE] = 0x432; // [v] don't count this character at start of word | tr->langopts.param[LOPT_UNPRONOUNCABLE] = 0x432; // [v] don't count this character at start of word | ||||
tr->langopts.param[LOPT_REGRESSIVE_VOICING] = 1; | tr->langopts.param[LOPT_REGRESSIVE_VOICING] = 1; |
test_lang af c71ab424d045d9fa82d2a23b9be4542aee3ed15e "ma na Na pa ta ka tSa ba da ga dZa fa sa x2a Sa va za Za ca la ja ra r/a _:_ m@ ma mE mI mO mW mu m& m&: m@L mA: me@ mi mo@ my miu m@U maI mAI meI mOI moI muI mYy mY@ maU me: mO: m3: mA~ me~ mo~" | test_lang af c71ab424d045d9fa82d2a23b9be4542aee3ed15e "ma na Na pa ta ka tSa ba da ga dZa fa sa x2a Sa va za Za ca la ja ra r/a _:_ m@ ma mE mI mO mW mu m& m&: m@L mA: me@ mi mo@ my miu m@U maI mAI meI mOI moI muI mYy mY@ maU me: mO: m3: mA~ me~ mo~" | ||||
test_lang am 4fcdb9bb68b72c06e4cadf91b2c1e244ea14ac21 "ma na Na pa ta ka ?a ba da ga p\`a t\`a k\`a tSa dZa tS\`a Ba sa za Sa Za xa ha la ja wa ra _:_ mi me my ma m@ mo mu" | test_lang am 4fcdb9bb68b72c06e4cadf91b2c1e244ea14ac21 "ma na Na pa ta ka ?a ba da ga p\`a t\`a k\`a tSa dZa tS\`a Ba sa za Sa Za xa ha la ja wa ra _:_ mi me my ma m@ mo mu" | ||||
test_lang an 33304ad847d920652c74e1c51d12bbe6de9a182d "ma na Na pa ta tSa ka ba da ga fa Ta sa Sa ja wa la l^a ra Ra _:_ ma ma/ me me/ mi mo mo/ mu" | test_lang an 33304ad847d920652c74e1c51d12bbe6de9a182d "ma na Na pa ta tSa ka ba da ga fa Ta sa Sa ja wa la l^a ra Ra _:_ ma ma/ me me/ mi mo mo/ mu" | ||||
test_lang ar a67110f62981c0668bdbeb44feec7b3268a38353 "ma na pa ta ka qa ?a ba da dHa fa va Ta Da s[a sa za Sa Za xa Xa gHa Ha Aa dZa ra la l/2a ja wa _:_ ma mi mu ma: mi: mu: maw maj" | |||||
test_lang ar 0f289933c1898c03151c3b2546116399a642f4c7 "ma na pa ta ka qa ?a ba da dHa fa va Ta Da s[a sa za Sa Za xa Xa gHa Ha Aa dZa ra la l/2a ja wa _:_ ma mi mu ma: mi: mu: maw maj" | |||||
test_lang as 05d4cca91fc3447ae8b6acd7892790dd364e8e23 "ma na Na pa ta ka p#a t#a k#a ba da ga b#a d#a g#a sa xa Xa ha tSa tS#a za wa ra ja la _:_ ma mi mu me m& mo mO mV ma~ mi~ mu~ me~ m&~ mo~ mO~ moj mo~j mow mo~w mew maV m@" | test_lang as 05d4cca91fc3447ae8b6acd7892790dd364e8e23 "ma na Na pa ta ka p#a t#a k#a ba da ga b#a d#a g#a sa xa Xa ha tSa tS#a za wa ra ja la _:_ ma mi mu me m& mo mO mV ma~ mi~ mu~ me~ m&~ mo~ mO~ moj mo~j mow mo~w mew maV m@" | ||||
test_lang az 7bdb78c37433a47fb3b15808071b1a916202400c "ma na pa ba ta da tSa dZa tsa dza ca Ja Ca ka ga fa va sa za Sa Za xa Qa ha la ja wa Ra *a _:_ mi me m& my mW mu mo ma m@" | test_lang az 7bdb78c37433a47fb3b15808071b1a916202400c "ma na pa ba ta da tSa dZa tsa dza ca Ja Ca ka ga fa va sa za Sa Za xa Qa ha la ja wa Ra *a _:_ mi me m& my mW mu mo ma m@" | ||||
test_lang bg 3020acb23ac0f93d5479de3b305b71fc07b5e738 "ma na n^a Na m;a pa ba ta da ka ga p;a b;a t;a d;a ca Ja tsa dza tSa dZa ts;a dz;a fa va sa za Sa Za xa Qa f;a v;a s;a z;a x;a Ra R;a wa ja l/2a la l^a _:_ mi me m@ ma mo mu" | test_lang bg 3020acb23ac0f93d5479de3b305b71fc07b5e738 "ma na n^a Na m;a pa ba ta da ka ga p;a b;a t;a d;a ca Ja tsa dza tSa dZa ts;a dz;a fa va sa za Sa Za xa Qa f;a v;a s;a z;a x;a Ra R;a wa ja l/2a la l^a _:_ mi me m@ ma mo mu" |
" nev'ie:na nuo\`_ 'eiRo:pas v'al>sti:m nek,ad nav p'a:Rga:jusi nuo\`_ 'univERsa:la:s_:_: nuo\` v'ispa:Re:jiem n'uoduok}l^iem f'inanse:tas_:_: s'iste:mas uz 'obliga:ta:s 'apdRuoSina:Sanas s'iste:mu b'eigas" \ | " nev'ie:na nuo\`_ 'eiRo:pas v'al>sti:m nek,ad nav p'a:Rga:jusi nuo\`_ 'univERsa:la:s_:_: nuo\` v'ispa:Re:jiem n'uoduok}l^iem f'inanse:tas_:_: s'iste:mas uz 'obliga:ta:s 'apdRuoSina:Sanas s'iste:mu b'eigas" \ | ||||
"Neviena no Eiropas valstīm nekad nav pārgājusi no universālās (no vispārējiem nodokļiem finansētas) sistēmas uz obligātās apdrošināšanas sistēmu Beigas." | "Neviena no Eiropas valstīm nekad nav pārgājusi no universālās (no vispārējiem nodokļiem finansētas) sistēmas uz obligātās apdrošināšanas sistēmu Beigas." | ||||
test_phonemes ru \ | |||||
" 'Ab;i ab;'8 'AbjE 'Ab;I 'Abji 'Ap; 'Ab;u\" 'Ab;V" \ | |||||
"абе абё абє аби абї абь абю абя" | |||||
# Languages with non-Latin characters fall back to en when speaking Latin characters. | # Languages with non-Latin characters fall back to en when speaking Latin characters. | ||||
# TODO: Include words in their native script and move to the main tests above. | # TODO: Include words in their native script and move to the main tests above. | ||||