Browse Source

Merge remote-tracking branch 'valdisvi/master'

master
Reece H. Dunn 7 years ago
parent
commit
ca9254c26c

+ 270
- 229
dictsource/ar_list View File

// * arabic Language ar ar_list // * arabic Language ar ar_list
// * This file writen by TAHA Zerrouki 2012 // * This file writen by TAHA Zerrouki 2012
//*********
// ***************************************************************************
// * This program is free software; you can redistribute it and/or modify * // * This program is free software; you can redistribute it and/or modify *
// * it under the terms of the GNU General Public License as published by * // * it under the terms of the GNU General Public License as published by *
// * the Free Software Foundation; either version 3 of the License, or * // * the Free Software Foundation; either version 3 of the License, or *
// * You should have received a copy of the GNU General Public License * // * You should have received a copy of the GNU General Public License *
// * along with this program; if not, see: * // * along with this program; if not, see: *
// * <http://www.gnu.org/licenses/>. * // * <http://www.gnu.org/licenses/>. *
// ***************************************************************************/
//*********
// ***************************************************************************
//
// You can use the en_extra file, rather than this one // You can use the en_extra file, rather than this one
// to add your own pronunciation definitions. // to add your own pronunciation definitions.
// ***************************************************************************/

//
// This file is UTF-8 encoded // This file is UTF-8 encoded
// all words must be LOWER CASE (although the initial letter will be automatically // all words must be LOWER CASE (although the initial letter will be automatically
// converted if it's a 7bit ascii character)
// converted if it's a 7bit ascii character)
//
//stress symbols ' primary , secondary % unstressed //stress symbols ' primary , secondary % unstressed

// letter names, as they are spoken as a single character in text // letter names, as they are spoken as a single character in text
// precede by _ to distinguish from pronunciation as a language word // precede by _ to distinguish from pronunciation as a language word


//arabic alphabet
_آ alif mamduudah
_ا alif
ب baa?
پ pi
ت taa?
ث Taa?
ج dZim
ح Haa?
خ Xaa?
د daal
ذ Daal
ر raa?
ز zaaj
س siin
ش Siin
ص s[aad
ض dHaad
ط t[aa?
ظ Zaa?
ع Aajn
غ gHajn
ف faa?
ق qaaf
ك kaaf
گ gaaf
ل laam
م miim
ن nuun
و waaw
ه haa?
ي jaa?
َ fatHah
ُ dhammah
ِ kasrah
ّ Saddah
ْ sukuun
ً fatHataan
ٌ dhammataan
ٍ kasrataan
، faas[ilah
؛ nuqt[atah||faas[lah
ـ tat[wiil
ئ hamzah||Ala||?aljaa?
ؤ hamzah||Ala||?alwaa?
إ hamzah||taHta||?alwaa?
أ ?alif
ء hamzah
ة taa?||marbuut[ah
ى ?alif||maqs[uurah
ةً tan
// Arabic alphabet
_آ alif mamduudah
_ا alif
_ب baa?
_پ pi
_ت taa?
_ث Taa?
_ج dZim
_ح Haa?
_خ Xaa?
_د daal
_ذ Daal
_ر raa?
_ز zaaj
_س siin
_ش Siin
_ص s[aad
_ض dHaad
_ط t[aa?
_ظ Zaa?
_ع Aajn
_غ gHajn
_ف faa?
_ق qaaf
_ك kaaf
_گ gaaf
_ل laam
_م miim
_ن nuun
_و waaw
_ه haa?
_ي jaa?
_َ fatHah
_ُ dhammah
_ِ kasrah
_ّ Saddah
_ْ sukuun
_ً fatHataan
_ٌ dhammataan
_ٍ kasrataan
_، faas[ilah
_؛ nuqt[atah||faas[lah
_ـ tat[wiil
_ئ hamzah||Ala||?aljaa?
_ؤ hamzah||Ala||?alwaa?
_إ hamzah||taHta||?alwaa?
_أ ?alif
_ء hamzah
_ة taa?||marbuut[ah
_ى ?alif||maqs[uurah
_ةً tan
_


// When letters entered one by one
آ alif mamduudah $atend
ا alif $atend
ب baa? $atend
پ pi $atend
ت taa? $atend
ث Taa? $atend
ج dZim $atend
ح Haa? $atend
خ Xaa? $atend
د daal $atend
ذ Daal $atend
ر raa? $atend
ز zaaj $atend
س siin $atend
ش Siin $atend
ص s[aad $atend
ض dHaad $atend
ط t[aa? $atend
ظ Zaa? $atend
ع Aajn $atend
غ gHajn $atend
ف faa? $atend
ق qaaf $atend
ك kaaf $atend
گ gaaf $atend
ل laam $atend
م miim $atend
ن nuun $atend
و waaw $atend
ه haa? $atend
ي jaa? $atend
َ fatHah $atend
ُ dhammah $atend
ِ kasrah $atend
ّ Saddah $atend
ْ sukuun $atend
ً fatHataan $atend
ٌ dhammataan $atend
ٍ kasrataan $atend
، faas[ilah $atend
؛ nuqt[atah||faas[lah $atend
ـ tat[wiil $atend
ئ hamzah||Ala||?aljaa? $atend
ؤ hamzah||Ala||?alwaa? $atend
إ hamzah||taHta||?alwaa? $atend
أ ?alif $atend
ء hamzah $atend
ة taa?||marbuut[ah $atend
ى ?alif||maqs[uurah $atend
ةً tan $atend


// numeric // numeric
//_0 zero $text // TEST
_0 s[ifr
_1 waaHid
_2 ?iTnaan
_3 TalaaTah
_4 ?arbaAah
_5 Xamsah
_6 sittah
_7 sabAah
_8 Tamanijah
_9 tisAah
_10 AaSarah
_11 ?aHada||AaSarah
_12 ?iTnaa||AaSarah
_13 TalaaTata||AaSarah
_14 ?arbaAata||AaSarah
_15 Xamsata||AaSarah
_16 sittata||AaSarah
_17 sabAata||AaSarah
_18 Tamaanijata||AaSarah
_19 tisAata||AaSarah
_2X AiSruun
_3X TalaTuun
_4X ?arbaAuun
_5X Xamsuun
_6X sittuun
_7X sabA:n
_8X Tamaanuun
_9X tisAuun

_0C mi?ah
_1C mi?ah
_2C mi?ataan
_3C TalaaTumi?ah
_4C ?arbaAumi?ah
_5C Xamsumi?ah
_6C sittumi?ah
_7C sabAumi?ah
_8C Tamaanumi?ah
_9C tisAumi?ah

_0M1 ?alf
_1M1 ?alf
_2M1 ?alfaan
_3M1 TalaaTat||?aalaaf
_4M1 ?arbaAat||?aalaaf
_5M1 Xamsat||?aalaaf
_6M1 sittat||?aalaaf
_7M1 sabAat||?aalaaf
_8M1 Tamaanijat||?aalaaf
_9M1 tisAat||?aalaaf
_10M1 AaSarat||?aalaaf
_0 s[ifr
_1 waaHid
_2 ?iTnaan
_3 TalaaTah
_4 ?arbaAah
_5 Xamsah
_6 sittah
_7 sabAah
_8 Tamanijah
_9 tisAah
_10 AaSarah
_11 ?aHada||AaSarah
_12 ?iTnaa||AaSarah
_13 TalaaTata||AaSarah
_14 ?arbaAata||AaSarah
_15 Xamsata||AaSarah
_16 sittata||AaSarah
_17 sabAata||AaSarah
_18 Tamaanijata||AaSarah
_19 tisAata||AaSarah
_2X AiSruun
_3X TalaTuun
_4X ?arbaAuun
_5X Xamsuun
_6X sittuun
_7X sabA:n
_8X Tamaanuun
_9X tisAuun


_0C mi?ah
_1C mi?ah
_2C mi?ataan
_3C TalaaTumi?ah
_4C ?arbaAumi?ah
_5C Xamsumi?ah
_6C sittumi?ah
_7C sabAumi?ah
_8C Tamaanumi?ah
_9C tisAumi?ah


_0M1 ?alf
_1M1 ?alf
_2M1 ?alfaan
_3M1 TalaaTat||?aalaaf
_4M1 ?arbaAat||?aalaaf
_5M1 Xamsat||?aalaaf
_6M1 sittat||?aalaaf
_7M1 sabAat||?aalaaf
_8M1 Tamaanijat||?aalaaf
_9M1 tisAat||?aalaaf
_10M1 AaSarat||?aalaaf


_0M2 m%ilj%uun
_1M2 m%iljuun
_2M2 miljuunaan
_3M2 TalaaTat||malaajiin
_4M2 ?arbaAat||malaajiin
_5M2 Xamsat||malaajiin
_6M2 sittat||malaajiin
_7M2 sabAat||malaajiin
_8M2 Tamaanijat||malaajiin
_9M2 tisAat||malaajiin
_10M2 AaSarat||malaajiin
_0M2 m%ilj%uun
_1M2 m%iljuun
_2M2 miljuunaan
_3M2 TalaaTat||malaajiin
_4M2 ?arbaAat||malaajiin
_5M2 Xamsat||malaajiin
_6M2 sittat||malaajiin
_7M2 sabAat||malaajiin
_8M2 Tamaanijat||malaajiin
_9M2 tisAat||malaajiin
_10M2 AaSarat||malaajiin


_0M3 miljaar
_1M3 miljaar
_2M3 miljaaraan
_3M3 TalaaTat||miljaaraat
_4M3 ?arbaAat||miljaaraat
_5M3 Xamsat||miljaaraat
_6M3 sittat||miljaaraat
_7M3 sabAat||miljaaraat
_8M3 Tamaanijat||miljaaraat
_9M3 tisAat||miljaaraat
_10M3 AaSarat||miljaaraat
_0M3 miljaar
_1M3 miljaar
_2M3 miljaaraan
_3M3 TalaaTat||miljaaraat
_4M3 ?arbaAat||miljaaraat
_5M3 Xamsat||miljaaraat
_6M3 sittat||miljaaraat
_7M3 sabAat||miljaaraat
_8M3 Tamaanijat||miljaaraat
_9M3 tisAat||miljaaraat
_10M3 AaSarat||miljaaraat




_0and wa
_dpt faas[il
_roman rumaanii
_0and wa
_dpt faas[il
_roman rumaanii


_#st om
_#nd va
_#rd om
_#th om
_#st om
_#nd va
_#rd om
_#th om




// character names // character names
÷ taqsiim
× fii
؟ Aalaaamat||?istifhaam
! Aalaaamat||taAadZdZub
$ duulaar
% bilmi?ah
[ AaaridHah||maftuuHah
] AaaridHah||mugHlaqah
( qaws||maftuuH
) qaws||mugHlaq
* nedZmah
- naaqis[
/. nuqt[ah
/: nuqt[ataan
< ?as[gHar||min
= tusaawii
> ?akbar||min
{ HaadHinah||maftuuHah
} HaadHinah||mugHlaqah
... TalaaT||niqaat[
÷ taqsiim
× fii
؟ Aalaaamat||?istifhaam
! Aalaaamat||taAadZdZub
$ duulaar
% bilmi?ah
[ AaaridHah||maftuuHah
] AaaridHah||mugHlaqah
( qaws||maftuuH
) qaws||mugHlaq
* nedZmah
- naaqis[
/. nuqt[ah
/: nuqt[ataan
< ?as[gHar||min
= tusaawii
> ?akbar||min
{ HaadHinah||maftuuHah
} HaadHinah||mugHlaqah
... TalaaT||niqaat[




//characters and numbers and words with English alphabet is translated by English phonemes //characters and numbers and words with English alphabet is translated by English phonemes
th _^_en





th _^_en


// MAIN WORD DICTIONARY // MAIN WORD DICTIONARY
//********************* //*********************


// exceptional words with flags
ای ?aj $only

// exceptional words, (out of rules)
// propoer nouns
طه t[aahaa
عمرو Aamr
//abbriviation
د ?ad'duktuur $hasdot
أنا ?nba?anaa $hasdot
اه ?intahaa $hasdot
ثنا Had'daTanaa $hasdot
الخ ?ila||?aa_Xirih $hasdot
إلخ ?ila||?aaXirih $hasdot
رحه raHimahullah $hasdot
رضه radHijallahu||Anhu $hasdot
و wa $pause
//الألف اللينة
إله ?ilaah
أولئك ?ulaa?ika
أولو ?uluu
أولي ?ulii
داود daawuud
ذلك Daalika
التي ?allatii
الذي ?allaDii
الذين ?allaDiina
اللذين ?allaDajn
اللذان ?allaDaani
صلعم s[allaa|?allahu|Alajhi||wa||sallam
الرحمن ?arraHmaan
لكن laakin
الله ?allaah
اللهم ?allahumma
هؤلاء haa?ulaa?i
هذا haaDaa
هذان haaDaani
هذه haaDihi
//abbreviations
د ?ad'duktuur $hasdot
أنا ?nba?anaa $hasdot
اه ?intahaa $hasdot
ثنا Had'daTanaa $hasdot
الخ ?ila||?aa_Xirih $hasdot
إلخ ?ila||?aaXirih $hasdot
رحه raHimahullah $hasdot
رضه radHijallahu||Anhu $hasdot
و wa $pause
إله ?ilaah
أولئك ?ulaa?ika
أولو ?uluu
أولي ?ulii
داود daawuud
ذلك Daalika
التي ?allatii
الذي ?allaDii
الذين ?allaDiina
اللذين ?allaDajn
اللذان ?allaDaani
صلعم s[allaa|?allahu|Alajhi||wa||sallam
الرحمن ?arraHmaan
لكن laakin
الله ?allaah
اللهم ?allahumma
هؤلاء haa?ulaa?i
هذا haaDaa
هذان haaDaani
هذه haaDihi
//الوحدات //الوحدات
كغ kiluu||gHraam
كجم kiluu||gHraam
كغم kiluu||gHraam
طن t[un
كم kiiluu||mitar
سا saaAa
// Units below conflict with single letter name
// م mitar
// س su?aal
// ج dZawaab
// ص s[afHah
// العملات
كغ kiluu||gHraam
كجم kiluu||gHraam
كغم kiluu||gHraam
طن t[un
كم kiiluu||mitar
سا saaAa
// Units below conflict with single letter word
// م mitar
// س su?aal
// ج dZawaab
// ص s[afHah
د.ج diinaar||dZazaa?irij د.ج diinaar||dZazaa?irij
$ duulaar
€ ?uurruu
£ dZunajh
¥ juwaan
ج.م juwaan||mis[ri
ر.س rijaal||saAuudii
// مركب الاسم
ابن ?ibn
بن ban
$ duulaar
€ ?uurruu
£ dZunajh
¥ juwaan
ج.م juwaan||mis[ri
ر.س rijaal||saAuudii
ابن ?ibn
بن ban


//foreign language //foreign language
إنجليزية ?ingliizijah // probelm
جوجل guugal
غوغل guugal
(بسم الله) bismillaah
إنجليزية ?ingliizijah // probelm
جوجل guugal
غوغل guugal
(بسم الله) bismillaah

// exceptional words with flags
ای ?aj $only

// exceptional words, (out of rules)
// proper nouns
طه t[aahaa
عمرو Aamr
أنا 'ana



+ 365
- 493
dictsource/ar_rules View File

// * Arabic Language ar ar_rules
// * This file writen by Taha Zerrouki 2012
//*********
// * This program is free software; you can redistribute it and/or modify *
// * it under the terms of the GNU General Public License as published by *
// * the Free Software Foundation; either version 3 of the License, or *
// * (at your option) any later version. *
// * *
// * This program is distributed in the hope that it will be useful, *
// * but WITHOUT ANY WARRANTY; without even the implied warranty of *
// * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the *
// * GNU General Public License for more details. *
// * *
// * You should have received a copy of the GNU General Public License *
// * along with this program; if not, see: *
// * <http://www.gnu.org/licenses/>. *
// ***************************************************************************/
// This file is UTF-8 encoded
// all words must be LOWER CASE (although the initial letter will be automatically
// converted if it's a 7bit ascii character)
// Text to phoneme rules for Arabic
// replace Arabic eastern character numbers with Arabic western character numbers
.replace
٠ 0
۰ 0
۱ 1
١ 1
٢ 2
۲ 2
٣ 3
۳ 3
٤ 4
۴ 4
٥ 5
۵ 5
٦ 6
۶ 6
٧ 7
۷ 7
٨ 8
۸ 8
٩ 9
۹ 9
ئ ء //توحيد شكل الهمزة
ؤ ء
إ ءِ
أ ء
ـ //حذف التطويل
//all vowels
.A ا ي و َ ُ ِ ً ٌ ٍ ّ ى
//list of consonants
.C ب پ ت ة ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ئ ؤ ء أ آ إ ه
//all vowels
.L01 ا ي و َ ُ ِ ً ٌ ٍ ّ ى
//short vowels (commonly unwritten )
.L02 َ ُ ِ ً ٌ ٍ
//list of consonants
.L03 ب پ ت ة ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ئ ؤ ء أ آ إ ه
// all Arabic characters without ا آ
.L04 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ت ن م ك َ ُ ِ ّ ـ « » ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ
// all Arabic characters without short vowels and A
.L05 ض ص ث ق ف غ ع ه خ ح ج ش س ي ب ل ت ن م ك ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ
// group of digits
.L06 0 1 2 3 4 5 6 7 8 9
// all Arabic characters
.L09 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ا ت ن م ك َ ُ ِ ّ آ ـ « » ظ ط ز ر ذ د ئ و ة ي ژ ؤ إ أ ء ؟ پ گ
// Arabic Sun characters
.L10 ض ص ث ش س ل ت ن ظ ط ز ر ذ د
// Arabic Moon characters
.L11 ق ف غ ع ه خ ح ج ي ب م ك و إ أ ء
//.group
.group آ
آ ?aa
.group ا
_) ا a // make the previous fatha long
//ا aa
L03) ا aa // if a consonant is before it, make the fatha long
// ا (_ aa
ا (ُ ?
ا (ِ ?
ا (َ ?
// اً ' //ألف بعده تنوين نصب
// ا (ًS2 //a ألف بعده تنوين نصب
// السوابق قبل ال
_ب) ا (ل i
//_و) ا (ل a
//_ف) ا (ل a
//_ك) ا (ل a
L03) ا (L03 aa
_) ال (L10ّP2 ?a //الشمس
_) ال (L11P2 ?al //القمر
// ات (_S2 aat //جمع مؤنث سالم
//الحروف الشمسية
// ال التعريف مع حرف شمسي
//25/05
_) ال (لP2 ?al
_) ال (نP2 ?an
_) ال (ثP2 ?aT
_) ال (تP2 ?at
_) ال (دP2 ?ad
_) ال (رP2 ?ar
_) ال (ذP2 ?aD
_) ال (سP2 ?as
_) ال (زP2 ?az
_) ال (صP2 ?as[
_) ال (شP2 ?aS
_) ال (شّP2 ?a
//_) ال (طP2 ?at[
_) ال (ضP2 ?adH
_) ال (ظP2 ?aZ
.group ب
ب b
ب (ّ Bb
// _) ب (P1 bi //بشمس
//_) ب (ال bi //حرف الجر باء قبل ال التعريف
_) بال (L10P3 bi //بالشمس
_) بال (L11P3 bil //بالقمر
//الحروف الشمسية
// ال التعريف مع حرف شمسي
_) بال (لP3 bil
_) بال (نP3 bin
_) بال (ثP3 biT
_) بال (تP3 bit
_) بال (دP3 bid
_) بال (رP3 bir
_) بال (ذP3 biD
_) بال (سP3 bis
_) بال (زP3 biz
_) بال (صP3 bis[
_) بال (شP3 biS
_) بال (طP3 bit[
_) بال (ضP3 bidH
_) بال (ظP3 biZ
.group پ
پ p
.group ت
ت t
ت (ّ tt
_) ت (َP1 t
_) ت (P1 ta //تسأل
_َ) ت (P2 t
ت (_S1 at //سألت
.group ث
ث T
.group ج
ج dZ
ج (ّ dZdZ
.group ح
ح H
.group خ
خ X
.group د
د d
د (ّ dd
.group ذ
ذ D
.group ر
ر r
.group ز
ز z
.group س
س s
س (ّ ss
.group ش
ش S
ش (ّ SS
.group ص
ص s[
ص (ّ s[s[
.group ض
ض dH
// ض (ّ dHdH
.group ط
ط t[
.group ظ
ظ Z
.group ع
ع A
.group غ
// غ R2
غ gH
.group ف
ف f
_) فال (L10P3 fa //فالشمس
_) فَالْ (L10P4 fa
_) فَال (L10P4 fa
_) فال (L11P3 fal //فالقمر
_) فَال (L11P4 fa
_) فَالْ (L11P4 fal
//الحروف الشمسية
// ال التعريف مع حرف شمسي
_) فال (لP3 fal
_) فال (نP3 fan
_) فال (ثP3 faT
_) فال (تP3 fat
_) فال (دP3 fad
_) فال (رP3 far
_) فال (ذP3 faD
_) فال (سP3 fas
_) فال (زP3 faz
_) فال (صP3 fas[
_) فال (شP3 faS
_) فال (طP3 fat[
_) فال (ضP3 fadH
_) فال (ظP3 faZ
.group ق
ق q
//ق (ّ qq
.group ك
ك k
//ك (ّ kk
_) كال (L10P3 ka //كالشمس
_) كَالْ (L10P4 ka
_) كَال (L10P4 ka
_) كال (L11P3 kal //كالقمر
_) كَالْ (L11P4 kal
ك (_S1 ka // الضمير المتصل
كم (_S2 kum //الضمير المتصل
كما (_S3 kumaa //الضمير المتصل
كن (_S2 kunna //الضمير المتصل
//الحروف الشمسية
// ال التعريف مع حرف شمسي
_) كال (لP3 kal
_) كال (نP3 kan
_) كال (ثP3 kaT
_) كال (تP3 kat
_) كال (دP3 kad
_) كال (رP3 kar
_) كال (ذP3 kaD
_) كال (سP3 kas
_) كال (زP3 kaz
_) كال (صP3 kas[
_) كال (شP3 kaS
_) كال (طP3 kat[
_) كال (ضP3 kadH
_) كال (ظP3 kaZ
.group گ
گ g
.group ل
ل l
ل (ّ ll
_ا) ل (L10 ' // Sun letters
_بِا) ل (L10 ' // Sun letters
_وَا) ل (L10 ' // Sun letters
_فَا) ل (L10 ' // Sun letters
_كَا) ل (L10 ' // Sun letters
_لِ) ل (L10 ' // Sun letters
// _) لل (L10P2 li //للشمس
// _) لل (L11P2 lil //للقمر
//الحروف الشمسية
// ال التعريف مع حرف شمسي
// _) لل (لP2 lil
// _) لل (نP2 lin
// _) لل (ثP2 liT
// _) لل (تP2 lit
// _) لل (دP2 lid
// _) لل (رP2 lir
// _) لل (ذP2 liD
// _) لل (سP2 lis
// _) لل (زP2 liz
// _) لل (صP2 lis[
// _) لل (شP2 liS
// _) لل (طP2 lit[
// _) لل (ضP2 lidH
// _) لل (ظP2 liZ
.group م
م m
.group ن
ن n
ن (ب m
ن (ْب m
.group ه
ه h
ه (_S1 h // الضمير المتصل
ها (_S2 haa //الضمير المتصل
هم (_S2 hum //الضمير المتصل
هما (_S3 humaa //الضمير المتصل
هن (_S2 hunna //الضمير المتصل
.group و
_) و w //واو في أول الكلمة
ا) و w //واو بعد الألف
ْ) و w // واو بعد سكون
َ) و w //واو بعد فتحة
ِ) و w //واو بعد كسرة
و (L01 w //واو بعدها حرف علة
// ُ) و : // make the prevuous damma long
L03) و uu //واو بعد صامت دون تشكيل
_) وال (L10P3 wa //والشمس
_) وَالْ (L10P4 wa
_) وَال (L10P4 wa
_) وال (L11P3 wal //والقمر
_) وَالْ (L11P4 wal
_) وَال (L11P4 wal
ون (_S2 uuna //جمع مذكر سالم فلاحون
وا (_S2 uu // فعل مع ضمائر الجمع المذكرة درسوا
ُ) وا (_S2 u
//الحروف الشمسية
// ال التعريف مع حرف شمسي
_) وال (لP3 wal
_) وال (نP3 wan
_) وال (ثP3 waT
_) وال (تP3 wat
_) وال (دP3 wad
_) وال (رP3 war
_) وال (ذP3 waD
_) وال (سP3 was
_) وال (زP3 waz
_) وال (صP3 was[
_) وال (شP3 waS
_) وال (طP3 wat[
_) وال (ضP3 wadH
_) وال (ظP3 waZ
.group ي
_) ي j ياء في أول الكلمة
ا) ي j // ياء بعد ألف
ْ) ي j //ياء بعد سكون
َ) ي j // ياء بعد فتحة
ُ) ي j //ياء بعد ضمّة
ي (L01 j //يا بعدها حروف علة
// ِ) ي %: // make the previous kasra long
L03) ي ii // ياء بعد صامت دون تشكيل
ية (_S2 ijjah //يّة النسبة
يون (_S3 ijjuun //kجمع مذكر سالم منسوب جزائريون
يين (_S3 ijjiin //kجمع مذكر سالم منسوب جزائريين
يات (_S3 ijjaat //يّة النسبة في جمع المؤنث جزائريات
ين (_S2 iina //جمع مذكر سالم منصوب أو مجرور
ي (_S1 ii //ياء النسبة
ِ)ي (_S1 i
.group ى //ألف مقصورة
L03) ى (_ aa
ى a
// َ) ى aa
.group ء
ء ?
ء (ً ?an
.group ّ
ّ
// L03) ّ %% //
//b) ّ bb
.group ئ
ئ ?
.group ؤ
ؤ ?
.group ة
ة t
ةً tan
// ة (L02 t // التاء المربوطة مشكولة
// ة (_S1 h //التاء المربوطة غير مشكولة
// L05) ة (_S1 ah //بوطة ما قبلها صامت، يضاف إليه فتحة
// L05) ة (L02 at //تاء بعدها حركة وقبلها صامت
// L02) ة (_S1 h // التاء المربوطة غير مشكولة وماقبلها مشكول
// ة (L02 t // التاء المربوطة مشكولة
// ة t // التاء المربوطة مشكولة
//vowels that are not usually written:
.group ْ
ْ
.group َ
َ %a
َ(ا aa // make the previous fatha long
.group ِ
ِ i
ِ(ي ii // make the previous kassra long
// ِ (_S1 i // e
.group ُ
ُ u
ُ(و uu // make the previous kassra long
// ُ (_S1 u // o
.group ٌ // dammatan
ٌ (_S1 un
ٌ '
.group ً // fatahatan
ًا (S1 an
.group ٍ // kasratan
ٍ (_S1 in
ٍ '
.group أ
// أ ?
.group إ
//إ (ِ ?i
إ ?i
.group ـ
ـ '
.group ،
، ||
.group ؛
؛
//characters and numbers and words with English alphabet is translated by English phonemes
// default group for "non of the above"
.group
// non-ascii characters with specified pronunciations
// List the accented characters in en_list with the $accent attribute
// * Arabic Language ar ar_rules
// * This file writen by Taha Zerrouki 2012
// ***************************************************************************
// * This program is free software; you can redistribute it and/or modify *
// * it under the terms of the GNU General Public License as published by *
// * the Free Software Foundation; either version 3 of the License, or *
// * (at your option) any later version. *
// * *
// * This program is distributed in the hope that it will be useful, *
// * but WITHOUT ANY WARRANTY; without even the implied warranty of *
// * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the *
// * GNU General Public License for more details. *
// * *
// * You should have received a copy of the GNU General Public License *
// * along with this program; if not, see: *
// * <http://www.gnu.org/licenses/>. *
// ***************************************************************************/
//
// This file is UTF-8 encoded
// all words must be LOWER CASE (although the initial letter will be automatically
// converted if it's a 7bit ascii character)
// Text to phoneme rules for Arabic
//
// replace Arabic eastern character numbers with Arabic western character numbers
.replace
٠ 0
۰ 0
۱ 1
١ 1
٢ 2
۲ 2
٣ 3
۳ 3
٤ 4
۴ 4
٥ 5
۵ 5
٦ 6
۶ 6
٧ 7
۷ 7
٨ 8
۸ 8
٩ 9
۹ 9
، ,
؛ ;

//all vowels
.L01 ا ي و َ ُ ِ ً ٌ ٍ ّ ى

//short vowels (commonly unwritten )
.L02

//list of consonants
.L03 ب پ ت ة ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ئ ؤ ء أ آ إ ه

// all Arabic characters without ا آ
.L04 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ت ن م ك َ ُ ِ ّ ـ « » ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ

// all Arabic characters without short vowels and A
.L05 ض ص ث ق ف غ ع ه خ ح ج ش س ي ب ل ت ن م ك ظ ط ز ر ذ د ئ و ة ي ؤ إ أ ء پ گ

// group of digits
.L06 0 1 2 3 4 5 6 7 8 9

// all Arabic characters
.L09 ض ص ث ق ف غ ع ه خ ح ج ً ٌ ٍ ، ؛ ش س ي ب ل ا ت ن م ك َ ُ ِ ّ آ ـ « » ظ ط ز ر ذ د ئ و ة ي ژ ؤ إ أ ء ؟ پ گ

// Arabic Sun characters
.L10 ض ص ث ش س ل ت ن ظ ط ز ر ذ د

// Arabic Moon characters
.L11 ق ف غ ع ه خ ح ج ي ب م ك و إ أ ء

.group آ
آ ?aa

.group ا
L03) ا aa // if a consonant is before it, make the fatha long
L03) ا (L03 aa
ا (َ ?
ا (ُ ?
ا (ِ ?
_) ا a // make the previous fatha long
_) ال (L10P2 ?a //الشمس
_) ال (L11P2 ?al //القمر
_) ال (تP2 ?at
_) ال (ثP2 ?aT
_) ال (دP2 ?ad
_) ال (ذP2 ?aD
_) ال (رP2 ?ar
_) ال (زP2 ?az
_) ال (سP2 ?as
_) ال (شّP2 ?a
_) ال (شP2 ?aS
_) ال (صP2 ?as[
_) ال (ضP2 ?adH
_) ال (ظP2 ?aZ
_) ال (لP2 ?al
_) ال (نP2 ?an
_ب) ا (ل i

.group أ
أ a

.group إ
إ ?i

.group ب
ب b
بّ Bb
_) بال (L10P3 bi //بالشمس
_) بال (L11P3 bil //بالقمر
_) بال (تP3 bit
_) بال (ثP3 biT
_) بال (دP3 bid
_) بال (ذP3 biD
_) بال (رP3 bir
_) بال (زP3 biz
_) بال (سP3 bis
_) بال (شP3 biS
_) بال (صP3 bis[
_) بال (ضP3 bidH
_) بال (طP3 bit[
_) بال (ظP3 biZ
_) بال (لP3 bil
_) بال (نP3 bin

.group پ
پ p

.group ت
ت t
_) ت (َP1 t
_) ت (P1 ta //تسأل
_َ) ت (P2 t
ت (_S1 at //سألت
تّ tt

.group ث
ث T

.group ج
ج dZ
جّ dZdZ

.group ح
ح H

.group خ
خ X

.group د
د d
دّ dd

.group ذ
ذ D

.group ر
ر r

.group ز
ز z

.group س
س s
سّ ss

.group ش
ش S
شّ SS

.group ص
ص s[
صّ s[s[

.group ض
ض dH

.group ط
ط t[

.group ظ
ظ Z

.group ع
ع A

.group غ
غ gH

.group ف
ف f
_) فال (L10P3 fa //فالشمس
_) فَال (L10P4 fa
_) فَالْ (L10P4 fa
_) فال (L11P3 fal //فالقمر
_) فَال (L11P4 fa
_) فَالْ (L11P4 fal
_) فال (تP3 fat
_) فال (ثP3 faT
_) فال (دP3 fad
_) فال (ذP3 faD
_) فال (رP3 far
_) فال (زP3 faz
_) فال (سP3 fas
_) فال (شP3 faS
_) فال (صP3 fas[
_) فال (ضP3 fadH
_) فال (طP3 fat[
_) فال (ظP3 faZ
_) فال (لP3 fal
_) فال (نP3 fan
.group ق
ق q

.group ك
ك k
ك (_S1 ka // الضمير المتصل
_) كال (L10P3 ka //كالشمس
_) كَال (L10P4 ka
_) كَالْ (L10P4 ka
_) كال (L11P3 kal //كالقمر
_) كَالْ (L11P4 kal
_) كال (تP3 kat
_) كال (ثP3 kaT
_) كال (دP3 kad
_) كال (ذP3 kaD
_) كال (رP3 kar
_) كال (زP3 kaz
_) كال (سP3 kas
_) كال (شP3 kaS
_) كال (صP3 kas[
_) كال (ضP3 kadH
_) كال (طP3 kat[
_) كال (ظP3 kaZ
_) كال (لP3 kal
_) كال (نP3 kan
كم (_S2 kum //الضمير المتصل
كما (_S3 kumaa //الضمير المتصل
كن (_S2 kunna //الضمير المتصل

.group گ
گ g

.group ل
ل l
_ا) ل (L10 ' // Sun letters
_بِا) ل (L10 ' // Sun letters
_فَا) ل (L10 ' // Sun letters
_كَا) ل (L10 ' // Sun letters
لّ ll
_لِ) ل (L10 ' // Sun letters
_وَا) ل (L10 ' // Sun letters

.group م
م m

.group ن
ن n
ن (ب m
ن (ْب m

.group ه
ه h
ه (_S1 h // الضمير المتصل
ها (_S2 haa //الضمير المتصل
هم (_S2 hum //الضمير المتصل
هما (_S3 humaa //الضمير المتصل
هن (_S2 hunna //الضمير المتصل

.group و
L03) و uu //واو بعد صامت دون تشكيل
ا) و w //واو بعد الألف
و (L01 w //واو بعدها حرف علة
ْ) و w // واو بعد سكون
َ) و w //واو بعد فتحة
ِ) و w //واو بعد كسرة
_) و w //واو في أول الكلمة
وا (_S2 u
وا (_S2 uu // فعل مع ضمائر الجمع المذكرة درسوا
_) وال (L10P3 wa //والشمس
_) وَال (L10P4 wa
_) وَالْ (L10P4 wa
_) وال (L11P3 wal //والقمر
_) وَال (L11P4 wal
_) وَالْ (L11P4 wal
_) وال (تP3 wat
_) وال (ثP3 waT
_) وال (دP3 wad
_) وال (ذP3 waD
_) وال (رP3 war
_) وال (زP3 waz
_) وال (سP3 was
_) وال (شP3 waS
_) وال (صP3 was[
_) وال (ضP3 wadH
_) وال (طP3 wat[
_) وال (ظP3 waZ
_) وال (لP3 wal
_) وال (نP3 wan
ون (_S2 uuna //جمع مذكر سالم فلاحون

.group ي
L03) ي ii // ياء بعد صامت دون تشكيل
ا) ي j // ياء بعد ألف
يِ jii
ْ) ي j //ياء بعد سكون
ُ) ي j //ياء بعد ضمّة
َ) ي j // ياء بعد فتحة
_) ي j // ياء في أول الكلمة
ي (L01 j //يا بعدها حروف علة
ي (_S1 i
ي (_S1 ii //ياء النسبة
يات (_S3 ijjaat //يّة النسبة في جمع المؤنث جزائريات
ية (_S2 ijjah //يّة النسبة
ين (_S2 iina //جمع مذكر سالم منصوب أو مجرور
يون (_S3 ijjuun //kجمع مذكر سالم منسوب جزائريون
يين (_S3 ijjiin //kجمع مذكر سالم منسوب جزائريين

.group ى //ألف مقصورة
ى a
L03) ى (_ aa

.group ء
ء ?
ء (ً ?an

.group ئ
ئ ?

.group ؤ
ؤ ?

.group ة
ة t
ةً tan

// Other diacritics
.group
ٍ (_S1 in // kasratan at the end of word
ٌ (_S1 un // dammatan at the end of word
ُ u // damma
ُو uu
َا aa
َى aa
ٰ aa // superscript alef
ِ i // kasra
َ %a // fatha

// Following are default rules for other diacritics and they are just silence.
// Diacritics should be consumed together with leading letters in rules above.

ٌ // dammatan
ً // fathatan
ٍ // kasratan
ـ // tatweel
ۡ // small high dotless head of khan
ْ // sukun

// non-ascii characters with specified pronunciations
// List the accented characters in en_list with the $accent attribute

+ 3
- 3
docs/dictionary.md View File

Character substitutions can be specified by using a `.replace` section Character substitutions can be specified by using a `.replace` section
at the start of the `*_rules` file. Each line specified either one or at the start of the `*_rules` file. Each line specified either one or
two alphabetic characters to be replaced by another one or two two alphabetic characters to be replaced by another one or two
alphabetic characters. This substitution is done to a word before it is
translated using the spelling-to-phoneme rules. Only the lower-case
version of the characters needs to be specified. e.g.
alphabetic characters. This substitution is done to a word before word is searched
in `*_list` or `*_listx` file and translated using the spelling-to-phoneme rules.
Only the lower-case version of the characters needs to be specified. e.g.


.replace .replace
ô   ő   // (Hungarian) allow the use of o-circumflex instead of o-double-accute ô   ő   // (Hungarian) allow the use of o-circumflex instead of o-double-accute

+ 0
- 18
espeak-ng-data/lang/sem/ar View File

name Arabic name Arabic
language ar language ar
phonemes ar phonemes ar
pitch 160 120
roughness 0
speed 70

formant 0 105 80 150
formant 1 110 80 160
formant 2 110 70 150
formant 3 110 70 150
formant 4 115 80 200
formant 5 115 80 100
formant 6 110 70 150
formant 7 110 70 100
formant 8 110 70 150

stressAdd 0 0 -10 -10 0 0 10 40
echo 20 10
voicing 75
consonants 150 150

+ 1
- 3
phsource/ph_arabic View File

ipa ðˤ ipa ðˤ
lengthmod 5 lengthmod 5
voicingswitch z voicingswitch z
Vowelin f1=1 f2=2700 400 600 f3=200 70 rate len=70
Vowelout f1=1 f2=2700 400 600 f3=200 70 rate
WAV(vwl_ar/zah)
ChangePhoneme (D) // FIXME: vwl_ar/zah wav file is wrong, therefore English D is used
endphoneme endphoneme


phoneme A // arabic Ain phoneme A // arabic Ain

+ 3
- 3
src/libespeak-ng/tr_languages.c View File

static const char ru_hard[] = { 0x2a, 0x16, 0x26, 0x28, 0 }; // letter group H [S Z ts] -- ъ ж ц ш static const char ru_hard[] = { 0x2a, 0x16, 0x26, 0x28, 0 }; // letter group H [S Z ts] -- ъ ж ц ш
static const char ru_nothard[] = { 0x11, 0x12, 0x13, 0x14, 0x17, 0x19, 0x1a, 0x1b, 0x1c, 0x1d, 0x1f, 0x20, 0x21, 0x22, 0x24, 0x25, 0x27, 0x29, 0x2c, 0 }; // б в г д з й к л м н п р с т ф х ч щ ь static const char ru_nothard[] = { 0x11, 0x12, 0x13, 0x14, 0x17, 0x19, 0x1a, 0x1b, 0x1c, 0x1d, 0x1f, 0x20, 0x21, 0x22, 0x24, 0x25, 0x27, 0x29, 0x2c, 0 }; // б в г д з й к л м н п р с т ф х ч щ ь
static const char ru_voiced[] = { 0x11, 0x12, 0x13, 0x14, 0x16, 0x17, 0 }; // letter group G (voiced obstruents) -- б в г д ж з static const char ru_voiced[] = { 0x11, 0x12, 0x13, 0x14, 0x16, 0x17, 0 }; // letter group G (voiced obstruents) -- б в г д ж з
static const char ru_ivowels[] = { 0x2c, 0x2e, 0x2f, 0x31, 0 }; // letter group Y (iotated vowels & soft-sign) -- ь ю я ё
static const char ru_ivowels[] = { 0x15, 0x2c, 0x2e, 0x2f, 0x31, 0x34, 0x37, 0 }; // letter group Y (iotated vowels & soft-sign) -- е ь ю я ё є ї
tr->encoding = ESPEAKNG_ENCODING_KOI8_R; tr->encoding = ESPEAKNG_ENCODING_KOI8_R;
tr->transpose_min = 0x430; // convert cyrillic from unicode into range 0x01 to 0x22 tr->transpose_min = 0x430; // convert cyrillic from unicode into range 0x01 to 0x22
tr->transpose_max = 0x451; tr->transpose_max = 0x451;
{ {
static const unsigned char stress_amps_ru[] = { 16, 16, 18, 18, 20, 24, 24, 22 }; static const unsigned char stress_amps_ru[] = { 16, 16, 18, 18, 20, 24, 24, 22 };
static const short stress_lengths_ru[8] = { 150, 140, 220, 220, 0, 0, 260, 280 }; static const short stress_lengths_ru[8] = { 150, 140, 220, 220, 0, 0, 260, 280 };
static const char ru_ivowels2[] = { 0x2c, 0x15, 0x18, 0x2e, 0x2f, 0 }; // add more vowels to letter group Y (iotated vowels & soft-sign)
static const char ru_ivowels2[] = { 0x18, 0 }; // add и to Y lettergroup (iotated vowels & soft-sign)


SetupTranslator(tr, stress_lengths_ru, stress_amps_ru); SetupTranslator(tr, stress_lengths_ru, stress_amps_ru);
SetCyrillicLetters(tr); SetCyrillicLetters(tr);
SetLetterBits(tr, 6, ru_ivowels2);
SetLetterBits(tr, LETTERGP_Y, ru_ivowels2);


tr->langopts.param[LOPT_UNPRONOUNCABLE] = 0x432; // [v] don't count this character at start of word tr->langopts.param[LOPT_UNPRONOUNCABLE] = 0x432; // [v] don't count this character at start of word
tr->langopts.param[LOPT_REGRESSIVE_VOICING] = 1; tr->langopts.param[LOPT_REGRESSIVE_VOICING] = 1;

+ 1
- 1
tests/language-phonemes.test View File

test_lang af c71ab424d045d9fa82d2a23b9be4542aee3ed15e "ma na Na pa ta ka tSa ba da ga dZa fa sa x2a Sa va za Za ca la ja ra r/a _:_ m@ ma mE mI mO mW mu m& m&: m@L mA: me@ mi mo@ my miu m@U maI mAI meI mOI moI muI mYy mY@ maU me: mO: m3: mA~ me~ mo~" test_lang af c71ab424d045d9fa82d2a23b9be4542aee3ed15e "ma na Na pa ta ka tSa ba da ga dZa fa sa x2a Sa va za Za ca la ja ra r/a _:_ m@ ma mE mI mO mW mu m& m&: m@L mA: me@ mi mo@ my miu m@U maI mAI meI mOI moI muI mYy mY@ maU me: mO: m3: mA~ me~ mo~"
test_lang am 4fcdb9bb68b72c06e4cadf91b2c1e244ea14ac21 "ma na Na pa ta ka ?a ba da ga p\`a t\`a k\`a tSa dZa tS\`a Ba sa za Sa Za xa ha la ja wa ra _:_ mi me my ma m@ mo mu" test_lang am 4fcdb9bb68b72c06e4cadf91b2c1e244ea14ac21 "ma na Na pa ta ka ?a ba da ga p\`a t\`a k\`a tSa dZa tS\`a Ba sa za Sa Za xa ha la ja wa ra _:_ mi me my ma m@ mo mu"
test_lang an 33304ad847d920652c74e1c51d12bbe6de9a182d "ma na Na pa ta tSa ka ba da ga fa Ta sa Sa ja wa la l^a ra Ra _:_ ma ma/ me me/ mi mo mo/ mu" test_lang an 33304ad847d920652c74e1c51d12bbe6de9a182d "ma na Na pa ta tSa ka ba da ga fa Ta sa Sa ja wa la l^a ra Ra _:_ ma ma/ me me/ mi mo mo/ mu"
test_lang ar a67110f62981c0668bdbeb44feec7b3268a38353 "ma na pa ta ka qa ?a ba da dHa fa va Ta Da s[a sa za Sa Za xa Xa gHa Ha Aa dZa ra la l/2a ja wa _:_ ma mi mu ma: mi: mu: maw maj"
test_lang ar 0f289933c1898c03151c3b2546116399a642f4c7 "ma na pa ta ka qa ?a ba da dHa fa va Ta Da s[a sa za Sa Za xa Xa gHa Ha Aa dZa ra la l/2a ja wa _:_ ma mi mu ma: mi: mu: maw maj"
test_lang as 05d4cca91fc3447ae8b6acd7892790dd364e8e23 "ma na Na pa ta ka p#a t#a k#a ba da ga b#a d#a g#a sa xa Xa ha tSa tS#a za wa ra ja la _:_ ma mi mu me m& mo mO mV ma~ mi~ mu~ me~ m&~ mo~ mO~ moj mo~j mow mo~w mew maV m@" test_lang as 05d4cca91fc3447ae8b6acd7892790dd364e8e23 "ma na Na pa ta ka p#a t#a k#a ba da ga b#a d#a g#a sa xa Xa ha tSa tS#a za wa ra ja la _:_ ma mi mu me m& mo mO mV ma~ mi~ mu~ me~ m&~ mo~ mO~ moj mo~j mow mo~w mew maV m@"
test_lang az 7bdb78c37433a47fb3b15808071b1a916202400c "ma na pa ba ta da tSa dZa tsa dza ca Ja Ca ka ga fa va sa za Sa Za xa Qa ha la ja wa Ra *a _:_ mi me m& my mW mu mo ma m@" test_lang az 7bdb78c37433a47fb3b15808071b1a916202400c "ma na pa ba ta da tSa dZa tsa dza ca Ja Ca ka ga fa va sa za Sa Za xa Qa ha la ja wa Ra *a _:_ mi me m& my mW mu mo ma m@"
test_lang bg 3020acb23ac0f93d5479de3b305b71fc07b5e738 "ma na n^a Na m;a pa ba ta da ka ga p;a b;a t;a d;a ca Ja tsa dza tSa dZa ts;a dz;a fa va sa za Sa Za xa Qa f;a v;a s;a z;a x;a Ra R;a wa ja l/2a la l^a _:_ mi me m@ ma mo mu" test_lang bg 3020acb23ac0f93d5479de3b305b71fc07b5e738 "ma na n^a Na m;a pa ba ta da ka ga p;a b;a t;a d;a ca Ja tsa dza tSa dZa ts;a dz;a fa va sa za Sa Za xa Qa f;a v;a s;a z;a x;a Ra R;a wa ja l/2a la l^a _:_ mi me m@ ma mo mu"

+ 4
- 0
tests/language-pronunciation.test View File

" nev'ie:na nuo\`_ 'eiRo:pas v'al>sti:m nek,ad nav p'a:Rga:jusi nuo\`_ 'univERsa:la:s_:_: nuo\` v'ispa:Re:jiem n'uoduok}l^iem f'inanse:tas_:_: s'iste:mas uz 'obliga:ta:s 'apdRuoSina:Sanas s'iste:mu b'eigas" \ " nev'ie:na nuo\`_ 'eiRo:pas v'al>sti:m nek,ad nav p'a:Rga:jusi nuo\`_ 'univERsa:la:s_:_: nuo\` v'ispa:Re:jiem n'uoduok}l^iem f'inanse:tas_:_: s'iste:mas uz 'obliga:ta:s 'apdRuoSina:Sanas s'iste:mu b'eigas" \
"Neviena no Eiropas valstīm nekad nav pārgājusi no universālās (no vispārējiem nodokļiem finansētas) sistēmas uz obligātās apdrošināšanas sistēmu Beigas." "Neviena no Eiropas valstīm nekad nav pārgājusi no universālās (no vispārējiem nodokļiem finansētas) sistēmas uz obligātās apdrošināšanas sistēmu Beigas."


test_phonemes ru \
" 'Ab;i ab;'8 'AbjE 'Ab;I 'Abji 'Ap; 'Ab;u\" 'Ab;V" \
"абе абё абє аби абї абь абю абя"

# Languages with non-Latin characters fall back to en when speaking Latin characters. # Languages with non-Latin characters fall back to en when speaking Latin characters.
# TODO: Include words in their native script and move to the main tests above. # TODO: Include words in their native script and move to the main tests above.



Loading…
Cancel
Save