| 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578 | 
							- // *   Arabic Language ar ar_rules
 - // *   This file writen by Taha Zerrouki 2012
 - // ***************************************************************************
 - // *   This program is free software; you can redistribute it and/or modify  *
 - // *   it under the terms of the GNU General Public License as published by  *
 - // *   the Free Software Foundation; either version 3 of the License, or     *
 - // *   (at your option) any later version.                                   *
 - // *                                                                         *
 - // *   This program is distributed in the hope that it will be useful,       *
 - // *   but WITHOUT ANY WARRANTY; without even the implied warranty of        *
 - // *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the         *
 - // *   GNU General Public License for more details.                          *
 - // *                                                                         *
 - // *   You should have received a copy of the GNU General Public License     *
 - // *   along with this program; if not, see:                                 *
 - // *               <http://www.gnu.org/licenses/>.                           *
 - // ***************************************************************************/
 - //
 - // This file is UTF-8 encoded
 - // all words must be LOWER CASE  (although the initial letter will be automatically
 - // converted if it's a 7bit ascii character)
 - // Text to phoneme rules for Arabic
 - //
 - // replace Arabic  eastern  character numbers with Arabic western character numbers
 - .replace
 -      ٠       0
 -      ۰       0
 -      ۱       1
 -      ١       1
 -      ٢       2
 -      ۲       2
 -      ٣       3
 -      ۳       3
 -      ٤       4
 -      ۴       4
 -      ٥       5
 -      ۵       5
 -      ٦       6
 -      ۶       6
 -      ٧       7
 -      ۷       7
 -      ٨       8
 -      ۸       8
 -      ٩       9
 -      ۹       9
 -      ،       ,
 -      ؛       ;
 - 
 - // Multicharacters into single characters
 - 
 -       ٰٔ       أ   // Superscript alef with Hamza above > Alef with hamza above
 - 
 - // Reorder diacritics in "canonical order"
 - 
 -       َّ        َّ   // Fatha Shadda > Shadda Fatha
 -       ِّ        ِّ   // Kasra Shadda > Shadda Kasra
 -       ّْ        ّْ   // Sukun Shadda > Shadda Sukun
 - 
 - // Specific glyphs into standard symbols
 -       ٔ       ء   // Hamza above > Hamza
 -       ٕ       ء   // Hamza below > Hamza
 - 
 - // Named letter groups:
 - // list of short vowels
 - // A:  َ  ُ  ِ
 - // list of consonants
 - // C: ب پ ت ة ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ئ ؤ ء أ آ إ ه
 - // Consonant/vowel letters
 - // B: ا و ي
 - // "Thick" letters
 - // F: ص ض ط ظ
 - // Shadda
 - // G:  ّ
 - // Hamza
 - // H: ء
 - // Sukun
 - // Y:  ْ
 - 
 - // all vowels/diphthongs in vocalized text
 - // (fatha, damma, kasra, fatha+alef, fatha+alef_maksura, damma+waw, kasra+yeh, yeh+fatha, waw+fatha, superscript alef)
 - .L01  َ  ُ  ِ  َا  َى  ُو  ِي يَ وَ  ٰ
 - 
 - // Long vowels and diphthongs in vocalized text
 - // (fatha+alef, fatha+alef_maksura, damma+waw, kasra+yeh, yeh+fatha, waw+fatha, superscript alef)
 - .L03  َا  َى  ُو  ِي يَ وَ  ٰ
 - 
 - // Implicit long vowels in UNvocalized text (alef, alef maksura, waw, yeh)
 - .L04 ا ى و ي
 - 
 - // all Arabic characters without short vowels and A
 - .L05  ض ص ث ق ف غ ع ه خ ح ج  ش س ي ب ل ت ن م ك  ظ ط ز ر ذ د ئ و ة ي  ؤ إ أ ء  پ گ
 - 
 - // group of digits
 - .L06 0 1 2 3 4 5 6 7 8 9
 - 
 - // all Arabic characters
 - .L09  ض ص ث ق ف غ ع ه خ ح ج  ً ٌ ٍ ، ؛ ش س ي ب ل ا ت ن م ك  َ ُ ِ ّ  آ ـ « » ظ ط ز ر ذ د ئ و ة ي ژ ؤ إ أ ء ؟ پ گ
 - 
 - // Arabic Sun characters
 - .L10  ض ص ث ش س ل ت ن ظ ط ز ر ذ د
 - 
 - // Arabic Moon characters
 - .L11  ق ف غ ع ه خ ح ج ي ب م ك  و  إ أ ء
 - 
 - // Arabic diacritics
 - .L20  ۡ ـ  ً  ٌ  ٍ  َ  ُ  ِ  ّ  ْ
 - 
 - // Non-thick consonants
 - .L30 ب پ ت ة ث ج ح خ د ذ ر ز س ش ع غ ف ك ل م ن ئ ؤ ء أ آ إ ه
 - 
 - .group آ
 -          آ           ?a:
 - 
 - .group ا
 -          ا           a:
 -     L30) ا           a:
 -       F) ا           a.:
 -      FG) ا           a.:
 -     L30) ا (C        a:
 -       F) ا (C        a.:
 -      FG) ا (C        a.:
 -          ا (َ         ?
 -          ا (ُ         ?
 -          ا (ِ         ?
 -       _) ال (P2      %al
 -       _) ا           a       // make the previous fatha long
 -          اء          ?       // Carried Hamza
 -       _) ال (L10P2   ?a      //الشمس
 -       _) ال (L11P2   ?al     //القمر
 -       _) ال (تP2     ?at
 -       _) ال (ثP2     ?aT
 -       _) ال (دP2     ?ad
 -       _) ال (ذP2     ?aD
 -       _) ال (رP2     ?ar
 -       _) ال (زP2     ?az
 -       _) ال (سP2     ?as
 -       _) ال (شّP2     ?a
 -       _) ال (شP2     ?aS
 -       _) ال (صP2     ?as[
 -       _) ال (ضP2     ?adH
 -       _) ال (ظP2     ?aZ
 -       _) ال (لP2     ?al
 -       _) ال (نP2     ?an
 -      _ب) ا (ل        i
 - 
 - .group أ
 -          أ           ?        // Carried Hamza
 - 
 - .group إ
 -          إ           ?        // Carried Hamza
 - 
 - .group ب
 -          ب           b
 -          ب (_        b
 -          بّ           b:
 -          بّْ           b:
 -          بْ           b
 -       _) ب           b%
 -       _) بال (L10P3  bi        //بالشمس
 -       _) بال (L11P3  bil       //بالقمر
 -       _) بال (تP3    bit
 -       _) بال (ثP3    biT
 -       _) بال (دP3    bid
 -       _) بال (ذP3    biD
 -       _) بال (رP3    bir
 -       _) بال (زP3    biz
 -       _) بال (سP3    bis
 -       _) بال (شP3    biS
 -       _) بال (صP3    bis[
 -       _) بال (ضP3    bidH
 -       _) بال (طP3    bit[
 -       _) بال (ظP3    biZ
 -       _) بال (لP3    bil
 -       _) بال (نP3    bin
 - 
 - .group پ
 -          پ           p
 -          پ (_        p
 -          پّْ           p:
 -          پْ           p
 - 
 - .group ت
 -          ت           t
 -       _) ت (َP1       t
 -          ت (_        t
 -          تّ           t:
 -          تّْ           t:
 -          تْ           t
 - 
 - .group ث
 -          ث           T
 -          ث (_        T
 -          ثّ           T:
 -          ثّْ           T:
 -          ثْ           T
 - 
 - .group ج
 -          ج           dZ
 -          ج (_        dZ
 -          جّ           dZ:
 -          جّْ           dZ:
 -          جْ           dZ
 - 
 - .group ح
 -          ح           H
 -          ح (_        H
 -          حّ           H:
 -          حّْ           H:
 -          حْ           H
 - 
 - .group خ
 -          خ           X
 -          خ (_        X
 -          خّ           X:
 -          خّْ           X:
 -          خْ           X
 - 
 - .group د
 -          د           d
 -          د (_        d
 -          دّ           d:
 -          دّْ           d:
 -          دْ           d
 - 
 - .group ذ
 -          ذ           D
 -          ذ (_        D
 -          ذّ           D:
 -          ذّْ           D:
 -          ذْ           D
 - 
 - .group ر
 -          ر           r
 -          ر (_        r
 -          رّ           r:
 -          رّْ           r:
 -          رْ           r
 - 
 - .group ز
 -          ز           z
 -          ز (_        z
 -          زّ           z:
 -          زّْ           z:
 -          زْ           z
 - 
 - .group س
 -          س           s
 -       _) س           s%
 -          س (_        s
 -          سّ           s:
 -          سّْ           s:
 -          سْ           s
 - 
 - .group ش
 -          ش           S
 -          ش (_        S
 -          شّ           S:
 -          شّْ           S:
 -          شْ           S
 - 
 - .group ص
 -          ص           s[
 -          ص (_        s[
 -          صّ           s[:
 -          صّْ           s[:
 -          صْ           s[
 - 
 - .group ض
 -          ض           dH
 -          ض (_        dH
 -          ضّ           dH:
 -          ضّْ           dH:
 -          ضْ           dH
 - 
 - .group ط
 -          ط           t[
 -          ط (_        t[
 -          طّ           t[:
 -          طّْ           t[:
 -          طْ           t[
 - 
 - .group ظ
 -          ظ           Z
 -          ظ (_        Z
 -          ظّ           Z:
 -          ظّْ           Z:
 -          ظْ           Z
 - 
 - .group ع
 -          ع           A
 -          ع (_        A
 -          عّ           A:
 -          عّْ           A:
 -          عْ           A
 - 
 - .group غ
 -          غ           gH
 -          غ (_        gH
 -          غّ           gH:
 -          غّْ           gH:
 -          غْ           gH
 - 
 - .group ف
 -          ف           f
 -          ف (_        f
 -          فّ           f:
 -          فّْ           f:
 -          فْ           f
 -       _) ف           f%
 -       _) فال (L10P3  fa        //فالشمس
 -       _) فَال (L10P4  fa
 -       _) فَالْ (L10P4  fa
 -       _) فال (L11P3  fal       //فالقمر
 -       _) فَال (L11P4  fa
 -       _) فَالْ (L11P4  fal
 -       _) فال (تP3    fat
 -       _) فال (ثP3    faT
 -       _) فال (دP3    fad
 -       _) فال (ذP3    faD
 -       _) فال (رP3    far
 -       _) فال (زP3    faz
 -       _) فال (سP3    fas
 -       _) فال (شP3    faS
 -       _) فال (صP3    fas[
 -       _) فال (ضP3    fadH
 -       _) فال (طP3    fat[
 -       _) فال (ظP3    faZ
 -       _) فال (لP3    fal
 -       _) فال (نP3    fan
 - 
 - .group ق
 -          ق           q
 -          ق (_        q
 -          قّ           q:
 -          قّْ           q:
 -          قْ           q
 - 
 - .group ك
 -          ك           k
 -          ك   (_      k
 -          كّ           k:
 -          كّْ           k:
 -          كْ           k
 -          ك   (_S1    ka        // الضمير المتصل
 -       _) ك           k%
 -       _) كال (L10P3  ka        //كالشمس
 -       _) كَال (L10P4  ka
 -       _) كَالْ (L10P4  ka
 -       _) كال (L11P3  kal       //كالقمر
 -       _) كَالْ (L11P4  kal
 -       _) كال (تP3    kat
 -       _) كال (ثP3    kaT
 -       _) كال (دP3    kad
 -       _) كال (ذP3    kaD
 -       _) كال (رP3    kar
 -       _) كال (زP3    kaz
 -       _) كال (سP3    kas
 -       _) كال (شP3    kaS
 -       _) كال (صP3    kas[
 -       _) كال (ضP3    kadH
 -       _) كال (طP3    kat[
 -       _) كال (ظP3    kaZ
 -       _) كال (لP3    kal
 -       _) كال (نP3    kan
 -          كما (_S3    k'uma:     //الضمير المتصل
 -          كن  (_S2    k'un:a     //الضمير المتصل
 - 
 - .group گ
 -          گ           g
 -          گ (_        g
 -          گّ           g:
 -          گّْ           g:
 -          گْ           g
 - 
 - .group ل
 -          ل           l
 -       _) ل           l%
 -      _ا) ل (L10      '         // Sun letters
 -     _بِا) ل (L10      '         // Sun letters
 -     _فَا) ل (L10      '         // Sun letters
 -     _كَا) ل (L10      '         // Sun letters
 -          ل (_        l
 -          لّ           l:
 -          لّْ           l:
 -          لْ           l
 -      _لِ) ل (L10      '         // Sun letters
 -     _وَا) ل (L10      '         // Sun letters
 - 
 - .group م
 -          م           m
 -          م (_        m
 -          مّ           m:
 -          مّْ           m:
 -          مْ           m
 - 
 - .group ن
 -          ن           n
 -          ن (_        n
 -          نّ           n:
 -          نّْ           n:
 -          نْ           n
 -          ن (ب        m
 -          نْ (ب        m
 - 
 - .group ه
 -          ه           h
 -          ه (_        h
 -          هّ           h:
 -          هّْ           h:
 -          هْ           h
 -          ه (_S1      h         // الضمير المتصل
 -          ها (_S2     ha:       //الضمير المتصل
 -          هم (_S2     hum       //الضمير المتصل
 -          هما (_S3    h'uma:     //الضمير المتصل
 -          هن (_S2     h'un:a     //الضمير المتصل
 - 
 - .group و
 -          و           w
 -     L30) و           u:
 -       F) و           u.:
 -      FG) و           u.:
 -       ا) و           w         //واو بعد الألف
 -          و (A        w         //واو بعدها حرف علة
 -          و (_        w
 -          وّ           w:
 -          وّْ           w
 -          وْ           w
 -        ْ) و           w         // واو بعد سكون
 -        َ) و           w         //واو بعد فتحة
 -       _) و           w%
 -       _) و           w         //واو في أول الكلمة
 -          وء          ?         // Carried Hamza
 -          وا (_S2     u
 -          وا (_S2     u:        // فعل مع ضمائر الجمع المذكرة درسوا
 -       _) وال (L10P3  wa        //والشمس
 -       _) وَال (L10P4  wa
 -       _) وَالْ (L10P4  wa
 -       _) وال (L11P3  wal       //والقمر
 -       _) وَال (L11P4  wal
 -       _) وَالْ (L11P4  wal
 -       _) وال (تP3    wat
 -       _) وال (ثP3    waT
 -       _) وال (دP3    wad
 -       _) وال (ذP3    waD
 -       _) وال (رP3    war
 -       _) وال (زP3    waz
 -       _) وال (سP3    was
 -       _) وال (شP3    waS
 -       _) وال (صP3    was[
 -       _) وال (ضP3    wadH
 -       _) وال (طP3    wat[
 -       _) وال (ظP3    waZ
 -       _) وال (لP3    wal
 -       _) وال (نP3    wan
 -          ون (_S2     'u:na     //جمع مذكر سالم فلاحون
 - 
 - .group ي
 -          ي           i
 -     L30) ي           i:
 -       F) ي           i.:
 -      FG) ي           i.:
 -       ا) ي           j         // ياء بعد ألف
 -          يّ           i:
 -          يْ           j
 -          يِ           ji:
 -        ْ) ي           j         //ياء بعد سكون
 -        َ) ي           j         // ياء بعد فتحة
 -       _) ي           j         // ياء في أول الكلمة
 -          ي (L01      j         //يا بعدها حروف علة
 -          ي (_S1      i
 -          يء          ?         // Carried Hamza
 -          يات (_S3    'ij:a:t   //يّة النسبة في جمع المؤنث جزائريات
 -          ية (_S2     'ij:ah    //يّة النسبة
 -          ين (_S2     'i:na     //جمع مذكر سالم منصوب أو مجرور
 -          يون (_S3    'ij:u:n   //kجمع مذكر سالم منسوب جزائريون
 -          يين (_S3    'ij:i:n   //kجمع مذكر سالم منسوب جزائريين
 - 
 - .group ى                      //ألف مقصورة
 -          ى           a
 -     L30) ى (_        a:
 -       F) ى (_        a.:
 -      FG) ى (_        a.:
 -          ىّ           a:
 -          ىْ           a
 - 
 - .group ء
 -          ء           ?
 -          ء (ً         ?an
 - 
 - .group ئ
 -          ئ           ?         // Carried Hamza
 - 
 - .group ؤ
 -          ؤ           ?         // Carried Hamza
 - 
 - .group ة
 -          ة           t
 -          ة (_        t
 -          ةّ           t:
 -          ةْ           t
 -          ةً           tan
 - 
 - // Other diacritics
 - .group
 -           َ           a   // fatha
 -       F)  َ           a.  // fatha after thick consonant
 -      FG)  َ           a.  // fatha after thick consonant and shadda
 -           َ (C_       =a  // fatha in closed syllable
 -       F)  َ (C_       =a.
 -      FG)  َ (C_       =a.
 -           َ (CC_      =a
 -       F)  َ (CC_      =a.
 -      FG)  َ (CC_      =a.
 -       C)  ٓ           ?   // madda after consonant
 -           ِ           i   // kasra
 -       F)  ِ           i.  // kasra after thick consonant
 -      FG)  ِ           i.  // kasra after thick consonant and shadda
 -           ِ (C_       =i  // kasra in closed syllable
 -       F)  ِ (C_       =i.
 -      FG)  ِ (C_       =i.
 -           ِ (CC_      =i
 -       F)  ِ (CC_      =i.
 -      FG)  ِ (CC_      =i.
 -           ٍ (_S1      in  // kasratan at the end of word
 -           ٌ (_S1      un  // dammatan at the end of word
 -           ُ           u   // damma
 -       F)  ُ           u.  // damma after thick consonant
 -      FG)  ُ           u.  // damma after thick consonant and shadda
 -           ُ (C_       =u  // damma in closed syllable
 -       F)  ُ (C_       =u.
 -      FG)  ُ (C_       =u.
 -           ُ (CC_      =u
 -       F)  ُ (CC_      =u.
 -      FG)  ُ (CC_      =u.
 -           ٰ           a:  // superscript alef
 -       F)  ٰ           a.: // superscript alef after thick consonant
 -      FG)  ٰ           a.: // superscript alef after thick consonant and shadda
 -           َا          a:  // fatha+alef
 -       F)  َا          a.: // fatha+alef after thick consonant
 -      FG)  َا          a.: // fatha+alef after thick consonant and shadda
 -           ًا (_S2     an  // fathatan+alef at the end of word
 -       F)  ًا (_S2     a.n // fathatan+alef at the end of word after thick consonant
 -           َو          au  // fatha+waw
 -       F)  َو          a.u. // fatha+waw after thick consonant
 -      FG)  َو          a.u. // fatha+waw after thick consonant and shadda
 -           ِو          iw  // kasra+waw
 -       F)  ِو          i.w // kasra+waw after thick consonant
 -      FG)  ِو          i.w // kasra+waw after thick consonant and shadda
 -           ُو          u:  // damma+waw
 -       F)  ُو          u.: // damma+waw after thick consonant
 -      FG)  ُو          u.: // damma+waw after thick consonant and shadda
 -           َى          a:  // fatha+alef maksura
 -       F)  َى          a.: // fatha+alef maksura after thick consonant
 -      FG)  َى          a.: // fatha+alef maksura after thick consonant and shadda
 -           َي          ai  // fatha+yeh
 -       F)  َي          a.i. // fatha+yeh after thick consonant
 -      FG)  َي          a.i. // fatha+yeh after thick consonant and shadda
 -           ِي          i:  // kasra+yeh
 -       F)  ِي          i.: // kasra+yeh after thick consonant
 -      FG)  ِي          i.: // kasra+yeh after thick consonant and shadda
 -           ُي          ui  // damma+yeh
 -       F)  ُي          u.i. // damma+yeh after thick consonant
 -      FG)  ُي          u.i. // damma+yeh after thick consonant and shadda
 -           ّ           :   // shadda
 - 
 - // Following are default rules for other diacritics and they are just silence.
 - // Diacritics should be consumed together with leading letters in rules above.
 - 
 -          ٱ  // alef wasla
 -           ٌ  // dammatan
 -           ً  // fathatan
 -           ٍ  // kasratan
 -          ـ  // tatweel
 -           ۡ  // small high dotless head of khan
 -           ْ  // sukun
 - 
 - // non-ascii characters with specified pronunciations
 - // List the accented characters in en_list with the $accent attribute
 
 
  |