eSpeak NG is an open source speech synthesizer that supports more than hundred languages and accents.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

jp_rules 9.3KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387
  1. // Japanese
  2. //
  3. // Copyright (C) 2017 Reece H. Dunn
  4. //
  5. // This program is free software; you can redistribute it and/or modify
  6. // it under the terms of the GNU General Public License as published by
  7. // the Free Software Foundation; either version 3 of the License, or
  8. // (at your option) any later version.
  9. //
  10. // This program is distributed in the hope that it will be useful,
  11. // but WITHOUT ANY WARRANTY; without even the implied warranty of
  12. // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
  13. // GNU General Public License for more details.
  14. //
  15. // You should have received a copy of the GNU General Public License
  16. // along with this program; if not, see: <http://www.gnu.org/licenses/>.
  17. // Replacements:
  18. // 1. Map Katakana to Hiragana.
  19. // 2. Map voiced characters to their base form and voicing combined character.
  20. .replace
  21. // U+3040 - U+309F Hiragana ----------------------------
  22. が が // ga: U+304C => U+304B U+3099
  23. ぎ ぎ // gi: U+304E => U+304D U+3099
  24. ぐ ぐ // gu: U+3050 => U+304F U+3099
  25. げ げ // ge: U+3052 => U+3051 U+3099
  26. ご ご // go: U+3054 => U+3053 U+3099
  27. ざ ざ // za: U+3056 => U+3055 U+3099
  28. じ じ // ji: U+3058 => U+3057 U+3099
  29. ず ず // zu: U+305A => U+3059 U+3099
  30. ぜ ぜ // ze: U+305C => U+305B U+3099
  31. ぞ ぞ // zo: U+305E => U+305D U+3099
  32. だ だ // da: U+3060 => U+305F U+3099
  33. ぢ ぢ // ji: U+3062 => U+3061 U+3099 (obsolete)
  34. づ づ // zu: U+3065 => U+3064 U+3099
  35. で で // de: U+3067 => U+3066 U+3099
  36. ど ど // do: U+3069 => U+3068 U+3099
  37. ば ば // ba: U+3070 => U+306F U+3099
  38. ぱ ぱ // pa: U+3071 => U+306F U+309A
  39. び び // bi: U+3073 => U+3072 U+3099
  40. ぴ ぴ // pi: U+3074 => U+3072 U+309A
  41. ぶ ぶ // bu: U+3076 => U+3075 U+3099
  42. ぷ ぷ // pu: U+3077 => U+3075 U+309A
  43. べ べ // be: U+3079 => U+3078 U+3099
  44. ぺ ぺ // pe: U+307A => U+3078 U+309A
  45. ぼ ぼ // bo: U+307C => U+307B U+3099
  46. ぽ ぽ // po: U+307D => U+307B U+309A
  47. ゔ ゔ // vu: U+3094 => U+3046 U+3099 (obsolete)
  48. ゟ より // U+309F => U+3088 U+308A (yori digraph)
  49. // U+30A0 - U+30FF Katakana ----------------------------
  50. ァ ぁ // a: U+30A1 => U+3041 (small)
  51. ア あ // a: U+30A2 => U+3042
  52. ィ ぃ // i: U+30A3 => U+3043 (small)
  53. イ い // i: U+30A4 => U+3044
  54. ゥ ぅ // u: U+30A5 => U+3045 (small)
  55. ウ う // u: U+30A6 => U+3046
  56. ェ ぇ // e: U+30A7 => U+3047 (small)
  57. エ え // e: U+30A8 => U+3048
  58. ォ ぉ // o: U+30A9 => U+3049 (small)
  59. オ お // o: U+30AA => U+304A
  60. カ か // ka: U+30AB => U+304B
  61. ガ が // ga: U+30AC => U+304B U+3099
  62. キ き // ki: U+30AD => U+304D
  63. ギ ぎ // gi: U+30AE => U+304D U+3099
  64. ク く // ku: U+30AF => U+304F
  65. グ ぐ // gu: U+30B0 => U+304F U+3099
  66. ケ け // ke: U+30B1 => U+3051
  67. ゲ げ // ge: U+30B2 => U+3051 U+3099
  68. コ こ // ko: U+30B3 => U+3053
  69. ゴ ご // go: U+30B4 => U+3053 U+3099
  70. サ さ // sa: U+30B5 => U+3055
  71. ザ ざ // za: U+30B6 => U+3055 U+3099
  72. シ し // shi: U+30B7 => U+3057
  73. ジ じ // ji: U+30B8 => U+3057 U+3099
  74. ス す // su: U+30B9 => U+3059
  75. ズ ず // zu: U+30BA => U+3059 U+3099
  76. セ せ // se: U+30BB => U+305B
  77. ゼ ぜ // ze: U+30BC => U+305B U+3099
  78. ソ そ // so: U+30BD => U+305D
  79. ゾ ぞ // zo: U+30BE => U+305D U+3099
  80. タ た // ta: U+30BF => U+305F
  81. ダ だ // da: U+30C0 => U+305F U+3099
  82. チ ち // chi: U+30C1 => U+3060
  83. ヂ ぢ // ji: U+30C2 => U+3061 U+3099 (obsolete)
  84. ッ っ // tsu: U+30C3 => U+3063 (small)
  85. ツ つ // tsu: U+30C4 => U+3064
  86. ヅ づ // zu: U+30C5 => U+3064 U+3099
  87. テ て // te: U+30C6 => U+3066
  88. デ で // de: U+30C7 => U+3066 U+3099
  89. ト と // to: U+30C8 => U+3068
  90. ド ど // do: U+30C9 => U+3068 U+3099
  91. ナ な // na: U+30CA => U+306A
  92. ニ に // ni: U+30CB => U+306B
  93. ヌ ぬ // nu: U+30CC => U+306C
  94. ネ ね // ne: U+30CD => U+306D
  95. ノ の // no: U+30CE => U+306E
  96. ハ は // ha: U+30CF => U+306F
  97. バ ば // ba: U+30D0 => U+306F U+3099
  98. パ ぱ // pa: U+30D1 => U+306F U+309A
  99. ヒ ひ // hi: U+30D2 => U+3072
  100. ビ び // bi: U+30D3 => U+3072 U+3099
  101. ピ ぴ // pi: U+30D4 => U+3072 U+309A
  102. フ ふ // fu: U+30D5 => U+3075
  103. ブ ぶ // bu: U+30D6 => U+3075 U+3099
  104. プ ぷ // pu: U+30D7 => U+3075 U+309A
  105. ヘ へ // he: U+30D8 => U+3078
  106. ベ べ // be: U+30D9 => U+3078 U+3099
  107. ペ ぺ // pe: U+30DA => U+3078 U+309A
  108. ホ ほ // ho: U+30DB => U+307B
  109. ボ ぼ // bo: U+30DC => U+307B U+3099
  110. ポ ぽ // po: U+30DD => U+307B U+309A
  111. マ ま // ma: U+30DE => U+307E
  112. ミ み // mi: U+30DF => U+307F
  113. ム む // mu: U+30E0 => U+3080
  114. メ め // me: U+30E1 => U+3081
  115. モ も // mo: U+30E2 => U+3082
  116. ャ ゃ // ya: U+30E3 => U+3083 (small)
  117. ヤ や // ya: U+30E4 => U+3084
  118. ュ ゅ // yu: U+30E5 => U+3085 (small)
  119. ユ ゆ // yu: U+30E6 => U+3086
  120. ョ ょ // yo: U+30E7 => U+3087 (small)
  121. ヨ よ // yo: U+30E8 => U+3088
  122. ラ ら // ra: U+30E9 => U+3089
  123. リ り // ri: U+30EA => U+308A
  124. ル る // ru: U+30EB => U+308B
  125. レ れ // re: U+30EC => U+308C
  126. ロ ろ // ro: U+30ED => U+308D
  127. ヮ ゎ // wa: U+30EE => U+308E (small)
  128. ワ わ // wa: U+30EF => U+308F
  129. ヰ ゐ // wi: U+30F0 => U+3090
  130. ヱ ゑ // we: U+30F1 => U+3091
  131. ヲ を // wo: U+30F2 => U+3092
  132. ン ん // n: U+30F3 => U+3093
  133. ヴ ゔ // vu: U+30F4 => U+3046 U+3099 (obsolete)
  134. ヵ ゕ // ka: U+30F5 => U+3095 (small)
  135. ヶ ゖ // ke: U+30F6 => U+3096 (small)
  136. ヽ ゝ // U+30FD => U+309D (iteration mark)
  137. ヾ ゞ // U+30FE => U+309E (voiced iteration mark)
  138. ヿ こと // U+30FF => U+3053 U+3068 (koto digraph)
  139. // U+1B000 - U+1B001 Kana Supplement ---------------------
  140. 𛀀 え // e: U+1B000 => U+3048 (archaic)
  141. // Hiragana
  142. .L01 か き く け こ // k
  143. .L02 が ぎ ぐ げ ご // g
  144. .L03 さ す せ そ // s
  145. .L04 し // sh
  146. .L05 ざ ず ぜ ぞ づ // z
  147. .L06 じ ぢ // j
  148. .L07 た て と // t
  149. .L08 ち // ch
  150. .L09 つ // ts
  151. .L10 だ で ど // d
  152. .L11 な に ぬ ね の // n
  153. .L12 は ひ へ ほ // h
  154. .L13 ふ // f
  155. .L14 ば び ぶ べ ぼ // b
  156. .L15 ぱ ぴ ぷ ぺ ぽ // p
  157. .L16 ま み む め も // m
  158. .L17 や ゆ よ // y
  159. .L18 ら り る れ ろ // r
  160. .L19 わ ゐ ゑ を // w
  161. .L20 あ い う え お // vowel
  162. .L21 ゃ ゅ ょ // combining vowels for i Hiragana
  163. .group ゃ
  164. ゃ a_" // ya
  165. .group ゅ
  166. ゅ M_Bo // yu
  167. .group ょ
  168. ょ o_o // yo
  169. .group あ
  170. あ a_" // a
  171. .group い
  172. い i // i
  173. .group う
  174. う M_Bo // u
  175. ゔ vM_Bo // vu
  176. .group え
  177. え e_o // e
  178. .group お
  179. お o_o // o
  180. .group か
  181. か ka_" // ka
  182. が ga_" // ga
  183. .group き
  184. き ki // ki
  185. き (L21 k_j // ky([auo]
  186. ぎ gi // gi
  187. ぎ (L21 g_j // gy([auo]
  188. .group く
  189. く kM_Bo // ku
  190. ぐ gM_Bo // gu
  191. .group け
  192. け ke_o // ke
  193. げ ge_o // ge
  194. .group こ
  195. こ ko_o // ko
  196. ご go_o // go
  197. .group さ
  198. さ sa_" // sa
  199. ざ za_" // za
  200. .group し
  201. し s\\i // shi
  202. し (L21 s\\ // sh([auo]
  203. じ d_z\\i // ji
  204. じ (L21 d_z\\ // j([auo]
  205. .group す
  206. す sM_Bo // su
  207. ず zM_Bo // zu
  208. .group せ
  209. せ se_o // se
  210. ぜ ze_o // ze
  211. .group そ
  212. そ so_o // so
  213. ぞ zo_o // zo
  214. .group た
  215. た ta_" // ta
  216. だ da_" // da
  217. .group ち
  218. ち t_s\\i // chi
  219. ち (L21 t_s\\ // ch([auo]
  220. ぢ d_z\\i // ji (obsolete)
  221. ぢ (L21 d_z\\ // j([auo] (obsolete)
  222. .group つ
  223. つ t_sM_Bo // tsu
  224. づ zM_Bo // zu
  225. .group て
  226. て te_o // te
  227. で de_o // de
  228. .group と
  229. と to_o // to
  230. ど do_o // do
  231. .group な
  232. な na_" // na
  233. .group に
  234. に ni // ni
  235. に (L21 n_j // ny([auo]
  236. .group ぬ
  237. ぬ nM_Bo // nu
  238. .group ね
  239. ね ne_o // ne
  240. .group の
  241. の no_o // no
  242. .group は
  243. は ha_" // ha
  244. ば ba_" // ba
  245. ぱ pa_" // pa
  246. .group ひ
  247. ひ Ci // hi
  248. ひ (L21 C // hy([auo]
  249. び bi // bi
  250. び (L21 b_j // by([auo]
  251. ぴ pi // pi
  252. ぴ (L21 p_j // py([auo]
  253. .group ふ
  254. ふ p\\M_Bo // fu
  255. ぶ bM_Bo // bu
  256. ぷ pM_Bo // pu
  257. .group へ
  258. へ he_o // he
  259. べ be_o // be
  260. ぺ pe_o // pe
  261. .group ほ
  262. ほ ho_o // ho
  263. ぼ bo_o // bo
  264. ぽ po_o // po
  265. .group ま
  266. ま ma_" // ma
  267. .group み
  268. み mi // mi
  269. み (L21 m_j // my([auo]
  270. .group む
  271. む mM_Bo // mu
  272. .group め
  273. め me_o // me
  274. .group も
  275. も mo_o // mo
  276. .group や
  277. や ja_" // ya
  278. .group ゆ
  279. ゆ jM_Bo // yu
  280. .group 𛀁
  281. 𛀁 je_o // ye (archaic)
  282. .group よ
  283. よ jo_o // yo
  284. .group ら
  285. ら r`a_" // ra
  286. .group り
  287. り r`i // ri
  288. り (L21 r`_ja_" // ry([auo]
  289. .group る
  290. る rM_Bo // ru
  291. .group れ
  292. れ re_o // re
  293. .group ろ
  294. ろ ro_o // ro
  295. .group わ
  296. わ wa_" // wa
  297. .group ゐ
  298. ゐ i // wi (obsolete)
  299. .group ゑ
  300. ゑ we_o // we (obsolete)
  301. .group を
  302. を o_o // wo
  303. .group ん
  304. ん N\\ // n
  305. ん (L01 N // n (k
  306. ん (L02 N // n (g
  307. ん (L03 u~ // n (s
  308. い) ん (L03 i~ // i) n (s
  309. ん (L04 u~ // n (sh
  310. い) ん (L04 i~ // i) n (sh
  311. ん (L05 n // n (z
  312. ん (L06 n // n (j
  313. ん (L07 n // n (t
  314. ん (L08 n // n (ch
  315. ん (L09 n // n (ts
  316. ん (L10 n // n (d
  317. ん (L11 n // n (n
  318. ん (L12 u~ // n (h
  319. い) ん (L12 i~ // i) n (h
  320. ん (L13 u~ // n (f
  321. い) ん (L13 i~ // i) n (f
  322. ん (L14 m // n (b
  323. ん (L15 m // n (p
  324. ん (L16 m // n (m
  325. ん (L17 u~ // n (y
  326. い) ん (L17 i~ // i) n (y
  327. ん (L18 n // n (r
  328. ん (L19 u~ // n (w
  329. い) ん (L19 i~ // i) n (w
  330. ん (L20 u~ // n ([vowel]
  331. い) ん (L20 i~ // i) n ([vowel]