eSpeak NG is an open source speech synthesizer that supports more than hundred languages and accents.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

jp_rules 12KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461
  1. // Japanese
  2. //
  3. // Copyright (C) 2017 Reece H. Dunn
  4. //
  5. // This program is free software; you can redistribute it and/or modify
  6. // it under the terms of the GNU General Public License as published by
  7. // the Free Software Foundation; either version 3 of the License, or
  8. // (at your option) any later version.
  9. //
  10. // This program is distributed in the hope that it will be useful,
  11. // but WITHOUT ANY WARRANTY; without even the implied warranty of
  12. // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
  13. // GNU General Public License for more details.
  14. //
  15. // You should have received a copy of the GNU General Public License
  16. // along with this program; if not, see: <http://www.gnu.org/licenses/>.
  17. // Replacements:
  18. // 1. Map Katakana to Hiragana.
  19. // 2. Map voiced characters to their base form and voicing combined character.
  20. .replace
  21. // U+3040 - U+309F Hiragana ----------------------------
  22. が が // ga: U+304C => U+304B U+3099
  23. ぎ ぎ // gi: U+304E => U+304D U+3099
  24. ぐ ぐ // gu: U+3050 => U+304F U+3099
  25. げ げ // ge: U+3052 => U+3051 U+3099
  26. ご ご // go: U+3054 => U+3053 U+3099
  27. ざ ざ // za: U+3056 => U+3055 U+3099
  28. じ じ // ji: U+3058 => U+3057 U+3099
  29. ず ず // zu: U+305A => U+3059 U+3099
  30. ぜ ぜ // ze: U+305C => U+305B U+3099
  31. ぞ ぞ // zo: U+305E => U+305D U+3099
  32. だ だ // da: U+3060 => U+305F U+3099
  33. ぢ ぢ // ji: U+3062 => U+3061 U+3099 (obsolete)
  34. づ づ // zu: U+3065 => U+3064 U+3099
  35. で で // de: U+3067 => U+3066 U+3099
  36. ど ど // do: U+3069 => U+3068 U+3099
  37. ば ば // ba: U+3070 => U+306F U+3099
  38. ぱ ぱ // pa: U+3071 => U+306F U+309A
  39. び び // bi: U+3073 => U+3072 U+3099
  40. ぴ ぴ // pi: U+3074 => U+3072 U+309A
  41. ぶ ぶ // bu: U+3076 => U+3075 U+3099
  42. ぷ ぷ // pu: U+3077 => U+3075 U+309A
  43. べ べ // be: U+3079 => U+3078 U+3099
  44. ぺ ぺ // pe: U+307A => U+3078 U+309A
  45. ぼ ぼ // bo: U+307C => U+307B U+3099
  46. ぽ ぽ // po: U+307D => U+307B U+309A
  47. ゔ ゔ // vu: U+3094 => U+3046 U+3099 (obsolete)
  48. ゛ ゙ // U+309B => U+3099
  49. ゜ ゚ // U+309C => U+309A
  50. ゟ より // U+309F => U+3088 U+308A (yori digraph)
  51. // U+30A0 - U+30FF Katakana ----------------------------
  52. ァ ぁ // a: U+30A1 => U+3041 (small)
  53. ア あ // a: U+30A2 => U+3042
  54. ィ ぃ // i: U+30A3 => U+3043 (small)
  55. イ い // i: U+30A4 => U+3044
  56. ゥ ぅ // u: U+30A5 => U+3045 (small)
  57. ウ う // u: U+30A6 => U+3046
  58. ェ ぇ // e: U+30A7 => U+3047 (small)
  59. エ え // e: U+30A8 => U+3048
  60. ォ ぉ // o: U+30A9 => U+3049 (small)
  61. オ お // o: U+30AA => U+304A
  62. カ か // ka: U+30AB => U+304B
  63. ガ が // ga: U+30AC => U+304B U+3099
  64. キ き // ki: U+30AD => U+304D
  65. ギ ぎ // gi: U+30AE => U+304D U+3099
  66. ク く // ku: U+30AF => U+304F
  67. グ ぐ // gu: U+30B0 => U+304F U+3099
  68. ケ け // ke: U+30B1 => U+3051
  69. ゲ げ // ge: U+30B2 => U+3051 U+3099
  70. コ こ // ko: U+30B3 => U+3053
  71. ゴ ご // go: U+30B4 => U+3053 U+3099
  72. サ さ // sa: U+30B5 => U+3055
  73. ザ ざ // za: U+30B6 => U+3055 U+3099
  74. シ し // shi: U+30B7 => U+3057
  75. ジ じ // ji: U+30B8 => U+3057 U+3099
  76. ス す // su: U+30B9 => U+3059
  77. ズ ず // zu: U+30BA => U+3059 U+3099
  78. セ せ // se: U+30BB => U+305B
  79. ゼ ぜ // ze: U+30BC => U+305B U+3099
  80. ソ そ // so: U+30BD => U+305D
  81. ゾ ぞ // zo: U+30BE => U+305D U+3099
  82. タ た // ta: U+30BF => U+305F
  83. ダ だ // da: U+30C0 => U+305F U+3099
  84. チ ち // chi: U+30C1 => U+3061
  85. ヂ ぢ // ji: U+30C2 => U+3061 U+3099 (obsolete)
  86. ッ っ // tsu: U+30C3 => U+3063 (small)
  87. ツ つ // tsu: U+30C4 => U+3064
  88. ヅ づ // zu: U+30C5 => U+3064 U+3099
  89. テ て // te: U+30C6 => U+3066
  90. デ で // de: U+30C7 => U+3066 U+3099
  91. ト と // to: U+30C8 => U+3068
  92. ド ど // do: U+30C9 => U+3068 U+3099
  93. ナ な // na: U+30CA => U+306A
  94. ニ に // ni: U+30CB => U+306B
  95. ヌ ぬ // nu: U+30CC => U+306C
  96. ネ ね // ne: U+30CD => U+306D
  97. ノ の // no: U+30CE => U+306E
  98. ハ は // ha: U+30CF => U+306F
  99. バ ば // ba: U+30D0 => U+306F U+3099
  100. パ ぱ // pa: U+30D1 => U+306F U+309A
  101. ヒ ひ // hi: U+30D2 => U+3072
  102. ビ び // bi: U+30D3 => U+3072 U+3099
  103. ピ ぴ // pi: U+30D4 => U+3072 U+309A
  104. フ ふ // fu: U+30D5 => U+3075
  105. ブ ぶ // bu: U+30D6 => U+3075 U+3099
  106. プ ぷ // pu: U+30D7 => U+3075 U+309A
  107. ヘ へ // he: U+30D8 => U+3078
  108. ベ べ // be: U+30D9 => U+3078 U+3099
  109. ペ ぺ // pe: U+30DA => U+3078 U+309A
  110. ホ ほ // ho: U+30DB => U+307B
  111. ボ ぼ // bo: U+30DC => U+307B U+3099
  112. ポ ぽ // po: U+30DD => U+307B U+309A
  113. マ ま // ma: U+30DE => U+307E
  114. ミ み // mi: U+30DF => U+307F
  115. ム む // mu: U+30E0 => U+3080
  116. メ め // me: U+30E1 => U+3081
  117. モ も // mo: U+30E2 => U+3082
  118. ャ ゃ // ya: U+30E3 => U+3083 (small)
  119. ヤ や // ya: U+30E4 => U+3084
  120. ュ ゅ // yu: U+30E5 => U+3085 (small)
  121. ユ ゆ // yu: U+30E6 => U+3086
  122. ョ ょ // yo: U+30E7 => U+3087 (small)
  123. ヨ よ // yo: U+30E8 => U+3088
  124. ラ ら // ra: U+30E9 => U+3089
  125. リ り // ri: U+30EA => U+308A
  126. ル る // ru: U+30EB => U+308B
  127. レ れ // re: U+30EC => U+308C
  128. ロ ろ // ro: U+30ED => U+308D
  129. ヮ ゎ // wa: U+30EE => U+308E (small)
  130. ワ わ // wa: U+30EF => U+308F
  131. ヰ ゐ // wi: U+30F0 => U+3090
  132. ヱ ゑ // we: U+30F1 => U+3091
  133. ヲ を // wo: U+30F2 => U+3092
  134. ン ん // n: U+30F3 => U+3093
  135. ヴ ゔ // vu: U+30F4 => U+3046 U+3099 (obsolete)
  136. ヵ ゕ // ka: U+30F5 => U+3095 (small)
  137. ヶ ゖ // ke: U+30F6 => U+3096 (small)
  138. ヷ あ゙ // va: U+30F7 => U+3042 U+3099
  139. ヸ い゙ // vi: U+30F8 => U+3044 U+3099
  140. ヹ え゙ // ve: U+30F9 => U+3048 U+3099
  141. ヺ お゙ // vo: U+30FA => U+304A U+3099
  142. ヽ ゝ // U+30FD => U+309D (iteration mark)
  143. ヾ ゞ // U+30FE => U+309E (voiced iteration mark)
  144. ヿ こと // U+30FF => U+3053 U+3068 (koto digraph)
  145. // U+FF65 - U+FF9F Halfwidth Katakana
  146. ヲ を // wo: U+FF66 => U+3092
  147. ァ ぁ // a: U+FF67 => U+3041 (small)
  148. ィ ぃ // i: U+FF68 => U+3043 (small)
  149. ゥ ぅ // u: U+FF69 => U+3045 (small)
  150. ェ ぇ // e: U+FF6A => U+3047 (small)
  151. ォ ぉ // o: U+FF6B => U+3049 (small)
  152. ャ ゃ // ya: U+FF6C => U+3083 (small)
  153. ュ ゅ // yu: U+FF6D => U+3085 (small)
  154. ョ ょ // yo: U+FF6E => U+3087 (small)
  155. ッ っ // tsu: U+FF6F => U+3063 (small)
  156. ー ー // U+FF70 => U+30FC
  157. ア あ // a: U+FF71 => U+3042
  158. イ い // i: U+FF72 => U+3044
  159. ウ う // u: U+FF73 => U+3046
  160. エ え // e: U+FF74 => U+3048
  161. オ お // o: U+FF75 => U+304A
  162. カ か // ka: U+FF76 => U+304B
  163. キ き // ki: U+FF77 => U+304D
  164. ク く // ku: U+FF78 => U+304F
  165. ケ け // ke: U+FF79 => U+3051
  166. コ こ // ko: U+FF7A => U+3053
  167. サ さ // sa: U+FF7B => U+3055
  168. シ し // shi: U+FF7C => U+3057
  169. ス す // su: U+FF7D => U+3059
  170. セ せ // se: U+FF7E => U+305B
  171. ソ そ // so: U+FF7F => U+305D
  172. タ た // ta: U+FF80 => U+305F
  173. チ ち // chi: U+FF81 => U+3061
  174. ツ つ // tsu: U+FF82 => U+3064
  175. テ て // te: U+FF83 => U+3066
  176. ト と // to: U+FF84 => U+3068
  177. ナ な // na: U+FF85 => U+306A
  178. ニ に // ni: U+FF86 => U+306B
  179. ヌ ぬ // nu: U+FF87 => U+306C
  180. ネ ね // ne: U+FF88 => U+306D
  181. ノ の // no: U+FF89 => U+306E
  182. ハ は // ha: U+FF8A => U+306F
  183. ヒ ひ // hi: U+FF8B => U+3072
  184. フ ふ // fu: U+FF8C => U+3075
  185. ヘ へ // he: U+FF8D => U+3078
  186. ホ ほ // ho: U+FF8E => U+307B
  187. マ ま // ma: U+FF8F => U+307E
  188. ミ み // mi: U+FF90 => U+307F
  189. ム む // mu: U+FF91 => U+3080
  190. メ め // me: U+FF92 => U+3081
  191. モ も // mo: U+FF93 => U+3082
  192. ヤ や // ya: U+FF94 => U+3084
  193. ユ ゆ // yu: U+FF95 => U+3086
  194. ヨ よ // yo: U+FF96 => U+3088
  195. ラ ら // ra: U+FF97 => U+3089
  196. リ り // ri: U+FF98 => U+308A
  197. ル る // ru: U+FF99 => U+308B
  198. レ れ // re: U+FF9A => U+308C
  199. ロ ろ // ro: U+FF9B => U+308D
  200. ワ わ // wa: U+FF9C => U+308F
  201. ン ん // n: U+FF9D => U+3093
  202. ゙ ゙ // U+FF9E => U+3099
  203. ゚ ゚ // U+FF9F => U+309A
  204. // U+1B000 - U+1B001 Kana Supplement ---------------------
  205. 𛀀 え // e: U+1B000 => U+3048 (archaic)
  206. // Hiragana Groups -- By Starting Consonant
  207. // a i u e o *
  208. .L01 か き く け こ // k
  209. .L02 が ぎ ぐ げ ご // g
  210. .L03 さ す せ そ // s
  211. .L04 し // sh
  212. .L05 ざ ず ぜ ぞ づ // z
  213. .L06 じ ぢ // j
  214. .L07 た て と // t
  215. .L08 ち // ch
  216. .L09 つ // ts
  217. .L10 だ で ど // d
  218. .L11 な に ぬ ね の // n
  219. .L12 は ひ へ ほ // h
  220. .L13 ふ // f
  221. .L14 ば び ぶ べ ぼ // b
  222. .L15 ぱ ぴ ぷ ぺ ぽ // p
  223. .L16 ま み む め も // m
  224. .L17 や ゆ よ // y
  225. .L18 ら り る れ ろ // r
  226. .L19 わ ゐ ゑ を // w
  227. .L20 あ い う え お // none (vowels)
  228. .L21 ゃ ゅ ょ // y (small)
  229. // Hiragana Combining Characters
  230. .group ゃ
  231. ゃ a_" // ya
  232. .group ゅ
  233. ゅ M_Bo // yu
  234. .group ょ
  235. ょ o_o // yo
  236. // Hiragana
  237. .group あ
  238. あ a_" // a
  239. あ゙ va_" // va (Katakana)
  240. .group い
  241. い i // i
  242. い゙ vi // vi (Katakana)
  243. .group う
  244. う M_Bo // u
  245. ゔ vM_Bo // vu
  246. .group え
  247. え e_o // e
  248. え゙ ve_o // ve (Katakana)
  249. .group お
  250. お o_o // o
  251. お゙ vo_o // vo (Katakana)
  252. .group か
  253. か ka_" // ka
  254. が ga_" // ga
  255. .group き
  256. き ki // ki
  257. き (L21 k_j // ky([auo]
  258. ぎ gi // gi
  259. ぎ (L21 g_j // gy([auo]
  260. .group く
  261. く kM_Bo // ku
  262. ぐ gM_Bo // gu
  263. .group け
  264. け ke_o // ke
  265. げ ge_o // ge
  266. .group こ
  267. こ ko_o // ko
  268. ご go_o // go
  269. .group さ
  270. さ sa_" // sa
  271. ざ za_" // za
  272. .group し
  273. し s\\i // shi
  274. し (L21 s\\ // sh([auo]
  275. じ d_z\\i // ji
  276. じ (L21 d_z\\ // j([auo]
  277. .group す
  278. す sM_Bo // su
  279. ず zM_Bo // zu
  280. .group せ
  281. せ se_o // se
  282. ぜ ze_o // ze
  283. .group そ
  284. そ so_o // so
  285. ぞ zo_o // zo
  286. .group た
  287. た ta_" // ta
  288. だ da_" // da
  289. .group ち
  290. ち t_s\\i // chi
  291. ち (L21 t_s\\ // ch([auo]
  292. ぢ d_z\\i // ji (obsolete)
  293. ぢ (L21 d_z\\ // j([auo] (obsolete)
  294. .group つ
  295. つ t_sM_Bo // tsu
  296. づ zM_Bo // zu
  297. .group て
  298. て te_o // te
  299. で de_o // de
  300. .group と
  301. と to_o // to
  302. ど do_o // do
  303. .group な
  304. な na_" // na
  305. .group に
  306. に ni // ni
  307. に (L21 n_j // ny([auo]
  308. .group ぬ
  309. ぬ nM_Bo // nu
  310. .group ね
  311. ね ne_o // ne
  312. .group の
  313. の no_o // no
  314. .group は
  315. は ha_" // ha
  316. ば ba_" // ba
  317. ぱ pa_" // pa
  318. .group ひ
  319. ひ Ci // hi
  320. ひ (L21 C // hy([auo]
  321. び bi // bi
  322. び (L21 b_j // by([auo]
  323. ぴ pi // pi
  324. ぴ (L21 p_j // py([auo]
  325. .group ふ
  326. ふ p\\M_Bo // fu
  327. ぶ bM_Bo // bu
  328. ぷ pM_Bo // pu
  329. .group へ
  330. へ he_o // he
  331. べ be_o // be
  332. ぺ pe_o // pe
  333. .group ほ
  334. ほ ho_o // ho
  335. ぼ bo_o // bo
  336. ぽ po_o // po
  337. .group ま
  338. ま ma_" // ma
  339. .group み
  340. み mi // mi
  341. み (L21 m_j // my([auo]
  342. .group む
  343. む mM_Bo // mu
  344. .group め
  345. め me_o // me
  346. .group も
  347. も mo_o // mo
  348. .group や
  349. や ja_" // ya
  350. .group ゆ
  351. ゆ jM_Bo // yu
  352. .group 𛀁
  353. 𛀁 je_o // ye (archaic)
  354. .group よ
  355. よ jo_o // yo
  356. .group ら
  357. ら r`a_" // ra
  358. .group り
  359. り r`i // ri
  360. り (L21 r`_ja_" // ry([auo]
  361. .group る
  362. る rM_Bo // ru
  363. .group れ
  364. れ re_o // re
  365. .group ろ
  366. ろ ro_o // ro
  367. .group わ
  368. わ wa_" // wa
  369. .group ゐ
  370. ゐ i // wi (obsolete)
  371. .group ゑ
  372. ゑ we_o // we (obsolete)
  373. .group を
  374. を o_o // wo
  375. .group ん
  376. ん N\\ // n
  377. ん (L01 N // n (k
  378. ん (L02 N // n (g
  379. ん (L03 u~ // n (s
  380. い) ん (L03 i~ // i) n (s
  381. ん (L04 u~ // n (sh
  382. い) ん (L04 i~ // i) n (sh
  383. ん (L05 n // n (z
  384. ん (L06 n // n (j
  385. ん (L07 n // n (t
  386. ん (L08 n // n (ch
  387. ん (L09 n // n (ts
  388. ん (L10 n // n (d
  389. ん (L11 n // n (n
  390. ん (L12 u~ // n (h
  391. い) ん (L12 i~ // i) n (h
  392. ん (L13 u~ // n (f
  393. い) ん (L13 i~ // i) n (f
  394. ん (L14 m // n (b
  395. ん (L15 m // n (p
  396. ん (L16 m // n (m
  397. ん (L17 u~ // n (y
  398. い) ん (L17 i~ // i) n (y
  399. ん (L18 n // n (r
  400. ん (L19 u~ // n (w
  401. い) ん (L19 i~ // i) n (w
  402. ん (L20 u~ // n ([vowel]
  403. い) ん (L20 i~ // i) n ([vowel]