A dataset of informal Persian audio and text chunks, along with a fully open processing pipeline, suitable for ASR and TTS tasks. Created from crawled content on virgool.io.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

metadata.csv 1.1KB

file nametranscriptduration
4-9.mp3که دیگه نور علی نوره و باید روی جامعه مخاطب یکسان روی محصول یکسان7.4
101-208.mp3یا اینکه اینا ربطی اصلا ندارن به هم چیزیه که نمی‌دونم (6.56
2-270.mp3ادامه پرده تو مقاله بعدی بیشتر درباره کارم و احساسم به بازلیا8.36
72-219.mp3اونوقته که سختی‌هایی که تو ایران می‌کشم و3.08
64-9.mp3راهی یکی از فروشگاه‌های نوظهور محل شدم که‌گر مراد نیابم ،5.6
3-254.mp3اونا حواس شمارو وسط کارتون پرت نمی‌کنن .6.24
14-58.mp3همچنین ، می‌تونیم از اطلاعات بازار و صنعت استفاده کنیم5.84
111-42.mp3به شهر اومدن و شهروندان تبدیل به کارمندان شدن و یکدفعه در4.88
1-10.mp3نمی‌دونم چرا ولی اولین چیزی که به ذهنم رسید این بود :5.4
72-42.mp3بسیاری از مردمانش به هر ریسمانی که واسه در رفتن به دستشون5.16