A dataset of informal Persian audio and text chunks, along with a fully open processing pipeline, suitable for ASR and TTS tasks. Created from crawled content on virgool.io.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

metadata.csv 1.1KB

1234567891011
  1. file name,transcript,duration
  2. 4-9.mp3,که دیگه نور علی نوره و باید روی جامعه مخاطب یکسان روی محصول یکسان,7.4
  3. 101-208.mp3,یا اینکه اینا ربطی اصلا ندارن به هم چیزیه که نمی‌دونم (,6.56
  4. 2-270.mp3,ادامه پرده تو مقاله بعدی بیشتر درباره کارم و احساسم به بازلیا,8.36
  5. 72-219.mp3,اونوقته که سختی‌هایی که تو ایران می‌کشم و,3.08
  6. 64-9.mp3,راهی یکی از فروشگاه‌های نوظهور محل شدم که‌گر مراد نیابم ،,5.6
  7. 3-254.mp3,اونا حواس شمارو وسط کارتون پرت نمی‌کنن .,6.24
  8. 14-58.mp3,همچنین ، می‌تونیم از اطلاعات بازار و صنعت استفاده کنیم,5.84
  9. 111-42.mp3,به شهر اومدن و شهروندان تبدیل به کارمندان شدن و یکدفعه در,4.88
  10. 1-10.mp3,نمی‌دونم چرا ولی اولین چیزی که به ذهنم رسید این بود :,5.4
  11. 72-42.mp3,بسیاری از مردمانش به هر ریسمانی که واسه در رفتن به دستشون,5.16