Dataset birlashtirish (FLAC train)

asr-tg/train/metadata.jsonl + corpus papkalari (podcasts/00001.flac, 16 kHz mono).

← Pipeline WAV birlashtirish Birlashtirilgan Datasetlar Explorer
Tayyor Tanlov: 0

Jarayon shu yerda ko‘rinadi.

web_data /

Ko‘rilayotgan papka: manba dataset yoki asr-tg_* / train/. «Davom etish» rejimida chap brauzerdan ham asr-tg tanlash mumkin.

HF: asr-tg_* papkasida «HF ga yuklash». Token Write bo‘lishi kerak (HF import). Incremental — faqat sinxronlanmagan audio + metadata.

Tanlangan datasetlar

Asosiy dataset

Sozlamalar

Bo‘sh qoldirsangiz: birlashtirilgan_data_flac_20260519_143022/asr-tg_20260519_143022/train/ (FLAC, 16 kHz mono).

Corpus = mavzu (category). Fayl: 20260519_143022_00001.flac (sana+vaqt+raqam). ≤10 000 / papka; 9900 da train_2/.
Tayyor.