YouTube yoki audio fayllardan istalgan ASR modelini fine-tuning qilish yoki yangi nutq modeli yaratish uchun tayyor dataset yig'ish — yuklash, kesish, transkripsiya va eksport — barchasi bir joyda.
YouTube, audio yuklash yoki mahalliy papka
MP3 ga o'tkazish va tayyorlash
Sukunat bo'yicha segmentlarga bo'lish
Musiqa va shovqinni tozalash
Gemini AI bilan matn yaratish
Natija:
audio_segments/*.wav + gemini_transcription/*.txt + metadata.json
Asosiy ish oqimi: YouTube havola yoki audio yuklang, til va mavzuni tanlang, Gemini bilan transkripsiya qiling.
Yaratilgan datasetlarni ko'ring, tinglang va statistikani tahlil qiling.
Bulut repozitoriy datasetlarini ko'rib chiqish, qabul/rad etish va mahalliy saqlash.
Turli manbalardan WAV datasetlarni bitta asr-tg/ ga birlashtirish.
Katta hajmli FLAC formatdagi train/eval datasetlarni birlashtirish.
Birlashtirilgan datasetlarni jadval va fayl brauzeri orqali ko'rish.
Google AI Studio dan bepul API kalit yarating va Pipeline sahifasidagi "Gemini API kalitlari" bo'limiga kiriting.
O'zbek tili (uz) sukut bo'yicha tanlangan.
YouTube havola yoki .mp3 fayl yuklang.
"Start Pipeline" tugmasini bosing va 5 bosqichli jarayonni kuzating. Transkripsiya tugagach, natijani bulut saqlash yoki hisoblash mashinasiga yozib oling.
Dataset Explorer da segmentlarni tinglang, transkriptlarni tekshiring va kerak bo'lsa qayta transkripsiya qiling.
| Bosqich | Papka | Vazifa |
|---|---|---|
| 0 | 0_craft_dataset/ | Dataset yaratish (web UI ham shu yerda) |
| 1 | 1_filtering/ | WER/CER baholash, sifat filtri |
| 2 | 2_data_prep/ | Korpus birlashtirish, normalizatsiya, train/eval split |
| 3 | 3_train/ | ASR model fine-tuning (Whisper va boshqalar) |
| 4 | 4_bot/ | Telegram bot demo (fine-tuned model) |
Saqlash: umumiy «Bulut saqlash» yoki «Hisoblash mashinasi» — brend faqat ikonka orqali ko'rsatiladi.
Manba: pipeline-diagram.md