Hackaton uchun tayyorlangan

Ko'p tilli ASR Pipeline

YouTube yoki audio fayllardan istalgan ASR modelini fine-tuning qilish yoki yangi nutq modeli yaratish uchun tayyor dataset yig'ish — yuklash, kesish, transkripsiya va eksport — barchasi bir joyda.

uz O'zbek kk Қазақ tk Türkmen ky Кыргыз fa فارسی fa-AF دری ps پښتو ur اردو tg Тоҷикӣ en English ru Русский

Pipeline qanday ishlaydi?

1. Yuklash

YouTube, audio yuklash yoki mahalliy papka

2. Konvert

MP3 ga o'tkazish va tayyorlash

3. Kesish

Sukunat bo'yicha segmentlarga bo'lish

4. VAD

Musiqa va shovqinni tozalash

5. Transkripsiya

Gemini AI bilan matn yaratish

Natija: audio_segments/*.wav + gemini_transcription/*.txt + metadata.json

Modullar va imkoniyatlar

Pipeline (Bosh sahifa)

Asosiy ish oqimi: YouTube havola yoki audio yuklang, til va mavzuni tanlang, Gemini bilan transkripsiya qiling.

  • • 11 til qo'llab-quvvatlanadi
  • • Xarajat taxmini (Gemini API)
  • • Real vaqtda 5 bosqichli kuzatuv

Dataset Explorer

Yaratilgan datasetlarni ko'ring, tinglang va statistikani tahlil qiling.

  • • Fayl brauzeri
  • • Audio pleer + transkript ko'rish
  • • Qayta transkripsiya qilish

Model import (bulut)

Bulut repozitoriy datasetlarini ko'rib chiqish, qabul/rad etish va mahalliy saqlash.

  • • Dataset preview va audio namuna
  • • Craft → asr-ur konvertatsiya
  • • Bulutga yuklash

Dataset birlashtirish

Turli manbalardan WAV datasetlarni bitta asr-tg/ ga birlashtirish.

  • • Hisoblash mashinasi + bulut manbalar
  • • Metadata validatsiya
  • • Bulut eksport integratsiyasi

FLAC birlashtirish

Katta hajmli FLAC formatdagi train/eval datasetlarni birlashtirish.

  • • Train/test bo'linishi
  • • Master dataset ro'yxati

Birlashtirilgan datasetlar

Birlashtirilgan datasetlarni jadval va fayl brauzeri orqali ko'rish.

  • • Metadata jadvali
  • • Audio playback

Tez boshlash (5 daqiqa)

1

Gemini API kalitini oling

Google AI Studio dan bepul API kalit yarating va Pipeline sahifasidagi "Gemini API kalitlari" bo'limiga kiriting.

2

Til va manbani tanlang

O'zbek tili (uz) sukut bo'yicha tanlangan. YouTube havola yoki .mp3 fayl yuklang.

3

Pipeline ni ishga tushiring

"Start Pipeline" tugmasini bosing va 5 bosqichli jarayonni kuzating. Transkripsiya tugagach, natijani bulut saqlash yoki hisoblash mashinasiga yozib oling.

4

Natijani ko'ring

Dataset Explorer da segmentlarni tinglang, transkriptlarni tekshiring va kerak bo'lsa qayta transkripsiya qiling.

CLI bosqichlari (qo'shimcha)

Bosqich Papka Vazifa
00_craft_dataset/Dataset yaratish (web UI ham shu yerda)
11_filtering/WER/CER baholash, sifat filtri
22_data_prep/Korpus birlashtirish, normalizatsiya, train/eval split
33_train/ASR model fine-tuning (Whisper va boshqalar)
44_bot/Telegram bot demo (fine-tuned model)

Arxitektura

Saqlash: umumiy «Bulut saqlash» yoki «Hisoblash mashinasi» — brend faqat ikonka orqali ko'rsatiladi.

Umumiy arxitektura

Web pipeline — 6 bosqich (algoritm)

Manba: pipeline-diagram.md