Multilingual ASR Platform
YouTube va audiodan istalgan ASR modelini fine-tuning qilish yoki yangi model yaratish uchun dataset tayyorlang, ko'ring, birlashtiring va eksport qiling.
Platforma imkoniyatlari, tez boshlash va arxitektura haqida to'liq qo'llanma
Har qanday nutq modelini (Whisper, Wav2Vec2 va boshqalar) o'qitish uchun audio–matn juftliklarini yarating.
Ishga tushirish →Yaratilgan datasetlarni ko'ring, audio tinglang, statistikani tahlil qiling va qayta transkripsiya qiling.
Ochish →HF datasetlarini preview qiling, qabul/rad eting, mahalliy saqlang yoki Hub ga yuklang.
Import →Turli manbalardan FLAC train datasetlarni bitta master korpusga birlashtiring, validatsiya qiling va HF ga yuklang.
Birlashtirish →Modellarning xususiyatlari bo'yicha training uchun mos datasetni tanlash va modellarni solishtirish.
Benchmark →Birlashtirilgan datasetlarni metadata jadvali va fayl brauzeri orqali ko'rib chiqing va tinglang.
Ko'rish →Pipeline bosqichlari, ma'lumot oqimi va modullar haqida qisqa yo'riqnoma.
O'qish →Multilingual ASR Pipeline · O'zbek, Qozoq, Fors, Rus va 7 ta til qo'llab-quvvatlanadi