跑實驗的幾個階段 (#2) · Issues · JackingChen / kaldi_jackchen

跑實驗的幾個階段

整理好各個資料庫的feature 統一存放在nas。檢查是否每個資料庫都有存放好feature、alignment
跑transfer learning 實驗、feature combination實驗、nnet3 model實驗，在lang_mapped上跑一次

experiments	lang	data combination	weight tranfer	nnet3
exp_DAAIKidFullDeceptCSRCformosa_all + ADOS_train_happynvalid	lang_mapped	52.93	50.81	66.49
exps_langorigin/exp_DAAIKidFullDeceptCSRCformosa_all + ADOS_train_happynvalid	lang

儲存好model後算出個別的phone boundary agreements
用個別model算出GOP

===================================================================

幾個大方向：

目前找不到用phonological feature 在醫療場域的paper，問政霖有沒有更好的方法 a. 可以朝著Bone 的atypical prosody的線去查 b. 可以朝著Disvoice的phonological feature的線去查

分析一下新/舊注音系統的PER，這個分析開發出來會有助於往後journal的分析

跑一下別的架構看看在ADOS上的準確率，CAT espnet的話確認兩件事： 1. 可以生alignment 2.可以compute per frame的output

幾個小嘗試：

試試transfer add 的方式

transfer weight on 現在已有的中文Kaldi model來測試 (thchs30)

之前到gmm那一段還是有點差，試著用NN alignment來訓練新的NN model

lang_mapped 系統CER都極高，改回用原本的language system跑跑看，試試以下有沒有improvement

transfer weights
transfer weight on 現在已有的中文Kaldi model來測試 (thchs30)

Edited Apr 29, 2021 by JackingChen