跑實驗的幾個階段
- 整理好各個資料庫的feature 統一存放在nas。 檢查是否每個資料庫都有存放好feature、alignment
- 跑transfer learning 實驗、feature combination實驗、nnet3 model實驗,在lang_mapped上跑一次
| experiments | lang | data combination | weight tranfer | nnet3 |
|---|---|---|---|---|
| exp_DAAIKidFullDeceptCSRCformosa_all + ADOS_train_happynvalid | lang_mapped | 52.93 | 50.81 | 66.49 |
| exps_langorigin/exp_DAAIKidFullDeceptCSRCformosa_all + ADOS_train_happynvalid | lang |
- 儲存好model後算出個別的phone boundary agreements
- 用個別model算出GOP
===================================================================
幾個大方向:
- 目前找不到用phonological feature 在醫療場域的paper,問政霖有沒有更好的方法 a. 可以朝著Bone 的atypical prosody的線去查 b. 可以朝著Disvoice的phonological feature的線去查
- 分析一下新/舊注音系統的PER, 這個分析開發出來會有助於往後journal的分析
- 跑一下別的架構看看在ADOS上的準確率,CAT espnet的話確認兩件事: 1. 可以生alignment 2.可以compute per frame的output
幾個小嘗試:
- 試試transfer add 的方式
- transfer weight on 現在已有的中文Kaldi model來測試 (thchs30)
- 之前到gmm那一段還是有點差,試著用NN alignment來訓練新的NN model
lang_mapped 系統CER都極高,改回用原本的language system跑跑看,試試以下有沒有improvement
- transfer weights
- transfer weight on 現在已有的中文Kaldi model來測試 (thchs30)