How to create diphone sets for mbrola.
0. You need to create a diphone set:
1. Consider all the characters your language uses, according to
2. The mbrola diphone set must contain phonemes your language in
If your language has n SAMPA phonemes, you will have n*n + 2*n
3. Get words in your language, that contain these diphones, and
4. Download dstudio from http://www.fluency.nl/dstudio/dstudio.htm
5. Setup the input file for dstudio, that contains all diphones in
6. Check the example in the diphone studio very throughoutly. Create own example words (ctrl-s) and check the word (ctrl-t). Important is, that the diphones are marked by the half ot them. Also the altitude of the vocals must be tha same. For example the word "ama" is composed by the phonemes _a am ma and a_. The a-s must have the same altitude. Otherwise if in the spoken text ama is spoken, you would hear a click where the two a's meet (_a am or ma a_) each other, and even the previous or following consonant can get falsified.
7. Speak into microphone 10-20 words and record them in diphone
8. Copy the wav file onto all wav files, that belong to that group.
9. Repeat step 7..8 about 3-4 times.
10. Using diphone studio, isolate the diphones in the recorded
11. Test the spoken diphones throughoutly. The individual diphones can be re-spoken and retested. 12. Repeat step 7...11, until all diphones are on correct wav files. 13. Export the resulting diphones.
14. Check the file export.dat. If any of the diphones is longer
15. Send the zipped file to the mbrola team to mbrola_AT_tcts_DOT_fpms_DOT_ac_DOT_be Difonémasorozat előállítása az mbrola nyelvszintetizálóhoz.A http://tcts.fpms.ac.be/synthesis/mbrola/mbrjoin.html dokumentáció alapján készült, saját tapasztalatok hozzáadásával, "ami a dokumentációból kimaradt".
0. Mi szükséges difonémasorozat előállításához:
1. A fonémákat a Sampa karaktersorozat alapján kell előállítani, http://phon.ucl.ac.uk/home/sampa, például a magyar nyelv 38 hangból áll, 14 magánhangzóból és 24 mássalhangzóból.
2. Az mbrola difonéma sorozatnak minden hangzót tartalmaznia kell, és minden fonémát szünettel (_) mindkét oldalán.
Ha a nyelvben n fonéma van, ebből n*n + 2*n difonémát kell bemondani. 3. Gyűjts olyan szavakat a nyelvben, melyek ezeket a difonémákat tartalmazzák és gyűjtsd össze őket (magyarban itt a példa: pelda2.dat). 4. Hozd le a difonéma stúdiót innen: http://www.fluency.nl/dstudio/dstudio.htm
5. Állítsd össze a dstudióhoz szükséges állományt az adott nyelvhez, mely a difonémákat tartalmazza. A magyarra itt pelda2.dat. a példa. Magánhangzók esetén elkerülendő a z, zs, j az adott magánhangzó előtt, mert ezek összeötvöződnek a magánhangzóval. Például a tüzesen szó nem jó az E S difonéma párhoz, de pl. a hetesen szó jó.
fájl1:
A fájlokat éppen így szét is lehet szedni. Kezelésük egyszerűbb, ha rövidebbek, tesztelésük viszont egyszerűbb, ha lehetőleg teljesek. Fontos: Az egyes mezők között tabulátor jel van, nem szóköz! Az esetleges szóközt a difonéma studió hibának tekinti. 6. Nagyon alaposan foglalkozz a difonéma studió holland nyelvű példájával.Vizsgáld meg a kijelölt difonémákat alaposan, kreálj saját szavakat (ctrl-s) és teszteld a szót (ctrl-t)-vel. Fontos megérteni, hogy a hangzó fele tartozik egy difonémába. A magánhangzó magasságának egyformának kell lennie, különben kattanásokat lehet hallani, ahogy a két különböző magasságú magánhangzó találkozik. A nagyobb hangerő automatikusan magasabbá teszi a kimondott hangot, emiatt ügyelni kell arra, hogy a hangerő lehetőleg monoton és azonos legyen minden azonos magánhangzó határán. Pl. az "ama" szó az _a am ma és a_ fonémából áll. A két a-nak ugyanolyan magasnak kell lenni, különben pl. ama kimondásakor kattanás lenne, ha az _a és am a-ja között van magasságkülönbség, az első szótagban, ha a ma és a_ a-ja, akkor a másodikban, és esetleg a szomszédos mássalhangzó emiatt szintén hamisan csengene. 7. Mondj a mikrofonba 10-20 szót és vedd föl ezt a difononéma stúdióval. (Igyál közben vizet időnként).
8. Másold az előállt wav állományt azokra a wav állományokra, melyek szavai szintén benne vannak a most bemondott fájlban. Ha például a föablak, kőablak és táablak szavakat mondtad rá az E001.WAV fálra, E001.WAV-ot rá kell másolnod E002.WAV-ra á E003.WAV-ra, ha a fájl így néz ki:
9. Ismételd meg a 7..8 lépést kb. 3-4-szer. 10. A difonéma stúdió segítségével jelöld ki a bemondott difonémákat. A baloldalt, a két hang határát és a jobboldalt kell kijelölni. 11. Tesztelj le alaposan minden difonémát. (ctrl-d) segítségével és az egér segítségével minden rész külön tesztelhető. 12. Ismételd a 7...11 lépéseket, amíg minden difonéma helyes wav fájlhoz tartozik. 13. Teszteld a difonémákat szavakkal (ctrl-s, ctrl-t). 14. Exportáld a difonéma studióval a difonémát. 15. Vizsgáld meg az export.dat állományt. Ha valamelyik difonéma hosszabb mit 9000, csökkentsd le a hosszát 9000 alá (11..13 lépés) 16. Ellenőrizd az export/export.dat fájlt hiányokra. Sajnos dstudio bizonyos esetekben (pl. hiányzó határkijelölés) hajlamos rá, hogy kihagyjon difonémákat az exportból, és erről nem informál. Ha a sorok száma megegyezik a használt *.dat fájl sorainak számával, akkor valószínűleg minden rendben van, egyébként futtasd a hiany.awk segédprogramot, hogy megtaláld, mi hiányzik. 17. Küldd a zippelt vagy tar-gzippelt állományt a mbrola csoportnak mbrola_KUKAC_tcts_PONT_fpms_PONT_ac_PONT_be címre.
|