Zajmérő – Bevezetés a zajcsökkentésbe
Miután megértette a zajelnyomás (a hangszóró környezeti zajának elnyomása, hogy a távoli hallgatók tisztán hallják) és az aktív zajcsökkentés (a hallgató saját környezeti zajának kiegyenlítése) közötti alapvető különbségeket, koncentráljunk a zajelnyomás elérésére.
Az egyik módszer több mikrofon használata az adatok elnyomására. Az adatok több helyről történő gyűjtése azt eredményezi, hogy az eszközök hasonló (de mégis megkülönböztetett) jeleket kapnak. A beszélő populáció közelében lévő mikrofon által vett hangjel lényegesen erősebb, mint a másodlagos mikrofoné. Két mikrofon nem hangos háttérhangot fog kapni hasonló jelerősséggel. Vonja le az erős hangmikrofon és a másodlagos mikrofon által gyűjtött hanginformációkat, és a fennmaradó többség a hanginformáció. Minél nagyobb a távolság a mikrofonok között, annál nagyobb a jelkülönbség a közelebbi és távolabbi mikrofonok között, így könnyebben használható ez az egyszerű algoritmus a zaj elnyomására. Ha azonban nem beszél, vagy ha arra számít, hogy a hangadatok idővel megváltoznak (például amikor sétál vagy fut, és a telefon folyamatosan remeg), ennek a módszernek a hatékonysága csökken. A többmikrofonos zajelnyomás minden bizonnyal megbízható, de a további hardvernek és feldolgozásnak vannak hátrányai.
Szóval, mi van, ha csak egy mikrofon lenne? Ha nem használnak további hangforrásokat az ellenőrzéshez/összehasonlításhoz, az egyetlen mikrofonos megoldás a vett zajjellemzők megértésére és kiszűrésére támaszkodik. Ez összefügg a steady-state és a nem stacionárius zaj korábban említett definícióival. Az állandósult állapotú zaj hatékonyan kiszűrhető a DSP-algoritmusokkal, míg a nem stacionárius zaj kihívást jelent, a mély neurális hálózatok (DNN-ek) segíthetik a probléma megoldását.
Ehhez a módszerhez adatkészletre van szükség a hálózat betanításához. Ez az adatkészlet különböző (stacionárius és nem álló) zajokból és tiszta beszédből áll, szintetizált zajos beszédmintát hozva létre. Táplálja be az adatkészletet bemenetként a DNN-be, és adja ki tiszta hanggal. Ez létrehoz egy neurális hálózati modellt, amely megszünteti a zajt, és csak tiszta beszédet ad ki.
Még a képzett DNN-ek esetében is van néhány kihívás és mutató, amelyet figyelembe kell venni. Ha valós időben szeretne futni alacsony késleltetéssel, akkor erős feldolgozási teljesítményre vagy kisebb DNN-re van szüksége. Minél több paraméter van a DNN-ben, annál lassabb a futási sebessége. A hang mintavételezési gyakorisága hasonló hatással van a hangelnyomásra. A magasabb mintavételezési gyakoriság azt jelenti, hogy a DNN-nek több paramétert kell kezelnie, viszont jobb minőségű kimenetet fog elérni. A keskeny sávú hangkommunikáció ideális választás a valós idejű zajelnyomáshoz.
