Une courte histoire de «Speechmapping» chez Audioscan

Speechmap® est la marque déposée d’un système d’ajustement d’appareils auditifs introduit par Audioscan en 1992. Il a été élaboré à partir des travaux de Margo Skinner et de David Pascoe à CID qui développèrent une méthode d’appoint pour amplifier le signal d’un échantillonnage calibré dans le centre approximatif de la région auditive. Speechmap® était la première application à être jamais conçue dans un système commercial ; il utilisait les signaux de la parole simulée pour créer une carte de la région de la parole amplifiée à même la zone auditive résiduelle d’où le nom «Speechmap». Les études de Stelmachowicz et al (1996) et Scollie et al (2002) ont fourni la preuve que les signaux de parole simulée utilisés dans Speechmap
étaient de bons facteurs qui annonçaient la production d’un échantillonnage de la parole pour les appareils auditifs à compression de l’époque. En 2001, le Verifit® d’Audioscan introduisit les signaux de l’échantillonnage de la parole calibré dans Speechmap ; il était et est encore le premier à utiliser de tels signaux. Audioscan fut le principal innovateur à utiliser la parole et les signaux de la parole simulée pour l’ajustement d’appareils auditifs ; il possède une compréhension incomparable dans la science qui prévaut ces méthodes. Cette expertise unique fait de Speechmap un système différent de tous les autres qui ont une appellation semblable.

Le système d’ajustement (d’appoint) Speechmap d’Audioscan est unique en son genre

Voici les quatre principaux concepts qui rendent Speechmap si unique :

1) Il fournit une variété de signaux de la parole simulée numérisés tout en permettant aussi l’utilisation de l’échantillonnage de la parole. Cela compte car le matériel de la parole enregistré permet de réutiliser ses mesures.

2) Les signaux de la parole sont contrôlés en temps réel afin de produire un spectre calibré et contrôlé à l’intérieur du champs sonore comme dans le test de la chambre.

Pourquoi est-ce important? Les méthodes d’ajustement telles que DSL et NALNL1ainsi que l’index de la parole intelligible assument tous un spectre spécifique selon les divers efforts vocaux. Si ces spectres spécifiques ne sont pas transmis aux appareils auditifs avec leurs objectifs d’ajustement ou en calculant le SII, cela produira des erreurs importantes.

3) Tous les passages de discours amplifiés, qu’ils soient enregistrés ou en temps réel, sont analysés sur une bande de 1/3 d’octave pendant plusieurs secondes afin de permettre le spectre de discours moyen à long terme (LTASS).

Pourquoi est-ce important? Les objectifs d’ajustement pour le DSL et le NAL-NL1, ainsi que le calcul du SII assume tous un LTASS obtenu avec des bandes de parole pendant plusieurs secondes. Lorsque les signaux à large bande sont analysés sur des bandes étroites afin de produire le spectre, le SPL de chaque bande dépend de la largeur de la bande.

Par exemple, le spectre d’un signal de discours va indiquer 10 dB plus bas sur un système qui utilise une bande d’analyse de 1/24 d’octave plutôt que 1/3 d’octave analysé dans Speechmap. Lorsque des signaux oscillants sont analysés, le temps moyen pour programmer le SPL sur chaque bande influence le résultat. Un LTASS précis peut seulement être obtenu en utilisant un temps moyen de 10 secondes ou plus. Avec les objectifs ou en calculant le SII utilisant les courbes obtenues avec des bandes autres que celle de 1/3 d’octave ou en analysant des temps de moins de 10 secondes produira des erreurs dans le SII et dans l’ajustement.

4) La région amplifiée du discours (speech banana) est calculée à partir des propriétés statistiques du discours mesurée utilisant une période de temps intégrée semblable à celui de l’oreille.

Pourquoi est-ce Important?

L’étendue entre les bas et les hauts du discours (région du discours) est de souvent décrit comme étant le prolongement à partir de 18 dB au-dessous du LTASS jusqu’à 12 dB au-dessus. Ceci dépend de la personne qui parle et du fonctionnement du système de compression dans l’appareil auditif. Plutôt que seulement décrire la région de discours comme une intervalle du LTASS d’environ 30 dB, Speechmap indique le haut de la région du discours lorsque le SPL a dépassé 1% du temps et 70% du temps, dans chaque 1/3 d’octave. L’étendue changera selon les personnes qui parlent et sera réduite par les compresseurs de syllabes, indiquant clairement les effets des ajustements aux paramètres de compression.

La région du discours dépend également de la façon dont elle est mesurée. En utilisant de petites intervalles, cela donnera des sommets plus hauts et des creux plus bas et une région du discours plus large. Par exemple, Byrne et al (1994) ont rapporté des sommets instantanés de 25 à 30 dB au-dessus du LTASS avec la parole nonamplifiée. Toutefois, l’oreille est de 10 à 20 dB moins sensibles aux sons qui durent seulement quelques ms qu’elle ne l’est aux sons qui durent 100 ms ou plus, tels que ceux utilisés pour mesurer le seuil et le UCL.

Le spectre pour les sommets de la parole, mesuré entre 1 et 10 ms, ... de 10 à 20 dB au-dessus du seuil (ou UCL) sans que le discours soit audible (ou inconfortable).

Speechmap utilise la mesure d’intervalles de 128 ms lorsqu’il développe la région de la parole. Cela veut dire que la région de la parole Speechmap avec les sommets près du seuil seront détectables, celle qui est entièrement au-delà du seuil sera complètement audible et celle qui se prolonge au-dessus du UCL sera inconfortable. Speechmap d’Audioscan est solidement consolidé avec 65 ans de science de la parole depuis Dunn & White (1940) jusqu’à Byrne et al (1994). Lorsque vous voulez savoir ce qui arrive vraiment lors d’un signal de la parole, les détails sont importants.

Voyez quelques exemples :

Speechmap Fitting System With Syllabic Compressions

Exemple 1 : Les compressions syllabiques réduisent la largeur de la région de la parole.

 

Speechmap Fitting System Threshold

Exemple 2 : Les sommets du discours près du seuil, le SII = 4. La parole est détectable mais non comprise.

 

Speechmap Fitting System Threshold

Exemple 3 : Le LTASS près du seuil donne un SII de 30 à 40, indiquant une réussite de 60 à 80% dans le test CST (théorique pour les normaux).

 

Speechmap Fitting System

Exemple 4 : Le région de la parole complètement au-dessus du seuil donnera un SII au-dessus de 70 avec un résultat de 100% dans le CST. En fournissant un gain additionnel pour la parole à ce niveau (65 dB SPL), cela n’augmentera pas la compréhension pour cette sorte de matériel de la parole.